广告业务分析之ODS层建表和数据加载
事件日志采集
-
1、启动Flume Agent(适当的修改参数,128M滚动一次)
1
2# 启动flume
flume-ng agent --conf /opt/lagou/servers/flume-1.9.0/conf --conf-file /opt/lagou/servers/flume-1.9.0/conf/flume-log2hdfs3.conf -name a1 -Dflume.root.logger=INFO,console -
2、生成数据(文件大小约640M,100W条事件日志)
1
2
3cd /data/lagoudw/jars
java -cp data-generator-1.1-SNAPSHOT-jar-with-dependencies.jar com.lagou.ecommerce.AppEvent 1000000 2020-08-02 > /data/lagoudw/logs/event/events0802.log -
3、数据采集完成后,检查HDFS结果
1
hdfs dfs -ls /user/data/logs/event
ODS层建表和数据加载
1 | drop table if exists ods.ods_log_event; |
创建/data/lagoudw/script/advertisement/ods_load_event_log.sh
1 | cd /data/lagoudw/script/advertisement |
hive数据加载
1 | sh ods_load_event_log.sh 2020-07-20 |
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 WeiJia_Rao!