标签:channels 埋点 05 a1 sources 日志 接收 c1
文章目录
网站日志分析系统
1.数据收集:JS埋点
传统埋点方式的缺点:
直接嵌入业务系统,代码不好维护,影响业务系统性能。
JS埋点优点:
日志收集系统与业务系统相互独立,互不影响,不占用业务系统性能,能收集到更多更详细的用户信息。
2.日志数据的提交方式
3.在哪里发起Get请求?
跨域请求
img标签中src实现跨域访问,将该图片插入到真个页面最后,像素1,边框0,用户看不到。
4.系统架构设计
离线分析:js埋点——日志收集系统(log4j)——flume——HDFS——Hive
实时分析:js埋点——日志收集系统(log4j)——flume——Kafka——Flink
5. 运行jt-logserver
5.1 Idea中打开项目
Idea中open 课前资料\bigDataProject
File->settings->build->build tools->maven中修改maven配置文件位置。
5.2 查看tomcat插件配置
5.3 启动
打开maven窗口,选中tomcat7:run右键 run maven build
5.4 测试
5.5 关闭
点红色按钮关闭tomcat
5.6 访问网页产生日志
从localhost/a.html跳到b.html页面
直接访问localhost/b.html
6.指标说明
7.项目的整合
7.1修改jt-server中的log4j配置
log4j.rootLogger = info,stdout #注释掉此配置
#log4j.rootLogger = info,stdout,flume #打开此配置
7.2创建接收数据的flume的配置文件
设定source :avro
sink:hdfs
a1.sources = r1
a1.sinks = k1
a1.channels = c1
a1.sources.r1.type = avro
a1.sources.r1.bind = 0.0.0.0
a1.sources.r1.port = 22222
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = /flume/jtlog/
a1.sinks.k1.hdfs.fileType = DataStream
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
= 1000
a1.channels.c1.transactionCapacity = 100
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
标签:channels,埋点,05,a1,sources,日志,接收,c1 来源: https://blog.csdn.net/qq_43102730/article/details/122486736
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。