agent1

大数据离线处理数据项目（一）网站日志文件数据采集日志拆分数据采集到HDFS并进行预处理2021-11-30 20:02:44

简介：这篇写的是大数据离线处理数据项目的第一个流程：数据采集主要内容： 1）利用flume采集网站日志文件数据到access.log 2）编写shell脚本：把采集到的日志数据文件拆分（否则access.log文件太大）、重命名为access_年月日时分.log。此脚本执行周期为一分钟 3）把采集到并且拆分、重命名
Flume+Kafka+Storm实战：二、Flume与Kafka整合2021-06-11 10:02:18

文章目录 0x00 文章内容 0x01 Flume准备 1. 编写Flume配置文件 0x02 Kafka准备 1. 创建topic（如已操作过可跳过） 0x03 校验结果 1. 启动Flume 2. 启动Kafka消费者 3. 测试结果 0xFF 总结 0x00 文章内容 Flume准备 Kafka准备校验结果 PS：请自行准备好Flume、Kafka的环境。由于
Flume 高可用配置案例+load balance负载均衡+ 案例:日志的采集及汇总2021-06-05 10:54:05

高可用配置案例（一）、failover故障转移在完成单点的Flume NG搭建后，下面我们搭建一个高可用的Flume NG集群，架构图如下所示：（1）节点分配 Flume的Agent和Collector分布如下表所示：名称 Ip地址 Host 角色 Agent1 192.168.137.188 hadoop-001
Kafka 与flume的整合2021-06-04 18:55:18

flume与kafka的整合第一步：配置flume的conf文件 TaildirSource-kafka.conf agent1.sources = source1 agent1.sinks = sink1agent1.channels = channel1 agent1.sources.source1.type = TAILDIRagent1.sources.source1.positionFile = /home/hadoop/bigdatasoftware/data
flume监听日志文件2021-03-21 00:01:29

控制台监听打印flume-exec.log文件写入数据 # Define a memory channel called ch1 on agent1 agent1.channels.ch1.type = memory agent1.channels.ch1.capacity = 1000 agent1.channels.ch1.transactionCapacity = 100 # Define an Avro source called avro-source1 on a
flume日志收集2020-07-10 18:35:07

1、flume日志收集架构如下 2、解压安装包，修改文件夹名称，配置环境变量 tar -zxvf apache-flume-1.6.0-bin.tar.gz export FLUME_HOME=/soft/flume export PATH=$PATH:$FLUME_HOME/bin 修改conf下的flume-env.sh，在里面配置JAVA_HOME 3、从netcat收集日志 1、先在flume
Flume2-高可用+拦截器2020-04-05 17:02:50

13-flume高可用-failover-模型分析(搭建一个Flume集群,当一个Flume挂掉之后,其他flume迅速补上) ============================================================================================================================================================
Flume理论研究与实验2019-12-17 17:53:45

一、理论研究　1.1 总览　　　　Flume是一个分布式的可靠的日志收集系统，主要是用于从各种数据源收集、聚合并移动大批量的日志数据到存储系统；它本身具有许多故障转移和恢复机制，具有强大的容错能力；它使用下面这样一个简单的可扩展的数据流模型来进行在线分析。　1.2 核心概
快速搭建Jenkins集群2019-11-16 23:51:27

关于Jenkins集群在Jenkins上同时执行多个任务时，单机性能可能达到瓶颈，使用Jenkins集群可以有效的解决此问题，让多台机器同时处理这些任务可以将压力分散，对单机版Jenkins的单点故障的隐患也有分散作用，今天就来实战快速搭建Jenkins集群，Jenkins版本是2.190.2；如何做到快速搭建集群通
Flume学习笔记2019-09-18 20:35:23

为什么用Flume：可靠性： Flume是Cloudera公司的一款高性能、高可用的分布式日志收集系统。 Flume的核心是把数据从数据源收集过来再送到目的地。为了保证输送一定成功，在送到目的地之前，会先缓存数据，待数据真正到达目的地后，再删除缓存的数据。 Flume传输数据的基本单位是even
Log4j采集日志分析(模拟)2019-08-11 17:00:55

原文链接：https://class.imooc.com test下新建directory然后idea的右上角项目结构使其变成Test，新建LogGenerator import org.apache.log4j.Logger; public class LoggerGenerator { private static Logger logger = Logger.getLogger(LoggerGenera
Flume日志采集框架的使用2019-06-30 17:53:12

文章作者：foochane 原文链接：https://foochane.cn/article/2019062701.html Flume日志采集框架安装和部署 Flume运行机制采集静态文件到hdfs 采集动态日志文件到hdfs 两个agent级联 Flume日志采集框架在一个完整的离线大数据处理系统中，除了hdfs+mapreduce+hive组成分析系统的
puppet 安装配置与简单实验2019-06-14 13:00:14

目录 puppet自动化配置课程目标一、puppet的介绍二、puppet的安装配置三、puppet的C/S模式工作原理四、puppet的基本语法和资源定义五、应用案例 puppet自动化配置课程目标理解 puppet的概念和应用场景 puppet基本语法和资源的定义方法掌握 puppet服务端和客户
Flume+Sqoop+Azkaban笔记2019-04-09 09:37:37

大纲（辅助系统）离线辅助系统数据接入 Flume介绍 Flume组件 Flume实战案例任务调度调度器基础市面上调度工具 Oozie的使用 Oozie的流程定义详解数据导出 sqoop基础知识 sqoop实战及原理 Sqoop数据导入实战 Sqoop数据导

ICode9

大数据离线处理数据项目（一） 网站日志文件数据采集 日志拆分 数据采集到HDFS并进行预处理2021-11-30 20:02:44

Flume+Kafka+Storm实战：二、Flume与Kafka整合2021-06-11 10:02:18

Flume 高可用配置案例+load balance负载均衡+ 案例:日志的采集及汇总2021-06-05 10:54:05

Kafka 与flume的整合2021-06-04 18:55:18

flume监听日志文件2021-03-21 00:01:29

flume日志收集2020-07-10 18:35:07

Flume2-高可用+拦截器2020-04-05 17:02:50

Flume理论研究与实验2019-12-17 17:53:45

快速搭建Jenkins集群2019-11-16 23:51:27

Flume学习笔记2019-09-18 20:35:23

Log4j采集日志分析(模拟)2019-08-11 17:00:55

Flume日志采集框架的使用2019-06-30 17:53:12

puppet 安装配置与简单实验2019-06-14 13:00:14

Flume+Sqoop+Azkaban笔记2019-04-09 09:37:37

大数据离线处理数据项目（一）网站日志文件数据采集日志拆分数据采集到HDFS并进行预处理2021-11-30 20:02:44