ICode9

精准搜索请尝试: 精确搜索
  • MapReduce、Spark、Storm、Flink 简单扫盲2021-10-02 21:01:55

    这四个项目能放在一起比较的背景应该是分布式计算的演进过程。 一、MapReduce开源分布式计算的第一个流行的框架是 Hadoop 项目中的 MapReduce 模块。它将所有计算抽象成 Map 和 Reduce 两个阶段,在计算时通过增加机器,并行的读取数据文件,进行 Map 或 Reduce 的操作,并将结果写到文件

  • 实时流处理框架之Storm的安装与部署2021-10-01 22:02:27

      参考视频教程:    **基于Storm构建实时热力分布项目实战  ** 教程目录 0x00 教程内容0x01 下载Storm * * * * 1. 下载Storm 2. 上传安装包到节点 0x02 安装与配置Storm * * * * 1. 解压Storm 2. 配置Storm 0x03 启动并校验Storm * * * * 1. 启动Storm 2.

  • 大数据学习路线图2021-09-15 11:33:31

    从今天开始,小懿就要开始给大家出一套从头开始学习大数据的教程了,这个教程全部都是以文章的形式开始推送,适合有两三年工作经验的开发工程师们来进行学习,在学习大数据之前,我们需要知道都需要学习哪些内容。 第一章节:基础需要 1.linux操作基础 linux系统简介与安装 linux常用命

  • 记一次stormOOM异常的产生与解决2021-09-10 17:02:51

    最近这段时间开始了一个新项目,项目使用rabbitMQ存储采集数据,通过storm对rabbitMQ中的数据进行实时计算,将结果存入到rabbitMQ的另一个队列中,再由另外一个storm服务将结果保存到elasticsearch中进行存储,以此实现大数据的实时计算存储。 在项目首次部署阶段,一切正常。在storm服务部署

  • 【笔记】虚拟机安装jstorm并运行demo2021-08-24 01:02:08

    本地虚拟机搭建zk环境,安装jstorm,并运行一个简单的jstorm demo。 步骤: 1.安装jdk,python,配置zookeeper。 2.配置jstorm,安装jstorm UI。 3.启动jstorm。   详细步骤: 1.安装jdk,配置zookeeper。 (1)安装jdk 启动zk需要java1.8,启动jstorm需要java1.7 先配置jdk1.8 (解压命令tar zxvf / t

  • 测试开发进阶:一文教你从0到1搞懂大数据测试!2021-07-09 13:02:54

    1.什么是大数据 大数据是一个大的数据集合,通过传统的计算技术无法进行处理。这些数据集的测试需要使用各种工具、技术和框架进行处理。大数据涉及数据创建、存储、检索、分析,而且它在数量、多样性、速度方法都很出色,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能

  • 测试开发:一文教你从 0 到 1 搞懂大数据测试!2021-07-09 12:51:47

    # 1.什么是大数据 大数据是一个大的数据集合,通过传统的计算技术无法进行处理。这些数据集的测试需要使用各种工具、技术和框架进行处理。大数据涉及数据创建、存储、检索、分析,而且它在数量、多样性、速度方法都很出色,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化

  • 190 Spark与Storm的对比2021-07-07 10:54:35

    Spark Storm 开发语言:Scala 开发语言:Clojure 编程模型:DStream 编程模型:Spout/Bolt  

  • 流计算框架 Flink 与 Storm 的性能对比2021-07-01 20:02:44

    1. 背景 Apache Flink 和 Apache Storm 是当前业界广泛使用的两个分布式实时计算框架。其中 Apache Storm(以下简称“Storm”)在美团点评实时计算业务中已有较为成熟的运用(可参考 Storm 的可靠性保证测试),有管理平台、常用 API 和相应的文档,大量实时作业基于 Storm 构建。而 Ap

  • Apache Storm || Processing real-time data2021-06-30 17:02:39

    Apache Storm https://storm.apache.org/ Storm介绍(一) - 生栋 - 博客园 https://www.cnblogs.com/Jack47/p/storm_intro-1.html Storm 入门的Demo教程 - 虚无境 - 博客园 https://www.cnblogs.com/xuwujing/p/8584684.html Processing real-time data with Storm, Kafka and Ela

  • 论文阅读记录[ Benchmarking Streaming Computation Engines: Storm, Flink and Spark Streaming ]2021-06-20 16:33:42

    简介:雅虎发布的一份各种流处理引擎的基准测试,包括Storm, Flink, Spark Streaming 动机:贴近生产环境,使用Kafka和Redis进行数据获取和存储,设计并实现了一个真实的流处理基准。 论文中的一些测试结果和结论: 原文:The results demonstrate that at fairly high throughput, Storm

  • STORM事务框架模型 - TransactionTopology2021-06-19 23:01:38

    1 TransactionTopology例子 MemoryTransactionalSpout spout = new MemoryTransactionalSpout(DATA, new Fields("word"), PARTITION_TAKE_PER_BATCH); TransactionalTopologyBuilder builder = new TransactionalTopologyBuilder("global-count", "sp

  • BigData之Storm:Apache Storm的简介、深入理解、下载、案例应用之详细攻略2021-06-15 21:53:27

    BigData之Storm:Apache Storm的简介、深入理解、下载、案例应用之详细攻略       目录 Apache Storm的简介 Apache Storm的深入理解 1、Storm与hadoop 2、Apache Storm的API Apache Storm的下载 Current 2.2.x Release Apache Storm的案例应用 1、Apache Storm集成       Apa

  • 常见的中间件2021-06-15 21:31:18

    中间件是什么 中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源。中间件位于客户机/ 服务器的操作系统之上,管理计算机资源和网络通讯。是连接两个独立应用程序或独立系统的软件。相连接的系统,即使它们具有不同的接口,但通过中间件相

  • Kafka的2种日志清理策略感受一下2021-06-13 22:52:48

    序 Kafka是一个基于日志的流处理平台,一个topic可以有多个分区(partition),分区是复制的基本单元,在单节点上,一个分区的数据文件可以存储在多个磁盘目录中,配置项是: # A comma separated list of directories under which to store log files log.dirs=/home/storm/dev/kafka-logs 每个

  • 实时流处理框架之Storm的安装与部署2021-06-11 15:57:11

      教程目录 0x00 教程内容 0x01 下载Storm 1. 下载Storm 2. 上传安装包到节点 0x02 安装与配置Storm 1. 解压Storm 2. 配置Storm 0x03 启动并校验Storm 1. 启动Storm 2. 校验Storm 0xFF 总结   0x00 教程内容 下载Storm 安装与配置Storm 启动并校验St

  • Flume+Kafka+Storm实战:二、Flume与Kafka整合2021-06-11 10:02:18

    文章目录 0x00 文章内容 0x01 Flume准备 1. 编写Flume配置文件 0x02 Kafka准备 1. 创建topic(如已操作过可跳过) 0x03 校验结果 1. 启动Flume 2. 启动Kafka消费者 3. 测试结果 0xFF 总结 0x00 文章内容 Flume准备 Kafka准备 校验结果 PS:请自行准备好Flume、Kafka的环境。由于

  • Flume+Kafka+Storm实战:一、Kakfa与Storm整合2021-06-11 10:02:01

    文章目录 0x00 文章内容 0x01 Kafka准备 1. 启动Kafka 2. 创建Topic 3. 启动消费者与消费者 0x02 Storm准备 1. 构建Maven项目 2. 编写代码 0x03 校验结果 1. 打包Storm代码 2. 执行ZK与Storm 3. 执行Storm作业 4. 校验过程 0xFF 总结 0x00 文章内容 Kafka准备 Storm准备

  • 架构解密从分布式到微服务:深入Kubernetes微服务平台2021-06-04 13:32:54

    深入Kubernetes微服务平台 Kubernetes的概念与功能 架构师普遍有这样的愿景:在系统中有ServiceA、ServiceB、ServiceC这3种服务,其中ServiceA需要部署3个实例,ServiceB与ServiceC各自需要部署5个实例,希望有一个平台(或工具)自动完成上述13个实例的分布式部署,并且持续监控它们

  • 大数据技术原理与应用之【流计算】习题2021-06-02 09:56:09

    1.试述流数据的概念 流数据,即数据以大量、快速、时变的流形式持续到达。 2.试述流数据的特点 流数据具有如下特征: 数据快速持续到达,潜在大小也许是无穷无尽的 数据来源众多,格式复杂 数据量大,但是不十分关注存储,一旦经过处理,要么被丢弃,要么被归档存储 注重数据的整体价值,不过分

  • Storm实时计算网站的UV2021-05-31 18:53:42

    (1)创建带IP地址的数据源GenerateData package storm.uv; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.util.Random; public class GenerateData { public static void main (String[] args){ File logFile =

  • Storm实时计算网站pv2021-05-31 18:53:24

    PVBolt1进行多并发局部汇总,PVSumbolt单线程进行全局汇总 (1)创建数据输入源PVSpout package storm.test; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStreamReader; import java.util.Map; import org.ap

  • Storm实现单词统计案例2021-05-31 18:53:13

    需求 实时统计发射到Storm框架中单词的总数 分析 设计一个topology,来实现对文档里面的单词出现的频率进行统计,整个topology分为三个部分 (1)WordCountSpot:数据源,在已知的英文句子中,随机发送一条句子出去 package storm.wordcount; import org.apache.storm.spout.SpoutO

  • storm的并发度2021-05-31 18:52:59

    场景分析 单线程下:加减乘除,全局汇总 多线程下:局部加减乘除,持久化DB,多个bolt汇总一个bolt 使用场景 网站最常用的两个指标: PV(page views):count (session_id) 即页面浏览量。 UV(user views):count(distinct session_id) 即独立访客数。 a)用ip地址分析 指访问某个站点或

  • Storm分组策略2021-05-31 18:52:48

    Spout数据源的思考 数据库:只适合读取数据库的配置文件 文件:只适合测试(开发过程中是分布式的集群) 企业产生的log文件处理步骤: 读取内容写入到MQ Storm再处理 分组策略(Stream Grouping) stream grouping用来定义一个stream应该如何分配给Bolts上面的多个executor(多线程并发

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有