ICode9

精准搜索请尝试: 精确搜索
  • hadoop2.7.6(一)2022-05-22 22:33:15

    一、hadoop的发展 二、hadoop框架 Hadoop Common:基础型功能 Hadoop Distributed File System (HDFS™):一种分布式文件系统,可提供对应用程序数据的高吞吐量访问。负责存放数据 Hadoop YARN:作业调度和集群资源管理的框架。负责资源的调配 Hadoop MapReduce:基于 YARN 的系统,用于并行

  • hadoop 之 hadoop2.7.7升级到hadoop2.8.52021-12-23 10:34:52

    服务器规划   准备阶段 停服务 stop-yarn.sh stop-dfs.sh   备份 备份NameNode目录 ---------- 101,102操作 ----------------- hdfs-site.xml中的 dfs.namenode.dir vi /app/hadoop-2.7.7/etc/hadoop/hdfs-site.xml <property>     <name>dfs.namenode.name.dir</name

  • hadoop2.7.1单机和伪集群的搭建-02021-12-21 21:32:55

    1.下载   http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.1/hadoop-2.7.1.tar.gz 最新版    解压: tar -zxvf   hadoop-2.7.1.tar.gz   2.配置环境变量 user@EBJ1023.local:/Users/user> vim ~/.bash_profile   export HADOOP_HOME=/usr/local/flume_kafk

  • spark集群安装部署2021-12-21 19:32:58

    1.在官网下载spark安装包 # wget https://archive.apache.org/dist/spark/spark-2.4.8/spark-2.4.8-bin-hadoop2.7.tgz 2.解压 # tar -zxvf spark-2.4.8-bin-hadoop2.7.tgz -C /home/hadoop/app 3.修改配置 # cd /home/hadoop/app/spark-2.3.1-bin-hadoop2.7/conf/ # cp spark-

  • CentOS7.6搭建Hadoop2.7.2运行环境-三节点集群模式2021-11-09 10:03:09

    一 环境准备 1.    准备机器                                                          2.    修改静态IP 3.    修改主机名 4.    关闭防火墙 5.    创建普通用户hadoop   添加hadoop用户     

  • centos 7 hadoop2.7完全分布式安装2021-09-06 21:31:05

      此文档为hadoop2.7和java8的安装。此配置只是用来学习大数据时所撰写 这里建立完全分布式集群用三台主机,主机名和IP分别如下 hadoop111A192.168.241.111 hadoop222B 192.168.241.112 hadoop333C 192.168.241.113 进入虚拟机,先把防火墙关掉 systemctl status firewall

  • Hadoop 运行模式之本地&伪分布式模式2021-07-10 18:32:06

    Hadoop运行模式包括:本地模式、伪分布式模式以及完全分布式模式。 Hadoop官方网站:http://hadoop.apache.org/ 一、本地运行模式 1、官方Grep案例 1、创建在hadoop-2.7.2文件下面创建一个input文件夹 [root@centos7 hadoop2.7]# mkdir input 2、将Hadoop的xml配置文件复制到input

  • hadoop2.7.1完全分布式安装步骤2021-05-26 19:29:37

    环境搭建目标 Hadoop版本2.7.1 Centos版本7.5 VMware Workstation 版本14pro jdk版本1.8 一、基础环境 1、时间同步 #(1)首先安装 ntpdate 命令: yum install -y ntpdate #(2)接着执行如下命令开始同步: ntpdate 0.asia.pool.ntp.org #(3)最后执行如下命令将系统时间同步到硬件,防止

  • Hadoop2.7.7版本安装(CentOs7环境)2021-04-05 09:30:55

    Hadoop-2.7.7集群安装 下载地址,可选择版本:https://archive.apache.org/dist/hadoop/common/ 只在Master节点上安装 安装步骤 解压安装用户授权 $ cd ~/Downloads $ rz # 上传下载到windows内的hadoop文件 $ sudo tar -zxf ./hadoop-2.7.7.tar.gz -C /usr/local $ cd /usr

  • 集群搭建系列(七) spark on yarn 3.0.1 待完善2020-12-24 14:03:18

    文章目录 1 下载、解压、软链2 环境变量配置3 1 下载、解压、软链 wget https://archive.apache.org/dist/spark/spark-3.0.1/spark-3.0.1-bin-hadoop2.7.tgz tar -zxvf spark-3.0.1-bin-hadoop2.7.tgz ln -s spark-3.0.1-bin-hadoop2.7 spark 如果还不行可以在清

  • Hadoop框架:HDFS高可用环境配置2020-10-28 07:00:55

    本文源码:GitHub·点这里 || GitEE·点这里 一、HDFS高可用 1、基础描述 在单点或者少数节点故障的情况下,集群还可以正常的提供服务,HDFS高可用机制可以通过配置Active/Standby两个NameNodes节点实现在集群中对NameNode的热备来消除单节点故障问题,如果单个节点出现故障,可通过该方式

  • Hadoop框架:DataNode工作机制详解2020-10-20 14:33:00

    本文源码:GitHub·点这里 || GitEE·点这里 一、工作机制 1、基础描述 DataNode上数据块以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是数据块元数据包括长度、校验、时间戳; DataNode启动后向NameNode服务注册,并周期性的向NameNode上报所有的数据块元数据信息; DataNode

  • CentOS7.5搭建Hadoop2.7.6完全分布式集群2020-06-11 10:03:50

    一 完全分布式集群搭建 Hadoop官方地址:http://hadoop.apache.org/ 1  准备3台客户机 1.2 关闭防火墙,设置静态IP,主机名 关闭防火墙,设置静态IP,主机名此处略,参考  Linux之CentOS7.5安装及克隆 1.2 修改host文件 我们希望三个主机之间都能够使用主机名称的方式相互访问而不是IP,

  • Spark安装2019-12-18 12:04:47

    1 spark安装前要有Java环境和Scala,注意spark和scala的版本一点要对应上,可以取官网查看 2 去官网下载spark包,下载spark-2.2.2-bin-hadoop2.7.tgz这种结构的,spark-2.2.2.tgz这是源码,安装后无法运行. 3 sudo tar -xzvf spark-2.2.2-bin-hadoop2.7.tgz && sudo mv spark-2.2.2-b

  • Centos7安装Hadoop2.72019-12-06 13:02:28

    准备 1、三台Centos7的机器,在/etc/hosts中都加上所有的hostname解析: 172.20.0.4  node1 172.20.0.5  node2 172.20.0.6  node3 2、配置node1到三台机器的免密登录 3、全部安装jdk8 4、官网下载安装包:hadoop-2.7.7.tar.gz(推荐中国科学技术大学开源镜像:http://mirrors.ustc.ed

  • centos7安装hadoop2.7.72019-11-01 18:00:58

    下载hadoop-2.7.7 网址如下 https://www-eu.apache.org/dist/hadoop/core/ 移动到/opt 路径下 在/opt下新建一个文件夹,名为app mkdir app 将/opt 下的hadoop-2.7.7.tar.gz 解压到/opt/app 下 tar -xzvf hadoop-2.7.7.tar.gz -C /opt/app

  • spark2019-10-04 11:03:26

    cloudera官网spark:https://docs.cloudera.com/documentation/enterprise/6/6.2/topics/spark.htmlspark官网:https://spark.apache.org/documentation.htmlCDH安装spark:https://my.oschina.net/gywbest/blog/3054588spark开发:https://docs.cloudera.com/documentation/enterpri

  • Centos7.0配置Hadoop2.7.02019-09-02 19:01:58

    一、ssh免密登录 1.命令ssh-keygen、 overwrite输入y一路回车 2.将生成的密钥发送到本机 ssh-copy-id localhost中间会询问是否继续输入“yes” 3.测试免密登录是否成功 ssh localhost   二、Java配置 新建一个文件夹存放java和hadoop这里我在~目录下新建了一个app文件夹下面。

  • Hadoop2.7.7 API: 弃用参数对比2019-08-13 20:43:14

    原文链接:https://hadoop.apache.org/docs/r2.7.7/hadoop-project-dist/hadoop-common/DeprecatedProperties.html Deprecated property name New property name create.empty.dir.if.nonexist mapreduce.jobcontrol.createdir.ifnotexist dfs.access.tim

  • hadoop2.7.7 分布式集群安装与配置2019-07-24 18:02:13

    环境准备 服务器四台: 系统信息 角色 hostname IP地址 Centos7.4 Mster hadoop-master-001 10.0.15.100 Centos7.4 Slave hadoop-slave-001 10.0.15.99 Centos7.4 Slave hadoop-slave-002 10.0.15.98 Centos7.4 Slave hadoop-slave-003 10.0.15.97            

  • 【大数据】Windows7、Hadoop2.7.62019-05-30 23:45:26

    一、Java配置 1、完整路径不能有空格:C:\jdk1.8.0_101 2、配置环境变量:JAVA_HOME 二、Hadoop配置 1、完整路径不能有空格:F:\0002_BigData\Soft\hadoop-2.7.6 2、创建文件夹:data、name、tmp 3、下载winutil,拷贝至:F:\0002_BigData\Soft\hadoop-2.7.6\bin    4、配置:hadoop-env.cmd

  • centos6.8安装单机hadoop2.7.22019-03-26 16:50:41

    Hadoop系列之(一):Hadoop单机部署1. Hadoop介绍Hadoop是一个能够对海量数据进行分布式处理的系统架构。Hadoop框架的核心是:HDFS和MapReduce。 HDFS分布式文件系统为海量的数据提供了存储, MapReduce分布式处理框架为海量的数据提供了计算。 2. Hadoop安装2.1 建立hadoop用户增加hadoo

  • hadoop2.7.3启动报错问题2019-03-21 17:53:30

    在日志里面可以看出是没有对应的权限,因此在hdfs_site.xml中添加   <property> <name>dfs.permissions</name> <value>false</value></property>解决问题!!

  • Spark Standalone cluster try2019-03-08 17:52:14

    Spark Standalone cluster node*-- stop firewalldsystemctl stop firewalldsystemctl disable firewalld-- tar sparkcd /opttar -zxvf spark-2.4.0-bin-hadoop2.7.tgzcd spark-2.4.0-bin-hadoop2.7-- cp application & application dataftp spark.test-1.0.jar -> /o

  • Hadoop2.7.3集群安装scala-2.12.8 和spark2.72019-02-19 18:38:39

    Apache Spark™是用于大规模数据处理的统一分析引擎。 从右侧最后一条新闻看,Spark也用于AI人工智能 spark是一个实现快速通用的集群计算平台。它是由加州大学伯克利分校AMP实验室 开发的通用内存并行计算框架,用来构建大型的、低延迟的数据分析应用程序。它扩展了广泛使用的MapRedu

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有