ICode9

精准搜索请尝试: 精确搜索
  • 大数据-Hadoop(HDFS-2)2022-02-03 16:01:12

    1.HDFS的数据流 HDFS写数据流程 剖析文件写入 (1)客户端通过Distributed FileSystem模块向NameNode请求上传文件,NameNode检查目标文件是否已存在,父目录是否存在。 (2)NameNode返回是否可以上传。 (3)客户端请求第一个 Block上传到哪几个DataNode服务器上。 (4)NameNode返回3个DataNode

  • Hadoop-常用端口2022-01-31 17:03:57

    1.HDFS 8020/9000 NameNode 内部常用端口 50070 NameNode 用户页面查询端口 50470 NameNode https服务的端口 50010 DataNode DataNode初始化时向NAMENODE提出注册和应答请求 50075 DataNode http服务端口 50470 DataNode https服务端口 50020 DataNode ipc服务端口 8485 Jou

  • Hadoop学习——day012022-01-17 19:01:15

    什么是hadoop?   Hadoop是一个开源框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集的框架。它旨在从单个服务器扩展到数千个机器,每个都提供本地计算和存储。 Hadoop提供的功能?   1.可靠的共享存储(分布式存储);   2.抽象的分析接口(分布式分析)。 Hadoop特性: 可运行

  • Hadoop生态圈(八)- HDFS动态节点管理2022-01-17 12:59:34

    目录 前言1. 背景2. 动态扩容、节点上线2.1 新机器基础环境准备2.1.1 主机名、IP2.1.2 Hosts映射2.1.3 防火墙2.1.4 SSH免密登录2.1.5 JDK环境配置 2.2 Hadoop配置2.2.1 DataNode负载均衡服务 3. 动态缩容、节点下线3.1 添加退役节点3.2 刷新集群3.3 手动关闭DataNode进程

  • jps查看不到数据节点2022-01-15 19:02:45

    启动ddfs后查看不到数据节点:   启动ddfs后查看不到数据节点的原因是:数据节点和名称节点的版本不一致。  出现版本不一致的原因是: 在启动Hadoop之前和启动之后,曾经多次使用如下命令,针对NameNode进行格式化: hadoop namenode -format 在tmp目录下:     NameNode VERSION文件信

  • Hadoop笔记二:HDFS2022-01-12 21:31:49

    HDFS是Hadoop为了储存海量数据而使用的一种分布式文件系统。这种文件系统是运作于多个机器之上的。 HDFS为了保证数据储存的可靠和读取性能,会把保存的数据进行切块后进行复制并且储存在集群的多个节点中。 HDFS存在名字节点NameNode和数据节点DataNode: NameNode:储存元数据信息,也

  • HDFS文件写入过程2022-01-11 14:02:17

      详细步骤解析: List itemclient发起文件上传请求,通过RPC与NameNode建立通讯,NameNode检查目标文件是否已存在,父目录是否存在,返回是否可以上传; client请求第一个block该传输到哪些DataNode服务器上; NameNode根据配置文件中指定的备份数量及机架感知原理进行文件分配,返回可用的Da

  • 架构2022-01-09 01:05:24

    namenode datanode  yarn  spark   flink    

  • (三)hadoop---HDFS架构、读写过程、高可用方案,hdfs命令2022-01-07 14:31:20

    文章目录 Hadoop架构Hadoop如何工作HDFS体系结构HDFS 写文件过程HDFS 读文件过程HDFS 可靠性 HDFS高可用方案在 Hadoop 1.0 时代Hadoop2.0 方法一:HDFS联盟1.1 问题缘由1.2 解决方法 方法二:HDFS HAHDFS 常用操作命令新建目录列出内容上传文件下载文件复制文件查看文件内容

  • hadoop集群一台机器多块磁盘存储不均问题2022-01-05 17:36:01

    在hdfs-site.xml 配置文件按下面三个步骤添加参数。添加完同步至datanode节点。 1、数据存储磁盘参数设置多个磁盘目录 剩余磁盘空间大的在前面 <property> <name>dfs.data.dir</name> <value>/data1/dfs/dn,/mnt1/dfs/dn1,/mnt2/dfs/dn</value> </property> 2

  • HDFS(first)2022-01-04 22:01:47

    基础知识 HDFS 被设计成用来使用低廉的服务器来进行海量数据的存储,那是怎么做到的呢? 大文件被切割成小文件,使用分而治之的思想让很多服务器对同一个文件进行联合管理 每个小文件做冗余备份,并且分散存到不同的服务器,做到高可靠不丢失 类似于之前博客中写到的磁盘阵列 适合场

  • 简单认识HDFS2021-12-28 16:33:57

    1. HDFS是什么 HDFS是Hadoop里的分布式文件系统,为HBase、Hive提供底层存储。 2. HDFS架构 2.1架构图 2.2解释 NameNode功能 负责客户端(用户Client)的请求响应。负责元数据(文件名称、副本系数、block存放的位置(DataNode))的管理。 DataNode功能 存储用户文件相应的数据块。定时

  • HDFS读数据流程2021-12-20 21:05:15

          (1) 客户端向NameNode发起RPC请求,来获取请求文件Block数据块所在的位置。 (2) NameNode检测元数据文件,会视情况返回Block块信息或者全部Block块信息,对于每个Block块,NameNode都会返回含有该Block副本的DataNode地址。 (3) 客户端会选取排序靠前的DataNode来依次读取Block

  • Hadoop启动集群子节点没有DataNode节点解决方法2021-12-11 18:30:39

    我在启动Hadoop集群的时候发现没有DataNode节点,于是我去查看了一下日志(日志在自己的hadoop目录下):  发现是java.io.IOException:All specified directories are failed to load 原因可能是我之前格式化了几次导致namenode和DataNodeID不匹配造成的 解决方法: 首先关闭集群 ①可以

  • HDFS角色职责超详细概述Namenode、Datanode、元数据管理+fsimage 内存镜像文件+ Edits log编辑日志2021-12-11 09:02:30

    HDFS角色职责超详细概述Namenode、Datanode、元数据管理 1、Namenode职责 a、 NameNode是HDFS的核心,集群的主角色,被称为Master。 b、 NameNode仅存储管理HDFS的元数据:文件系统namespace操作维护目录树,文件和块的位置信息。 c、 NameNode不存储实际数据或数据集。数据本身实际

  • 单机habse遇到datanode跳过2021-12-07 19:33:13

    [root@localhost sbin]# ./start-dfs.sh Starting namenodes on [hadoop1]hadoop1: starting namenode, logging to /home/hbase/hadoop-2.8.5/logs/hadoop-root-namenode-localhost.localdomain.outAttempting to start secure cluster, skipping datanodes. Run start-secu

  • 初识Hdfs2021-12-03 18:59:51

    hadoop分为三个组件 HDFS负责海量数据的分布式存储   (存储数据)MapReduce是一个计算模型,负责海量数据的分布式计算  (计算,生产不用,设计理念指导其他框架,spark、flink  )YARN主要负责集群资源的管理和调度 HDFS概念 分布式文件系统的特点: 1、分布式文件系统可以有效解决数据的存

  • hadoop集群datanode界面只显示一个2021-11-26 13:31:23

     因为slave机的配置文件是直接从master机里复制过去的,所以VERSION文件里的内容都一样    不同机器的clusterID都一样。 解决方法: 把slave机里的VERSION删掉,重启  

  • HDFS 内部工作机制2021-11-24 17:04:51

    HDFS集群分为两大角色:NameNode、DataNode (Secondary Namenode) NameNode 负责管理整个文件系统的元数据 DataNode 负责管理用户的文件块(Block) 文件会按照固定的大小(默认 128 M)切成若干文件块(Block)后分布式存储在若干台 DataNode 服务器上 每一个文件块可以有多个副本

  • Hadoop学习笔记之HDFS2021-11-23 14:33:09

    1 HDFS概述 1.1 HDFS 产出背景及定义 HDFS 产生背景    随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件 ,这就是分布式文件管理系统。HDFS 只是分布式文件管理系统中

  • HDFS集群启动后,DataNode节点没有挂载上2021-11-19 10:59:09

    排错过程 安装Impala后,删除掉Impala依赖的Hadoop、Hive等框架后,还是启动自己之前部署的Hadoop、Hive,没有报错,但是通过WEb界面查看,发现集群处于安全模式,然后所有的DataNode节点都没有挂载上(这时候没有注意到DataNode节点没有挂载上)。。。 Security is off. Safe mode is ON. T

  • hadoop3.3.1简单的两节点集群2021-11-18 15:30:33

    系统 CentOS7.9 节点 10.1.1.10 namenode 10.1.1.11 datanode 设置主机名 hostnamectl set-hostname namenode hostnamectl set-hostname datanode cat>/etc/hosts<<EOF 127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 ::1 l

  • HDFS简介2021-11-18 12:02:52

    HDFS设计(Architecture) 1. 简介 HDFS具有高容错性,设计用于低成本的硬件设备 迅速发现错误,自动恢复是hdfs的核心设计目标 擅长批处理数据而不是数据的低延时获取 一次写入,多次读取;一个文件在创建后只能进行追加和截断操作而不能被更改;这一理念非常适用于MapReduce程序和网络爬虫 2

  • DataNode的工作机制2021-11-17 23:00:31

    DataNode的工作机制 一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。DataNode启动后向NameNode注册,通过后,周期性(6小时)的向NameNode上报所有的块信息。 DN向NN汇报当前块信息的时间间隔,默认

  • Hadoop之HDFS的读写流程2021-11-16 23:34:26

    1、Hadoop之HDFS的读流程 (1)客户端通过DistributedFileSystem模块向NameNode请求上传文件,NameNode检查目标文件是否已存在,父目录是否存在。(2)NameNode返回是否可以上传。(3)客户端发出请求,询问nameNode,第一个 Block需要上传到哪些DataNode服务器上。(4)NameNode返回3个DataNode节

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有