ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Harley浅谈Hadoop(HDFS)

2022-08-19 02:00:26  阅读:142  来源: 互联网

标签:HDFS 副本 1.1 文件 Hadoop 分布式 浅谈


 

一、HDFS概述

 

1.1、HDFS产出背景及定义

 

1.1.1、HDFS产生背景

 

  随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种

 

1.1.2、HDFS定义

 

  Hadoop(Hadoop Distributed File System),它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。

  HDFS的使用场景:适合一次写入,多次读出的场景,且不支持文件的修改。适合用来做数据分析,并不适合用来做网盘应用。

 

1.2、HDFS 优缺点

 

1.2.1、优点

 

(1)高容错性

1️⃣ 数据自动保存多个副本。它通过增加副本的形式,提高容错性。

2️⃣ 某一个副本丢失以后,它可以自动回复。

 

(2)适合处理大数据

1️⃣ 数据规模:能够处理数据规模达到GB、TB、甚至PB级别的数据

2️⃣ 文件规模:能够处理百万规模以上的文件数量,数量相当之大。

 

(3)可构建在廉价机器上,通过多副本机制,提高可靠性。

 

标签:HDFS,副本,1.1,文件,Hadoop,分布式,浅谈
来源: https://www.cnblogs.com/harleyblogs/p/16600669.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有