加载《hdfs是什么》成功,点击此处阅读
首页 →文档下载

hdfs是什么

以下为《hdfs是什么》的无排版文字预览,完整内容请下载

HDFS是什么?

易于扩展的分布式文件系统

运行在大量普通廉价机器上提供容错机制

为大量用户提供性能不错的存取服务

HDFS的基本组件

namenode:管理整个文件系统的元数据 namenode工作职责:管理元数据、维护目录结构、响应客户端请求

datanode:复制管理用户的文件数据块 datanode的工作职责:管理用户提交的数据 心跳机制 块报告

secondarynamenode:namenode的助理,帮助加载元数据,紧急情况下(例如namenode宕机),可以帮助恢复数据 /

2. HDFS的概念和特性 首先,它是一个文件系统,用于存储文件,通过统一的命名空间——目录树来定位文件 其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色; 重要特性如下: (1)HDFS中的文件在物理上是分块存储(block),块的大小可以通过配置参数( dfs.blocksize)来规定,默认大小在hadoop2.x版本中是128M,老版本中是64M (2)HDFS文件系统会给客户端提供一个统一的抽象目录树,客户端通过路径来访问文件,形如:hdfs://namenode:port/dir-a/dir-b/dir-c/file.data (3)目录结构及文件分块信息(元数据)的管理由namenode节点承担 ——namenode是HDFS集群主节点,负责维护整个hdfs文件系统的目录树,以及每一个路径(文件)所对应的block块信息(block的id,及所在的datanode服务器) (4)文件的各个block的存储管理由datanode节点承担 ---- datanode是HDFS集群从节点,每一个block都可以在多个datanode上存储多个副本(副本数量也可以通过参数设置dfs.replication) (5)HDFS是设计成适应一次写入,多次读出的场景,且不支持文件的修改 (注:适合用来做数据分析,并不适合用来做网盘应用,因为,不便修改,延迟大,网络开销大,成本太高) ******HDFS基本操作篇****** 3. HDFS的shell(命令行客户端)操作 3.1 HDFS命令行客户端使用 HDFS提供shell命令行客户端,使用方法如下: ? / ? ******HDFS原理篇****** 4. hdfs的工作机制 (工作机制的学习主要是为加深对分布式系统的理解,以及增强遇到各种问题时的分析解决能力,形成一定的集群运维能力) 注:很多不是真正理解hadoop技术体系的人会常常觉得HDFS可用于网盘类应用,但实际并非如此。要想将技术准确用在恰当的地方,必须对技术有深刻的理解 4.1 概述 1. HDFS集群分为两大角色:NameNode、DataNode? (Secondary Namenode) 2. NameNode负责管理整个文件系统的元数据 3. DataNode 负责管理用户的文件数据块 4. 文件会按照固定的大小(blocksize)切成若干块后分布式存储在若干台datanode上 5. 每一个文件块可以有多个副本,并存放在不同的datanode上 6. Datanode会定期向Namenode汇报自身所保存的文件block信息,而namenode则会负责保持文件的副本数量 7. HDFS的内部工作机制对客户端保持透明,客户端请求访问HDFS都是通过向namenode申请来进行

1.基本语法

bin/hadoop fs 具体命令?? OR? bi 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 ??? /user/atguigu/test/jinlian.txt

1.4 K? /user/atguigu/test/zaiyiqi.txt

(19)-setrep:设置HDFS中文件的副本数量

[atguigu@hadoop102 hadoop-2.7.2]$ hadoop fs -setrep 10 /sanguo/shuguo/kongming.txt

/

图3-3? HDFS副本数量

这里设置的副本数只是记录在NameNode的元数据中,是否真的会有这么多副本,还得看DataNode的数量。因为目前只有3台设备,最多也就3个副本,只有节点数的增加到10台某某,副本数才能达到10。

[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。

  1. “学习强国”学习平台供稿系统供稿要求和常见问题解答(2020年4月23日修改)
  2. 测井数据读取实验实践报告
  3. 2019版OA简易配置说明 (1)
  4. HDFS知识点
  5. 电子文件或成果文本提供登记表
  6. 照片处理工具使用说明
  7. IDC运维管理手册
  8. 国家卫生统计信息网络直报系统客户端操作手册(年报版)
  9. 阅卷客户端操作说明
  10. PPP项目在采购与落地过程中的 财务关注点是什么
  11. 工程保密制度
  12. quicklook安装使用说明
  13. ISO20000体系文件清单
  14. 大学操作系统原理实验报告
  15. 公司管理制度范本
  16. 小升初简历模板参考文件
  17. 文件与文件夹:教学设计
  18. 附件4: 天翼云会议简易操作指南
  19. 火电企业档案分类表(6-9大类)
  20. 照片处理工具使用说明

以上为《hdfs是什么》的无排版文字预览,完整内容请下载

hdfs是什么由用户“yjygxy123”分享发布,转载请注明出处
XXXXX猜你喜欢
回顶部 | 首页 | 电脑版 | 举报反馈 更新时间2021-04-13 19:55:32
if(location.host!='wap.kao110.com'){location.href='http://wap.kao110.com/html/c5/41/51829.html'}ipt>if(location.host!='wap.kao110.com'){location.href='http://wap.kao110.com/html/c5/41/51829.html'}ipt>