千锋教育-做有情怀、有良心、有品质的职业教育机构

400-811-9990
手机站
千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频
千锋教育

关注千锋学习站小程序
随时随地免费学习课程

上海
  • 北京
  • 郑州
  • 武汉
  • 成都
  • 西安
  • 沈阳
  • 广州
  • 南京
  • 深圳
  • 大连
  • 青岛
  • 杭州
  • 重庆
当前位置:太原千锋IT培训  >  技术干货  >  HDFS可以存哪些数据?

HDFS可以存哪些数据?

来源:千锋教育
发布人:xqq
时间: 2023-10-11 08:26:33

一、HDFS介绍和使用

HDFS(Hadoop Distributed File System ),意为:Hadoop分布式文件系统。它是Apache Hadoop核心组件之一,作为大数据生态圈最底层的分布式存储服务而存在。也可以说大数据首先要解决的问题就是海量数据的存储问题。

HDFS主要是解决大数据如何存储问题的。分布式意味着是HDFS是横跨在多台计算机上的存储系统。

HDFS是一种能够在普通硬件上运行的分布式文件系统,它是高度容错的,适应于具有大数据集的应用程序,它非常适于存储大型数据 (比如 TB 和 PB)。

HDFS使用多台计算机存储文件, 并且提供统一的访问接口, 像是访问一个普通文件系统一样使用分布式文件系统。

二、HDFS优缺点

1、优点

高可靠性;

数据自动保存多个副本(默认3个,可以通多dfs.replication参数设置),通过增加副本来提高容错性;

某个副本丢失可以自动恢复;

适合处理大批量数据;

数据规模:能够处理GB,TB,甚至PB级别规模的数据;

文件规模:能够处理百万规模以上的文件数量;

可以在廉价的机器上运行良好。

2、缺点

不适合低延迟数据访问,比如秒级、毫秒级;

对大量小文件不友好;

存储大量小文件会占用NameNode大量的内存来存储文件目录及块信息等元数据,而NameNode的内存是有限的;

小文件存储的寻址时间会超过读取时间,寻址时间较好在传输时间的1%;

不支持并发写入、文件随机修改;

一个文件只能由一个线程写,不允许多个线程同时写;

仅支持文件内容追加(append),不支持随机修改。

以上就是关于HDFS的知识希望对大家有帮助。

声明:本站稿件版权均属千锋教育所有,未经许可不得擅自转载。

猜你喜欢LIKE

dom和bom区别?

2023-10-11

kabylake和skylake区别?

2023-10-11

php开发工具哪个好用?

2023-10-11

最新文章NEW

c语言和汇编语言的区别?

2023-10-11

git的fetch和pull区别?

2023-10-11

Eclipse和MyEclipse有哪些区别?

2023-10-11

相关推荐HOT

更多>>

快速通道 更多>>

最新开班信息 更多>>

网友热搜 更多>>