Hadoop HDFS的特点与优缺点

这篇具有很好参考价值的文章主要介绍了Hadoop HDFS的特点与优缺点。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

今天的文章总结了一下,HDFS的特点和优缺点,大家enjoy~~~

HDFS:分布式文件系统(Hadoop Distributed File System)是Hadoop核心子项目,为Hadoop提供了一个综合性的文件系统抽象,并且只会实现了多类文件系统的接口。HDFS基于流式数据访问、存储和处理超大文件。
HDFS 与其他分布式文件系统有相同点,也有不同点。一个明显的不同之处是,HDFS 采用“一次写入、多次读取”模型,该模型降低了并发控制的要求,能支持高吞吐量的访问。由于Hadoop的整个生态系统都是开源的,这就使得用户可以在不了解HDFS底层细节的情况下开发分布式应用程序,充分利用集群的能力实现高速运算和存储。HDFS 支持数据节点的动态添加和移动,因此HDFS集群可以轻松地从几十台服务器扩展到上千台服务器。HDFS另一个显著的特点是它把数据处理逻辑放置到数据所在的节点,这种特性比通过传输数据到应用程序所在节点要好。

一、HDFS的特点

1,它适用于在分布式存储和处理。
2, Hadoop提供了一个与HDFS交互的命令接口。
3, namenode和datanode的内置服务器帮助用户轻松检查集群的状态。
4,流式访问文件系统数据。
5, HDFS提供文件权限和身份验证。

二、HDFS的优点

1,支持超大文件的存储

运行在HDFS的应用程序的数据处理有较大的需求,从存储GB到存储TB级别的超大文件,在目前的实际应用中,HDFS以及被利用来管理存储PB级别的数据

2,支持流式的访问数据

HDFS 的设计建立在“一次写入、多次读取”的基础上,它将数据写入严格限制为一次只能写入一个数据,字节总是被附加到一个字节流的末尾,字节流总是以写入顺序先后存储。这意味着一个数据集一旦由数据源生成,就会被复制分发到不同的数据节点中,然后响应各种各样的数据分析与挖掘任务请求。在多数情况下,数据分析与挖掘任务都会涉及数据集中的大部分数据,也就是说,对HDFS来说,请求读取整个数据集要比读取一条记录更加高效。

3,实用性强

Hadoop设计的目标就是要能在低廉的商用硬件环境中运行,无需昂贵的高可用性机器,这样可以降低成本。廉价的商用机也就意味着大型集群中出现节点故障情况的概率非常高。为此, HDFS把数据块存储为多副本,确保在发生故障时系统能够继续运行且不让用户感觉到明显的中断。通过多副本机制,还可以提高可靠性。

三、HDFS的缺点

1,不适合低延迟数据访问

如果要处理一些用户要求时间比较短的低延迟应用请求,则HDFS不适合。HDFS是用于处理大规模数据集分析任务的,主要是为了达到高数据吞吐量而设计的,这就可能要求以高延迟作为代价。对于那些有低延时要求的应用程序,HBase或Spark是一个更好的选择,它们使用缓存或多个master设计来降低客户端的数据请求压力,以减少延时。

2,无法高效存储大量的小文件

对于Hadoop系统,小文件通常定义为远小于HDFS的数据块大小(128MB)的文件,由于每个文件都会产生各自的元数据,Hadoop通过NameNode来存储这些信息,若小文件过多,容易导致NameNode存储出现瓶颈。

3,不支持多用户写入和任意修改文件

HDFS目前不支持并发多用户的写操作,写操作只能在文件末尾追加数据。文章来源地址https://www.toymoban.com/news/detail-426873.html

到了这里,关于Hadoop HDFS的特点与优缺点的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • SwiftUI的优缺点

    2019年WWDC大会上,苹果在压轴环节向大众宣布了基于Swift语言构建的全新UI框架——SwiftUI,开发者可通过它快速为所有的Apple平台创建美观、动态的应用程序。推荐大量使用struct代替类。 SwiftUI 就是⼀种声明式的构建界面的用户接口工具包。 SwiftUI使用声明式的语法构建UI,我们

    2024年02月13日
    浏览(55)
  • 量化交易的优缺点

       量化交易其实就像 《物种起源》 里的物种一样,随着计算机与 智能 机器人的发展 , 投资量化是时代 发展 的必然产物 。 所谓 能者为先 适 者生存,这是 放诸四海 皆为本 的 生存法则 。在 现代 科技欣欣向荣的发展 环境下 , 量化交易 所 表现出 的 种种 优势 , 使 全

    2023年04月08日
    浏览(103)
  • springcloud 的优缺点:

    优点: 服务拆分粒度更细,有利于资源重复利用,有利于提高开发效率 可以更精准的制定优化服务方案,提高系统的可维护性 微服务架构采用去中心化思想,服务之间采用Restful等轻量级通讯,比ESB更轻量 适于互联网时代,产品迭代周期更短 缺点: 微服务过多,治理成本高

    2023年04月08日
    浏览(64)
  • CentOS 系统的优缺点

    CentOS (社区企业操作系统的缩写)是一个基于红帽企业 Linux (RHEL)的免费开源发行版, 旨在为服务器和工作站提供稳定、可靠和安全的平台。 不应将其与CentOS Stream 混淆,后者是即将发布的 RHEL 版本的上游开发平台。 CentOS Linux 源自 RedHat 发布的源代码,它是红帽停止支持其付

    2024年04月27日
    浏览(56)
  • ajax有哪些优缺点?

    Ajax是 异步的JavaScript和XML ,是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术。 Ajax的优点有: 能够在不刷新页面的情况下进行数据的更新,提高了用户体验。 优化了浏览器和服务器之间的通信,减少了不必要的网络传输。 基于标准且被广泛支持,不需要

    2024年02月08日
    浏览(58)
  • SSM框架的优缺点

    SSM的优缺点 Mybatis 的优缺点 优点 1、与JDBC相比,减少了50%以上的代码量 2、最简单的持久化框架、小巧简单易学 3、SQL代码从程序代码中彻底分离出来,可重用 4、提供XML标签,支持编写动态SQL 5、提供映射标签,支持对象与数据库的ORM字段关系映射 缺点 1、SQL语句编写工作量

    2024年02月03日
    浏览(62)
  • ChatGPT插件的优缺点

    虽然西弗吉尼亚大学的研究人员看到了最新的官方ChatGPT插件——名为“代码解释器”( Code Interpreter)的教育应用潜力,但他们也发现,对于使用计算方法处理针对癌症和遗传疾病的定向治疗的生物数据的科学家来说,这款插件的使用存在限制。 “代码解释器是一项很有潜力

    2024年02月10日
    浏览(61)
  • 敏捷开发发展和优缺点

    2023年07月07日
    浏览(65)
  • 48、MyBatis的优缺点

    基于 SOL 语句编程,相当灵活,不会对应用程序或者数据库的现有设计造成任何影响,SQL 写在 XML里,解除 sql 与程序代码的合,便于统一管理,提供 XML 标签,支持编写动态 SQL 语句,并可重用。 与JDBC 相比,减少了 50%以上的代码量,消除了JDBC 大量冗余的代码,不需要手动开

    2024年02月16日
    浏览(54)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包