hadoop简介

10月前作者：fiveym 分类：Toy博客阅读(34) 违法举报

这篇具有很好参考价值的文章主要介绍了hadoop简介。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

概念

大数据(big data)：指无法在一定时间范围内用常规工具进行捕捉，管理和处理的数据集合，是需要新处理模式才能具有更强的决策力，洞察发现力和流程优化能力的海量、高增长和多样化的信息资产。

优势

高可靠性：hadoop底层维护多个数据副本，所以即使hadoop某个计算元素或存储出现故障，也不会导致数据丢失
高扩展性：在集群间分配任务数据，可方便的扩展数以千计的结点
高效性：在MapReduce的思想下，hadoop是并行工作的，以加快任务的处理速度
高容错性：能够自动将失败的任务重新分配

hadoop1.x、2.x、3.x区别

hadoop简介

HDFS架构概述

hadoop distributed file system，简称hdfs，是一个分布式文件系统

NameNode(nn)：存储文件的元数据，如文件名，文件目录结构，文件属性(生成时间，副本数，文件权限)，以及每个文件的块列表和块所在的DataNode等
DataNode(dn)：在本地文件系统存储块数据，以及块数据的校验和
Secondary NameNode(2nn)：每隔一段时间对NameNode元数据备份

hadoop简介 ## YARN架构概述

Yet Another Resource Negotiator，简称YARN，另一种资源协调者，是hadoop的资源管理器

ResourceManager(RM):整个集群资源(内存，CPU等)的老大
NodeManager(NM):单个结点服务器资源老大
ApplicationMaster(AM)：单个任务运行的老大
Container:容器，相当一台独立的服务器，里面封装了任务运行所需要的资源，如内存，CPU，磁盘，网络等

hadoop简介

说明1：客户端可以有多个
说明2：集群上可以运行多个applicationmaster
说明3：每个nodemanager上可以有多个container

MapReduce结构概述

MapReduce将计算过程分为两个阶段：Map和Reduce

Map阶段并行处理输入数据
Reduce阶段对Map结果进行汇总

HDFS,YARN,MapReduce三者关系

hadoop简介文章来源地址https://www.toymoban.com/news/detail-504105.html

到了这里，关于hadoop简介的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Oracle数据库概念简介

一般意义上的数据库包含两个部分库：就是一个存储一堆文件的文件目录数据库管理系统：管理库的系统数据库管理系统(Database Management System)，是一种操纵和管理数据库的大型软件，用于建立、使用和维护数据库，简称 DBMS ；它对数据库进行统一的管理和控制，以保证数

2024年02月09日
浏览(52)
大数据存储技术（1）—— Hadoop简介及安装配置

目录一、Hadoop简介（一）概念（二）Hadoop发展历史（三）Hadoop三大发行版本（四）Hadoop的优势二、Hadoop的组成（一）Hadoop1.x和Hadoop2.x的区别编辑（二）Hadoop的三种运行模式（三）HDFS架构概述（四）YARN架构概述（五）MapReduce架构概述（六）大数据技术生态体系

2024年02月04日
浏览(41)
Hbas简介：数据模型和概念、物理视图

本文参考自林子雨老师的大数据技术原理与应用(第三版)教材内容，仅供学习和交流 Google Bigtable是一种高度可扩展的分布式数据库，旨在处理海量数据并提供高吞吐量和低延迟的访问。它是谷歌公司为其内部使用而开发的，并在2004年首次公开发表。它利用谷歌提出的 M apRe

2024年01月24日
浏览(35)
【大数据】流处理基础概念（二）：时间语义（处理时间、事件时间、水位线）

流处理基础概念（一）：Dataflow 编程基础、并行流处理流处理基础概念（二）：时间语义（处理时间、事件时间、水位线）流处理基础概念（三）：状态和一致性模型（任务故障、结果保障） 😊 如果您觉得这篇文章有用 ✔️ 的话，请给博主一个一键三连 🚀🚀🚀 吧（点

2024年02月19日
浏览(45)
Vue.js核心概念简介：组件、数据绑定、指令和事件处理

本文介绍了Vue.js的四个核心概念：组件、数据绑定、指令和事件处理。每个概念都通过一个简单的示例进行了详细的解释。通过学习这些概念，您将能够充分利用Vue.js的强大功能，构建高效、灵活的Web应用程序。 1 组件组件是Vue.js的核心概念之一，它允许您将UI分解为相互作

2024年02月04日
浏览(59)
Kubernetes 概念—策略—限制范围

默认情况下， Kubernetes 集群上的容器运行使用的计算资源没有限制。使用 Kubernetes 资源配额，管理员（也称为集群操作者）可以在一个指定的命名空间内限制集群资源的使用与创建。在命名空间中，一个 Pod 最多能够使用命名空间的资源配额所定义的 CPU 和内存用量

2024年02月16日
浏览(43)
【⑬MySQL | 数据类型（一）】简介 | 整数 | 浮点 | 定点 | 时间/日期类型

✨欢迎来到小K的MySQL专栏，本节将为大家带来MySQL数据类型简介 | 整数 | 浮点 | 定点 | 时间/日期类型的分享 ✨ 0.数据类型简介数据类型（data_type）是指系统中所允许的数据的类型。MySQL 数据类型定义了列中可以存储什么数据以及该数据怎样存储的规则。数据库中的每个列都

2024年02月11日
浏览(39)
【C语言趣味教程】(2) 整数类型 | 数据类型的概念 | 原码反码与补码 | 有符号型和无符类型 | 研究 signed char 与 unsigned char 的取值范围

🔗 《C语言趣味教程》👈 猛戳订阅！！！在讲解数据类型前，我们不得不先讲解一些必备的知识点，比如如何定义一个变量，数据类型的基本概念。并介绍 ASCII 码，为 char 类型的讲解做必要的铺垫。然后讲解原码反码和补码，讲解 IEEE754标准时需要这部分的知识作为基

2024年02月15日
浏览(69)
⚡【C语言趣味教程】(2) 整数类型 | 数据类型的概念 | 原码反码与补码 | 有符号型和无符类型 | 研究 signed char 与 unsigned char 的取值范围

🔗 《C语言趣味教程》👈 猛戳订阅！！！在讲解数据类型前，我们不得不先讲解一些必备的知识点，比如如何定义一个变量，数据类型的基本概念。并介绍 ASCII 码，为 char 类型的讲解做必要的铺垫。然后讲解原码反码和补码，讲解 IEEE754标准时需要这部分的知识作为基

2024年02月15日
浏览(48)
⚡【C语言趣味教程】(2) 整数类型：数据类型的概念 | 原码反码与补码 | 有符号型和无符类型 | 研究 signed char 与 unsigned char 的取值范围

🔗 《C语言趣味教程》👈 猛戳订阅！！！在讲解数据类型前，我们不得不先讲解一些必备的知识点，比如如何定义一个变量，数据类型的基本概念。并介绍 ASCII 码，为 char 类型的讲解做必要的铺垫。然后讲解原码反码和补码，讲解 IEEE754标准时需要这部分的知识作为基

2024年02月16日
浏览(54)