文章作者邮箱:yugongshiye@sina.cn 地址:广东惠州
▲ 本章节目的
⚪ 了解大数据的概念;
⚪ 了解大数据的部门结构;
⚪ 了解hadoop的定义;
⚪ 了解hadoop的发展史;
一、大数据简介
1. 概述
1. 美国调研机构Gartner给出了定义:大数据是一种新的处理模式,针对海量数据能够提供更强的决策力、洞察发现力和流程优化能力。
2. 维基百科给出了定义:大数据是指无法在可承受的时间范围内用常规的软件或者法来对大量的数据进行捕捉、管理和处理。
3. 无论哪个机构对大数据进行定义,实际上都是围绕对海量数据进行快速有效的处理方案。
2. 特点
1. Volumn:数据体量大。很多中小型企业的入门数据量是从TB级别开始,很多大型的企业的入门数据量是从PB级别开始。很多大型的企业,累计数据量已经达到了EB甚至ZB级别。
2. Variety:数据种类样式和来源多:
a. 种类:文本(日志)、图片、音频、视频、flash等。文章来源:https://www.toymoban.com/news/detail-609272.html
b. 样式:结构化数据(数据本身有结构并且数据解析之后能够用一张或者几张固定的表来进行存储);半结构化数据(数据本身有结构但是解析之后无法用一张或者几张固定的表来进行存储,例如json,xml文章来源地址https://www.toymoban.com/news/detail-609272.html
到了这里,关于大数据课程D1——hadoop的初识的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!