BIG DATA —— 大数据时代

这篇具有很好参考价值的文章主要介绍了BIG DATA —— 大数据时代。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

BIG DATA —— 大数据时代,大数据

大数据时代

[英] 维克托 · 迈尔 — 舍恩伯格     肯尼斯 · 库克耶 ◎ 著  盛杨燕     周涛◎译

BIG DATA —— 大数据时代,大数据

《大数据时代》是国外大数据研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为“大数据商业应用第一人”,他在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。

舍恩伯格最具洞见之处在于,指出大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。

本书认为大数据的核心就是预测,大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。

                                                                                                                                          —— 网络

BIG DATA —— 大数据时代,大数据

 读后感

BIG DATA —— 大数据时代,大数据

引言

        在一开始作者举例在流感中之所以谷歌可以预测冬季流感的传播。 就是因为谷歌保存了每天来自全球的30亿条搜索指令。奥伦 · 埃奇奥尼通过大数据解释了为什么季节影响飞机票的价格,他把这个发现命名为 “哈姆雷特”。于是他收购了Farecast公司,这时的预测准确率已经高达75%, 平均每张机票节省50美元。

BIG DATA —— 大数据时代,大数据

BIG DATA —— 大数据时代,大数据

天文学,信息爆炸的起源

信息爆炸的起源可以追溯到多个领域的发展,而天文学是其中的一个重要领域。随着计算机技术的全面融入和社会的发展,天文学在数据收集和处理方面取得了巨大的进步。在这个过程中,天文学家们积累了大量的观测数据,这些数据主要依赖于观测电磁辐射获得。这些数据的增长速度非常快,远超过了传统数据处理和分析的能力,从而形成了信息爆炸的现象。

具体来说,天文学作为信息爆炸的起源之一,主要体现在以下几个方面:

  1. 观测技术的进步:随着望远镜和探测器技术的不断改进,天文学家能够观测到更远的星系、更暗的天体和更精细的结构。这些观测技术的进步使得数据量迅速增长,为信息爆炸提供了丰富的原始素材。
  2. 数据处理技术的发展:随着计算机技术的不断进步,数据处理和分析能力得到了极大的提升。这使得天文学家能够更高效地处理和分析大量的观测数据,从而发现更多的天文现象和规律。
  3. 跨学科的合作与交流:天文学与其他学科的交叉融合,如物理学、数学、计算机科学等,为信息爆炸提供了更多的可能性。这些跨学科的合作与交流促进了数据共享和资源整合,进一步推动了信息爆炸的发展。

                                                                                                                                           ——网络

BIG DATA —— 大数据时代,大数据

BIG DATA —— 大数据时代,大数据

国际单位制前缀&字节

在书中多次提到国际单位制(SI)前缀

  1. 千(kilo):10³        或者1000
  2. 百万(mega):10⁶ 或者1,000,000
  3. 十亿(giga):10⁹   或者1,000,000,000
  4. 兆(tera):10¹²      或者1,000,000,000,000
  5. 拍(peta):10¹⁵     或者1,000,000,000,000,000
  6. 艾(exa):10¹⁸      或者1,000,000,000,000,000,000
  7. 泽(zetta):10²¹    或者1,000,000,000,000,000,000,000
  8. 尧(yotta):10²⁴    或者1,000,000,000,000,000,000,000,000
  9. 毫(milli):10⁻³     或者0.001
  10. 微(micro):10⁻⁶  或者0.000001
  11. 纳(nano):10⁻⁹   或者0.000000001
  12. 皮(pico):10⁻¹²   或者0.000000000001
  13. 飞(femto):10⁻¹⁵ 或者0.000000000000001
  14. 厄(atto):10⁻¹⁸    或者0.000000000000000001
  15. 兹(Zepto):10⁻²¹ 或者0.000000000000000000001
  16. 幺(Yocto):10⁻²⁴ 或者0.000000000000000000000001

据了解人类在2007年就储存了300艾字节

字节 Byte:

1Byte = 8bit, 俗称1大B = 1小b。

Byte进制是1024,艾字节到泽字节的进位就是1024 = 2¹⁰。

BIG DATA —— 大数据时代,大数据

 模拟数据&数字数据

众所周知使用东西是一般分为获取数据——传输数据——处理数据——发挥作用

模拟数据和数字数据是两种主要的数据类型,它们在表示、传输和处理数据时有显著的不同。

模拟数据(Analog Data)是指连续变化的数据,它们可以取任意值,并且在时间和幅度上都是连续的。例如,温度、压力、声音、图像等都属于模拟数据。模拟数据的特点是可以平滑地变化,没有固定的量化级别。这种类型的数据通常通过模拟信号进行传输,如电话线中的语音信号或电视广播中的图像信号。

数字数据(Digital Data)则是以离散的数值形式表示的数据。在计算机科学中,数字数据通常是用二进制代码(0和1)表示的。这种数据类型只能取特定的、离散的数值。0表示恒定的负电压,1表示恒定的正电压。

BIG DATA —— 大数据时代,大数据

 作者一直强调量变 = 质变,全数据模式 样本 = 总体这是很正确的, 作者在书中举例一个图片和一个视频有什么区别(量变 = 质变)。

我推荐大家看一下这本书:
BIG DATA —— 大数据时代,大数据

谢谢大家,欢迎点赞, 收藏,关注。文章来源地址https://www.toymoban.com/news/detail-834685.html

到了这里,关于BIG DATA —— 大数据时代的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【大数据】数据分析和挖掘技术和应用 A Brief Review of Big Data Technologies and Application

    作者:禅与计算机程序设计艺术 在现代信息社会里,数据的爆炸性增长已经给传统行业带来巨大的商机,并促进了人工智能、机器学习、云计算等新兴技术的出现。作为数据驱动的经济领域,数据分析和挖掘技术成为绩效提升和产品优化的关键环节,也是各个公司争相追逐的

    2024年02月07日
    浏览(35)
  • “大数据处理”的现状 Scaling up and out: Towards an efficient processing of big Data

    作者:禅与计算机程序设计艺术 Hadoop 是 Apache 基金会于 2007 年推出的开源分布式计算框架。它是一个通用计算平台,可用于存储、处理和分析大量的数据集。它是一个分布式文件系统(HDFS),一个资源管理器(YARN),和一些常用的组件如 MapReduce、Hive 和 Pig。在数据量达到海

    2024年02月08日
    浏览(27)
  • INT303 Big Data 个人笔记

    又来到了经典半个月写一个学期内容的环节 目前更新至Lec{14}/Lec14 依旧是不涉及代码,代码请看学校的jupyter notebook~ 介绍课程 Topic Range Topic 1: Introduction to Big Data Analytics Lec1~Lec3 Topic2: Big data collection and visualization Lec4~Lec5 Topic3: Systems and software Lec6 Topic 4: Data processing methods and a

    2024年02月03日
    浏览(42)
  • Learning Spark: LightningFast Big Data Analysis

    作者:禅与计算机程序设计艺术 Spark是一种开源快速通用大数据分析框架。它能够在超高速的数据处理能力下,轻松完成海量数据处理任务。相比于其他大数据处理系统(如Hadoop)来说,Spark具有如下优点: 更快的速度:Spark可以更快地处理超高速的数据,特别是在内存计算时,

    2024年02月08日
    浏览(33)
  • Databases and Big Data Technologies: Essential Knowledg

    作者:禅与计算机程序设计艺术 互联网正在改变着传统行业和新兴行业的结构,电子商务、社交网络、移动应用程序等新兴产业的迅速发展也催生了基于数据中心的数据库应用的需求,而这方面的知识技能是越来越重要。然而,除了数据库技术的基础知识和技术栈外,基于数

    2024年02月07日
    浏览(30)
  • Big Data Tools插件(详细讲解安装,连接,包教包会!!!)

    🐮博主syst1m 带你 acquire knowledge! ✨博客首页——syst1m的博客💘 😘《CTF专栏》超级详细的解析,宝宝级教学让你从蹒跚学步到健步如飞🙈 😎《大数据专栏》大数据从0到秃头👽,从分析到决策,无所不能❕ 🔥 《python面向对象(人狗大战)》突破百万的阅读量,上过各种各样

    2024年02月03日
    浏览(28)
  • Python Packages for Big Data Analysis and Visualization

    作者:禅与计算机程序设计艺术 Python第三方库主要分为两类:数据处理、可视化。下面是用于大数据分析与可视化的常用的Python第三方库列表(按推荐顺序排序): NumPy: NumPy 是用 Python 编写的一个科学计算库,其功能强大且全面,尤其适用于对大型多维数组和矩阵进行快速

    2024年02月07日
    浏览(33)
  • Building a big data platform system, architecture desig

    作者:禅与计算机程序设计艺术 Apache Hadoop是一个开源的分布式计算平台,它可以运行在廉价的商用硬件上,并提供可扩展性和高容错性。作为Hadoop框架的一部分,MapReduce是一种编程模型和执行引擎,用于对大数据集进行并行处理。但是,由于其复杂性和庞大的体系结构,开

    2024年02月05日
    浏览(41)
  • Establishing a RealTime Big Data Platform for Transport

    作者:禅与计算机程序设计艺术 Apache Kafka是一个开源的分布式流处理平台,它最初由LinkedIn公司开发,用于实时数据管道及流动计算,随着时间的推移,Kafka已成为最流行的开源消息代理之一。同时,它还是一个快速、可靠的分布式存储系统,它可以作为消息队列来用。Mong

    2024年02月07日
    浏览(35)
  • Introduction to Flink Streaming Platform for Big Data

    作者:禅与计算机程序设计艺术 Flink是一个开源的分布式流处理框架,它允许快速轻松地进行实时数据处理,提供了一个完整的数据流程解决方案。它支持低延迟的实时数据计算、高吞吐量的实时数据传输以及复杂事件处理(CEP)。Flink在Apache顶级项目中排名第二,同时也被很多

    2024年02月07日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包