云计算与大数据第7章 大数据概览练习题及答案

这篇具有很好参考价值的文章主要介绍了云计算与大数据第7章 大数据概览练习题及答案。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

第7章 大数据概览习题

7.1 选择题

1、下列说法错误的是(  B  )。

A. 数据是指对客观事件进行记录并可以鉴别的符号    

B. 信息是数据的表现形式和载体

C. 数据只有在传递的过程中才能够被称为信息

D. 信息的时效性对于信息的使用和传递具有重要的意义

2、从数据的表现形式看,大数据的主要典型特征有(  A  )。

              ①海量   ②多样  ③快速  ④价值

A. ①②③④     B. ②③④       C. ①③④        D. ①②④

3、 以下(  B  )不是大数据生命周期的主要组成部分。

A. 数据采集       B. 数据压缩       C. 数据处理         D. 结果可视化

4、目前大数据平台主要包括大数据采集平台、大数据批处理平台、流数据处理平台、内存计算平台和深度学习平台等;以下(  C  )属于流数据处理平台。

A. Hadoop                    B. Pytorch             C. Storm             D. TensorFlow

5、Nutch是采用( D )语言编写的具有高可扩展性的搜索引擎。

A. Pytorch             B. C                  C. BASIC          D. Java

7.2 填空题

1、数据(   可视化   )指通过图形化的方式,以一种直观、便于理解的形式展示数据及分析结果的方法。

2、(   深度学习   )通过建立进行分析学习的多层次深度神经网络,组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。

3、Storm平台中,( Topology/拓扑 )是由一系列通过数据流相互关联的Spout和Bolt组成的有向无环图。

4、TensorFlow是由( 张量/Tensor )和(  数据流/Flow  )两部分组成。

5、Spark作业执行一般采用(  主从式  )架构。

7.3 简答题

1、请简单描述Nutch与Hadoop之间的关系。

答:文章来源地址https://www.toymoban.com/news/detail-786536.html

Nutch为实现基于Hadoop分布式平台下的多物理主机并行进行数据采集提供了有效支持。在Hadoop分布式平台下,Nutch采用Hadoop分布式文件系统,通过Hadoop的MapReduce计算模型来采集页面中与某个主题相关的数据,可在短时间内采集大量的数据。Nutch与Hadoop的关系如下图所示。

2、分析相关数据可以帮助企业降低成本、提高效率、开发新产品、做出更明智的业务决策等。通过大数据分析,企业一般可以实现哪些目标?

答:

(1)及时解析故障、问题和缺陷的根源,从而降低成本。

(2)为成千上万的快递车辆规划实时交通路线,避开拥堵。

(3)分析库存,以利润最大化为目标来定价和清理库存。

(4)根据客户的购买习惯,推送客户可能感兴趣的优惠信息。

(5)从大量客户中快速识别出金牌客户。

(6)通过流量分析和数据挖掘来规避欺诈行为。

3、为了保证内容的正确性,维基百科在技术上和运行规则上制订了哪些规范?

答:

(1)版本控制。保留词条每一次更新的版本,即使参与者将整个词条删掉,管理者也可以很方便地从记录中恢复词条。

(2)词条锁定。采用锁定技术将一些主要词条的内容锁定,其他人就不可再编撰这些词条。

(3)更新备注。在更新一个词条时可以在描述栏中备注,以便管理员知道词条更新的操作细节。

(4)IP禁用。为了防止恶意用户对系统及内容的破坏,维基百科通过识别和禁用IP的方式,防止恶意用户的后续破坏行为。

(5)沙盒测试。维基百科的词条都建有沙盒测试页面,以便让初次参与的人先到沙盒页面来无损害的熟悉系统功能,即使操作失误也没有关系。

7.4 解答题

1、制造业需要利用数据分析技术、工具或平台,智能地从大量复杂的原始生产数据中发现新的模式和知识作为改进生产过程的决策依据。面向制造业的数据处理平台架构包含哪几个层次?

答:

  1. 物理资源层。物理资源层主要包括底层的物理设备,这些物理设备能有效地支撑数据存储和扩展。
  2. 逻辑资源层。逻辑资源层包括存储资源和计算资源。存储资源建立在物理设备的基础上,包括传统数据库、本地文件系统、分布式文件系统等。计算资源是逻辑上的计算单元,数据处理平台的计算能力依赖于计算单元的数量,通过扩展配置计算单元的数量能有效地支撑上层的数据挖掘任务。
  3. 数据分析任务管理层。该层是数据处理平台的核心,能有效地连接分析功能与后台集群。合理的数据分析平台设计需要具备任务管理能力主要包括易于算法扩展、支持任务流和任务间依赖关系的配置、任务调度、计算资源和存储资源的配置。数据分析平台通过数据分析框架来有效支撑数据分析任务管理。
  4. 数据分析层。数据分析层提供具体分析任务的用户执行接口,数据分析任务主要包括数据立方、对比分析、时间维分析、数据操作、结果展示和分析报告。

到了这里,关于云计算与大数据第7章 大数据概览练习题及答案的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 正则表达式练习题(含答案)

    1. d,W,s,B,.,*,+,?分别是什么? d:数字 W:非英文数字下划线的任意字符 s:任意空白字符 B:非单词开始或结尾的位置 .表示非换行符的任意字符 *表示匹配前面子表达式0次或多次 +表示匹配前面子表达式1次或多次 ?表示匹配前面子表达式0次或1次 2. (?=a),(?!a),

    2024年02月06日
    浏览(34)
  • Vue课后练习题及答案解析

    第一章 Vue.js基础入门 填空题 Vue是一套构建________的渐进式框架。 MVVM主要包含3个部分,分别是Model、View和________。 Vue中通过________属性获取相应的DOM元素。 在进行Vue调试时,通过使用________工具来完成项目开发。 Vue中页面结构以________形式存在。 判断题 Vue与Angular和React框架

    2024年02月09日
    浏览(39)
  • 云计算与大数据第9章 大数据处理习题带答案

    1、在数据预处理阶段,数据合并到一致的存储介质中,使得数据挖掘更有效、挖掘模式更易理解,这一过程是(  B  )。 A. 数据清洗         B. 数据集成        C. 数据归约      D.数据转换    2、以下(  B  )不是数据归约策略。 A. 属性子集的选择   B. 属性构

    2024年02月09日
    浏览(34)
  • 云计算与大数据第8章 大数据采集习题及答案

    1、数据采集的数据对象类型包括(  D  )。 A. 结构化数据      B. 半结构化数据     C. 非结构化数据      D. 以上都是 2、数据采集的主要性能要求不包括以下的(  B  )。 A. 全面性          B. 安全性           C. 多维性            D. 高效性 3、大数据

    2024年02月02日
    浏览(28)
  • Photoshop平面设计练习题(附答案)

    1.下列哪个是photoshop图像最基本的组成单元: C A. 节点 B. 色彩空间 C. 像素 D. 路径 2.下面对矢量图和像素图描述正确的是: C A. 矢量图的基本组成单元是像素 B. 像素图的基本组成单元是锚点和路径 C. Adobe Illustrator 9图形软件能够生成矢量图 D. Adobe photos

    2024年02月03日
    浏览(33)
  • 云计算与大数据第11章 大数据隐私保护习题带答案

    1、以下(  D  )通常不是导致数据隐私泄露问题的来源。 A.  数据被肆意收集   B. 数据集成融合   C. 大数据分析   D. DDOS攻击 2、以下(  C  )不是数据隐私保护的主要目标。 A.  机密性   B. 完整性   C. 合理性   D. 可用性 3、发布数据时将隐私数据中的显式标识符删

    2024年02月13日
    浏览(29)
  • 十、jQuery(上) - 章节课后练习题及答案

    第一章链接:初识JavaScript - 章节课后练习题及答案 第二章链接:JavaScript 基础(上) - 章节课后练习题及答案  第三章链接:JavaScript 基础(下) - 章节课后练习题及答案 第四章链接:JavaScript 函数 - 章节课后练习题及答案 第五章链接:JavaScript 对象 - 章节课后练习题及答案

    2024年02月12日
    浏览(33)
  • 32道子网划分练习题详细解析含答案

    目录 1 子网划分概念: 2 划分方法: 子网划分方法:段,块,数的计算三步。 段就是确定ip地址段中既有网络地址,又有主机地址的那一段是四段中的那一段? 块就确定上一步中确定的那一段中的主机位数n,这样就确定该段中主机位中最大ip变化是2^n。 变化段数的计算:

    2023年04月20日
    浏览(61)
  • 机器学习课后练习题(期末复习题目附答案)

    此为第一章绪论部分 一. 单选题 1. 移动运营商对客户的流失进行预测,可以使用下面哪种机器学习方法比较合适( ) A. 一元线性回归分析 B. 关联方法 C. 聚类算法 D. 多层前馈网络 正确答案: A 2. 下面哪种说法有关机器学习的认识是错误的?( ) A. 高质量的数据、算力和算法对一个机

    2024年02月07日
    浏览(31)
  • 【机器学习】第三章线性模型练习题及答案

    一. 单选题(共21题,63分) 1.【单选题】以下哪组变量之间存在线性回归关系? A. 正三角形的边长与周长 B. 学生的性别与他的成绩 C. 正方形的边长与面积 D. 儿子的身高与父亲的身高 正确答案: A 2.【单选题】下列关于线性回归分析中的残差(Residuals)说法正确的是? A. 以上说法

    2024年02月03日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包