大数据中的分布式文件系统MapReduce的选择题

这篇具有很好参考价值的文章主要介绍了大数据中的分布式文件系统MapReduce的选择题。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一 . 选择题

一. 单选题(共9题,49.5分)文章来源地址https://www.toymoban.com/news/detail-759820.html

  1. (单选题)下列传统并行计算框架,说法错误的是哪一项?
    A. 刀片服务器、高速网、SAN,价格贵,扩展性差上
    B. 共享式(共享内存/共享存储),容错性好
    C. 编程难度高
    D. 实时、细粒度计算、计算密集型
    正确答案: B:共享式(共享内存/共享存储),容错性好;
    5.5分
  2. (单选题)下列关于MapReduce模型的描述,错误的是哪一项?
    A. MapReduce采用“ 分而治之”策略
    B. MapReduce设计的一个理念就是“ 计算向数据靠拢”
    C. MapReduce框架采用了Master/Slave架构
    D. MapReduce应用程序只能用Java来写
    正确答案: D:MapReduce应用程序只能用Java来写;
    5.5分
  3. (单选题)MapReduce1.0的体系结构中,JobTracker是主要任务是什么?
    A. 负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况
    B. 使用“slot”等量划分本节点上的资源量(CPU、内存等)
    C. 会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给TaskTracker
    D. 会跟踪任务的执行进度、资源使用量等信息,并将这些信息告诉任务(Task)
    正确答案: A:负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况;
    5.5分
  4. (单选题)下列关于MapReduce工作流程,哪个描述是正确的?
    A. 所有的数据交换都是通过MapReduce框架自身去实现的
    B. 不同的Map任务之间会进行通信
    C. 不同的Reduce任务之间可以发生信息交换
    D. 用户可以显式地从一台机器向另一台机器发送消息
    正确答案: A:所有的数据交换都是通过MapReduce框架自身去实现的;
    5.5分
  5. (单选题)下列关于MapReduce的说法,哪个描述是错误的?
    A. MapReduce具有广泛的应用,比如关系代数运算、分组与聚合运算等
    B. MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数
    C. 编程人员在不会分布式并行编程的情况下,也可以很容易将自己的程序运行在分布式系统上,完成海量数据集的计算
    D. 不同的Map任务之间可以进行通信
    正确答案: D:不同的Map任务之间可以进行通信;
    5.5分
  6. (单选题)下列关于Map和Reduce函数的描述,哪个是错误的?
    A. Map将小数据集进一步解析成一批<key,value>对,输入Map函数中进行处理
    B. Map每一个输入的<k 1 ,v 1 >会输出一批<k 2 ,v 2 >。<k 2 ,v 2 >是计算的中间结果
    C. Reduce输入的中间结果<k 2 ,List(v 2 )>中的List(v 2 )表示是一批属于不同k 2 的value
    D. Reduce输入的中间结果<k 2 ,List(v 2 )>中的List(v 2 )表示是一批属于同一个k 2 的value
    正确答案: C:Reduce输入的中间结果<k 2 ,List(v 2 )>中的List(v 2 )表示是一批属于不同k 2 的value;
    5.5分
  7. (单选题)下面哪一项不是MapReduce体系结构主要部分?
    A. Client
    B. JobTracker
    C. TaskTracker以及Task
    D. Job
    正确答案: A:Client;
  8. (单选题)关于MapReduce1.0的体系结构的描述,下列说法错误的是?
    A. Task 分为Map Task 和Reduce Task 两种,分别由JobTracker 和TaskTracker 启动
    B. slot 分为Map slot 和Reduce slot 两种,分别供MapTask 和Reduce Task 使用
    C. TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)
    D. TaskTracker 会周期性接收JobTracker 发送过来的命令并执行相应的操作(如启动新任务、杀死任务等)
    正确答案: A:Task 分为Map Task 和Reduce Task 两种,分别由JobTracker 和TaskTracker 启动;
    5.5分
  9. (单选题)下列说法错误的是?
    A. Hadoop MapReduce是MapReduce的开源实现,后者比前者使用门槛低很多
    B. MapReduce采用非共享式架构,容错性好
    C. MapReduce主要用于批处理、实时、计算密集型应用
    D. MapReduce采用“ 分而治之”策略
    正确答案: C:MapReduce主要用于批处理、实时、计算密集型应用;
    二. 多选题(共9题,50.5分)
  10. (多选题)MapReduce相较于传统的并行计算框架有什么优势?
    A. 非共享式,容错性好
    B. 普通PC机,便宜,扩展性好
    C. 编程简单,只要告诉MapReduce做什么即可
    D. 批处理、非实时、数据密集型
    正确答案: ABCD:非共享式,容错性好; 普通PC机,便宜,扩展性好; 编程简单,只要告诉MapReduce做什么即可; 批处理、非实时、数据密集型;
    2.8分
  11. (多选题)MapReduce体系结构主要由以下那几个部分构成?
    A. Client
    B. JobTracker
    C. TaskTracker
    D. Task
    正确答案: ABCD:Client; JobTracker; TaskTracker; Task;
    5.5分
  12. (多选题)下列关于MapReduce的体系结构的描述,说法正确的有?
    A. 用户编写的MapReduce程序通过Client提交到JobTracker端
    B. JobTracker负责资源监控和作业调度
    C. TaskTracker监控所有TaskTracker与Job的健康状况
    D. TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)
    正确答案: ABD:用户编写的MapReduce程序通过Client提交到JobTracker端; JobTracker负责资源监控和作业调度; TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等);
    5.5分
  13. (多选题)MapReduce的作业主要包括什么?
    A. 从磁盘或从网络读取数据,即IO密集工作
    B. 计算数据,即CPU密集工作
    C. 针对不同的工作节点选择合适硬件类型
    D. 负责协调集群中的数据存储
    正确答案: AB:从磁盘或从网络读取数据,即IO密集工作; 计算数据,即CPU密集工作;
    5.5分
  14. (多选题)对于MapReduce 而言,其处理单位是split。split 是一个逻辑概念,它包含哪些元数据信息?
    A. 数据起始位置
    B. 数据长度
    C. 数据所在节点
    D. 数据大小
    正确答案: AB:数据起始位置; 数据长度;
  15. (多选题)下列关于Map 端的Shuffle的描述,哪些是正确的?
    A. MapReduce默认为每个Map任务分配1000MB缓存
    B. 多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的
    C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
    D. 每个Map任务分配多个缓存,使得任务运行更有效率
    正确答案: BC:多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的; 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce;
    5.5分
  16. (多选题)MapReduce的具体应用包括哪些?
    A. 关系代数运算(选择、投影、并、交、差、连接)
    B. 分组与聚合运算
    C. 矩阵-向量乘法
    D. 矩阵乘法
    正确答案: ABCD:关系代数运算(选择、投影、并、交、差、连接); 分组与聚合运算; 矩阵-向量乘法; 矩阵乘法;
    5.5分
  17. (多选题)MapReduce执行的全过程包括以下哪几个主要阶段?
    A. 从分布式文件系统读入数据
    B. 执行Map任务输出中间结果
    C. 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
    D. 执行Reduce任务得到最终结果并写入分布式文件系统
    正确答案: ABCD:从分布式文件系统读入数据; 执行Map任务输出中间结果; 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务; 执行Reduce任务得到最终结果并写入分布式文件系统;
    5.5分
  18. (多选题)下列说法正确的是?
    A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
    B. Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动
    C. 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的
    D. 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息
    正确答案: ABCD:MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task; Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动; 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的; 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息;

到了这里,关于大数据中的分布式文件系统MapReduce的选择题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop大数据从入门到实战(二)分布式文件系统HDFS

    头歌实践教学平台 教学课堂 大数据从入门到实战 - 第2章 分布式文件系统HDFS 任务描述 本关任务:使用 Hadoop 命令来操作分布式文件系统。 编程要求 在右侧命令行中启动 Hadoop ,进行如下操作。 在 HDFS 中创建 /usr/output/ 文件夹; 在本地创建 hello.txt 文件并添加内容:“ HDFS的

    2024年02月12日
    浏览(42)
  • 分布式文件系统与HDFS的shell操作及查看元数据

      启动hadoop和hive的metastore 查看sbin的目录下的文件 执行./start-all.sh  查看相关的进程

    2024年02月16日
    浏览(55)
  • 【头歌】大数据从入门到实战 - 第2章 分布式文件系统HDFS

    任务描述 本关任务:使用 Hadoop 命令来操作分布式文件系统。 编程要求 在右侧命令行中启动 Hadoop ,进行如下操作。 在 HDFS 中创建 /usr/output/ 文件夹; 在本地创建 hello.txt 文件并添加内容:“ HDFS 的块比磁盘的块大,其目的是为了最小化寻址开销。”; 将 hello.txt 上传至 H

    2024年02月05日
    浏览(80)
  • 头歌Educoder云计算与大数据——实验三 分布式文件系统HDFS

    本关任务:使用Hadoop命令来操作分布式文件系统。 为了完成本关任务你需要了解的知识有:1.HDFS的设计,2.HDFS常用命令。 HDFS的设计 点点点…题目省略,懒得写了,下同 分布式文件系统 NameNode与DataNode HDFS的常用命令 在右侧命令行中启动Hadoop,进行如下操作。 在HDFS中创建

    2024年02月13日
    浏览(55)
  • MapReduce分布式计算(二)

    原始数据File 1T数据被切分成块存放在HDFS上,每一个块有128M大小 数据块Block hdfs上数据存储的一个单元,同一个文件中块的大小都是相同的 因为数据存储到HDFS上不可变,所以有可能块的数量和集群的计算能力不匹配 我们需要一个动态调整本次参与计算节点数量的一个单位 切片

    2024年02月11日
    浏览(45)
  • MapReduce分布式计算(一)

    MapReduce是Hadoop系统核心组件之一,它是一种可用于大数据并行处理的计算模型、框架和平台,主要解决海量数据的计算,是目前分布式计算模型中应用较为广泛的一种。 练习: 计算a.txt文件中每个单词出现的次数 通过以上的方式 计算出来了a.txt文件中每个单词出现的次数,

    2024年02月11日
    浏览(48)
  • 分布式处理框架 MapReduce

    3.2.1 什么是MapReduce 源于Google的MapReduce论文(2004年12月) Hadoop的MapReduce是Google论文的开源实现 MapReduce优点: 海量数据离线处理易开发 MapReduce缺点: 实时流式计算 3.2.2 MapReduce编程模型 MapReduce分而治之的思想 数钱实例:一堆钞票,各种面值分别是多少 单点策略 一个人数所有的钞票

    2024年02月11日
    浏览(49)
  • ❤️❤️❤️Mapreduce分布式计算组件和YARN分布式资源调度

    上文我们已经介绍Hadoop中HDFS分布式存储组件 今天我们来学习Hadoop生态中另两大组件Mapreduce和YARN Map阶段 : 将数据拆分到不同的服务器后执行Maptask任务,得到一个中间结果 Reduce阶段 : 将Maptask执行的结果进行汇总,按照Reducetask的计算 规则获得一个唯一的结果 我们在MapReduce计算框

    2024年04月13日
    浏览(52)
  • 分布式系统中的分布式链路追踪与分布式调用链路

    本文分享自天翼云开发者社区《分布式系统中的分布式链路追踪与分布式调用链路》,作者:c****w 在分布式系统中,由于服务间的调用关系复杂,需要实现分布式链路追踪来跟踪请求在各个服务中的调用路径和时间消耗。这对问题排查和性能监控都很重要。 常用的分布式链

    2024年01月19日
    浏览(55)
  • 分布式计算MapReduce | Spark实验

    题目1 输入文件为学生成绩信息,包含了必修课与选修课成绩,格式如下: 班级1, 姓名1, 科目1, 必修, 成绩1 br (注: br 为换行符) 班级2, 姓名2, 科目1, 必修, 成绩2 br 班级1, 姓名1, 科目2, 选修, 成绩3 br ………., ………, ………, ………, ……… br 编写两个Hadoop平台上的MapRed

    2024年02月08日
    浏览(57)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包