Hadoop大数据开发基础课后答案

这篇具有很好参考价值的文章主要介绍了Hadoop大数据开发基础课后答案。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Hadoop大数据开发基础课后答案(仅供参考)

本书为中国工信出版集团的《Hadoop大数据开发基础》

Hadoop集群的搭建与配置

一、选择题

1.HDFS中的文件块默认保存(C)份。
B.2 A.1 C.3 D.不确定
2.启动集群的顺序为(A)
① start-dfs.sh ② start-yarn.sh
③ mr-jobhistory-daemon.sh start historyserver
A.① ② ③ B.② ① ③ C.③ ② ① D.③ ① ②

3.关闭集群的顺序为(B)
① stop-dfs.sh ②stop-yarn.sh ③ m-jobhistory-daemon.sh stop historyserver
A.① ② ③ B.② ① ③ C.③ ② ① D.① ③ ②

4.YARN监控的默认端口是(B)。
A.50070端口 B.8088端口 C.19888端口 D.8080端口

5.默认端口50070的作用是(A)
A.查看HDFS监控 B.查看YARN监控 C.查看日志监控 D.不确定

6.在Linux下安装NTP服务的命令是(A)
A. yum install ntp B. yum remove ntp C. yum update ntp D. yum list

7.搭建 Hadoop集群的步骤是(A)
①克隆虚拟机
②配置 SSH免密码登录③ 格式化
④修改配置文件
⑤配置时间同步服务
A.④①②⑤③ B.③②①⑤④ C.⑤①③②④ D.②⑤④①③

8.在(A)配置文件里可以修改文件块的副本数。
A. hdfs-site.xml B.slaves D. hadoop-env.sh C. core-site.xml
9 yarn-site.xml文件的作用是(C)
A. 配置 MapReduce框架 B.配置 Hadoop 的HDFS系统的命名
C. 配置YARN 框架 D.保存子节点信息
10. 克隆虚拟机之后需要修改(B)文件。
① /etc/udev/rules.d/70-persistent-net.rules
②/etc/sysconfig/network-scriptd/ifcfg-eth0
③ /etc/sysconfig/network
A.①② B.①②③ C.②③ D.①③

Hadoop基础操作

一、选择题

1.下列(A)命令可以显示出HDFS 文件系统中在线的数据节点。
A. hdfs dfsadmin -report -live B. hdfs dfsadmin -report -active
C. hdfs dfsadmin -report-dead D. hdfs dfsadmin -report-decommissioning

2.下列(C)命令可以显示出HDFS目录/user/root/中的内容。
A. hdfs dfs -dir /user/root/ B. hdfs dfs -report /user/root/
C. hdfs dfs -ls /user/root/ D. hdfs dfs -display /user/root/

3.下列( A)命令可以下载HDFS目录/user/root/live.txt。
A. hdfs dfs -get/user/root/live.txt B. hdfs dfs -download /user/root/live.txt
C. hdfs dfs -put /user/root/live.txt D. hdfs dfs -move /user/root/live.txt

4.上传一个大小为500MB的文件 data.txt到以 Hadoop 2.6搭建的集群上。这个文件会占用(B)个HDPS 文件块。
A.3 B. 4 C.5 D.8

5.在 Hadoop官方的示例程序包hadoop-mapreduce-examples-2.6.4.jar中,封装了一些常用的测试模块。可以获得文件中单词长度的中位数的模块是(C)。
A. wordcount B. wordmean C.wordmedian D. wordstandarddeviation

6.向Hadoop集群提交MapReduce任务时,可以使用下列(C)命令。
A.hadoop submit B. hadoop put C. hadoop jar D. mapreduce jar

7.以hadoop jar提交MapReduce任务时,如果命令行中指定的输出目录已经存在,执行的结果将会是(C)。
A. 覆盖原目录 B.自动创建新目录 C.报错并中断任务 D.以上都不是

8.当提交某个 MapReduce 任务后,在任务列表中显示该任务的状态(state)值为"ACCEPTED",这表示(C)
A.正在接受中 B.正在执行中 C.等待执行中D.任务恢复中

MapReduce编程入门

一、选择题。

1.有多种浏览HDPS文件相录的方式,以下(D)是不对的
A.通过HDFS命今 B.通过Web浏览器
C.通过Eclipse中的Project Explorer D.通过SSH客户端工具

2.在词频统计(WordCount)的执行过程中,( A)模块负责进行单词的拆分与映射。
A. Mapper B. Reducer C. Driver D. Main

3.MapReduce程序最后输出的结果通常都是按键值进行排序的,那么排序工作发生在MapReducer执行过程中的(B)阶段。
A. Map B. Shufle C. Reduce D. Combiner

4.在驱动类中,(C)设置输入数据的格式。
A.使用方法 setOutputFormat B.使用方法 setOutputKeyValue
C.使用方法 setInputFormat D.使用方法 setJarByClass

5.以MapReduce统计学员的平均成绩,如果输出结果的格式为"学生姓名 平均成绩",例如"Alice 89.5",那么通过(D)选用输出键值对格式。
A.job.setOutputKeyClass(Text.class;job.setOutputValueClassText.class);
B.job.setOutputKeyClass(ntWritableclass;job.setOutputValueClassText.class);
C.job.setOutpuKeyClass(Text.class;job.setOutputValueClass(LongWritable.class);
D.job.setOutputKeyClass(Text.class);job.setOutputValueClass(DoubleWritable.class);

6.在 MapReduce程序中,Mapper模块中的自定义类MyMapper 继承自(A)父类。
A. Mapper B. Reducer C. Combiner D. Partitioner

7.在 MapReduce程序中,必须包含的模块有(C)。
A. Mapper、Combiner、Reducer B. setup、Mapper、Reducer
C. Mapper、Reducer D. Mapper、Reducer、cleanup

8.在 MapReduce 程序中,Reducer类中包括的函数有(B)。
A. startup、reduce、end B. setup、reduce、cleanup
C. start、run、reduce、end D. startup、run、end

9.有一组数据(W,2,C,2,8,S,W),如果用MapReduce程序对其中的每个元素进行计数,那么在输出的键值对结果中,键的排列顺序应该是(B)。
A.8、2、C、S、W B.2、8、C、S、W
C.C、S、W、8、2 D.2、8、W、C、S

10.在Job类中对输出键值对格式进行设置时,如果 Mapper的输出格式与Reducer的输出格式一样,那么可以省略下列(B)设置。
A.job.setOutputKeyClass()与job.setOutputValueClss()
B.job.setMapOutputKeyClass()与job.setMapOutputValueClass()
C.job.setReduceOutputKeyClass()与 job.setReduceOutputValueClass()
D.以上都不能省略

MapReduce进阶编程

一、选择题

1.下列关于Combiner 的描述,正确的是(D)。
A.在 MapReduce 作业流程中可随意添加 Combiner
B.添加了Combiner意味着 MapReduce程序的运行效率得到了优化
C.Combiner 可以代替 Reducer
D.应谨慎使用Combiner

2.下列(B)情况适合添加 Combiner。
A. MapReduce 程序求平均值 B. MapReduce 程序求和
C. MapReduce程序求中位数 D.MapReduce 程序对数据进行排序

3.下列属于 Hadoop 内置数据类型的是( D)。
A. IntegerWritable B. StringWritable C. ListWritable D. MapWritable

4.关于自定义数据类型,下列说法正确的是(D)。
A.自定义数据类型必须继承Writable 接口
B.自定义MapReduce 的key需要继承Writable接口
C.自定义 MapReduce的value需要继承WritableComparable接口
D.自定义数据类型必须实现 readFields(Datalnput datainput)方法

5.设置 MapReduce参数传递的正确方式是(C)
A.通过变量赋值进行传递
B.通过 get()和 set()方法传递
C.通过 conf.set(“argName”,args[n])传递
D.通过 job.set(“argName”,args[n])传递

6.在 Mapper类的setup 函数里,下列(D)方式可以用来获取参数值。
A.Context.get(“argName”)
B.Configuration.get(“argName”)
C.context.getConfiguration.getInt"argName")
D.context.getConfiguration.get(“argName”)

7.Hadoop序列化的特点有(A)。
A.紧凑、快速、互扩展、互操作 B.紧凑、快速 C. 互扩展 D. 互操作

8.下列说法正确的是(C)。
A.Combiner发生在 Reduce 端
B.MapReduce默认的输入格式是KeyValuelnpuFormat
C.Partitioner 的作用是对 key进行分区
D.自定义值类型需要实现 WritableComparable接口

9.MapReduce默认的输出格式是(B)
A. SequenceFileOutputFormat B. TextOutputFormat
C. NullOutputFormat D. MapFileOutputFormat

10.Hadoop JavaAPI创建文件夹的方法是(C)。
A. listStatus(Path f)B. delete(Path f)
C. mkdirs(Path f) D. open(Path f)文章来源地址https://www.toymoban.com/news/detail-472058.html

如果有什么内容有错的地方欢迎大家进行指正!!!

到了这里,关于Hadoop大数据开发基础课后答案的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基础课14——语音识别

    ASR 是自动语音识别 (Automatic Speech Recognition)的缩写,是一种将 人类语音转换为文本的技术 。ASR 系统可以处理实时音频流或已录制的音频文件,并将其转换为文本。它是一种自然语言处理技术, 广泛应用于许多领域, 包括电话语音助手、语音转文本、语音搜索等。 ASR 的工

    2024年02月03日
    浏览(30)
  • 基础课21——知识库管理

    智能客服中的知识库是一个以知识为基础的系统,可以明确地表达与实际问题相对应的知识,并构成相对独立的程序行为主体,有利于有效、准确地解决实际问题。它储存着机器人对所有信息的认知概念和理解,这些信息以数据的形式储存在数据库中,在需要的时候匹配地调

    2024年02月05日
    浏览(33)
  • 算法基础课-搜索与图论

    题目链接:842. 排列数字 - AcWing题库 思路:写的很好的题解AcWing 842. 排列数字--深度优先遍历代码+注释 - AcWing 也可以考虑使用c++自带的next_permutation函数直接秒了: 题目链接:844. 走迷宫 - AcWing题库 思路:由于bfs是一层一层扩展,所以能保证走到终点时,走过的距离最短,所

    2024年04月15日
    浏览(42)
  • 基础课18——智能客服系统架构

    基础设施主要包括以下几点: 1. 硬件设施 :包括服务器、存储设备、网络设备等,这是整个系统运行的物理基础。 2. 软件设施 :包括操作系统、数据库管理系统、自然语言处理(NLP)工具和机器学习算法等,这些是构建智能客服系统不可或缺的软件元素。 3. 数据设施 :包括

    2024年02月05日
    浏览(38)
  • 基础课23——设计客服机器人

    根据调查数据显示,使用纯机器人完全替代客服的情况并不常见,人机结合模式的使用更为普遍。在这两种模式中,不满意用户的占比都非常低,不到1%。然而,在满意用户方面,人机结合模式的用户满意度明显高于其他模式。 至于为什么人机结合模式的满意度是3种模式中最

    2024年02月05日
    浏览(25)
  • acwing算法基础课(第三讲 搜索与图论)

    void dfs(int u){ if(n == u){ for(int i = 0;i n;i++) puts(g[i]); puts(“”); return; } for(int i = 0;i n;i++){ if(!col[i] !dg[u+i] !udg[n - u + i]){ g[u][i] = ‘Q’; col[i] = dg[u+i] = udg[n - u + i] = true; dfs(u+1); col[i] = dg[u+i] = udg[n - u + i] = false; g[u][i] = ‘.’; } } } int main(){ scanf(“%d”,n); for(int i = 0;i n;i++){ for(int j = 0;j

    2024年04月10日
    浏览(41)
  • 【AcWing算法基础课】第三章 搜索与图论

    本专栏文章为本人AcWing算法基础课的学习笔记,课程地址在这。如有侵权,立即删除。 特点 :尽可能先向 纵深方向 搜索。使用 stack 实现。所需空间 O(h) (h为深度)。不具有“最短性”。 题目链接 :842. 排列数字 1.1题目描述 给定一个整数 n,将数字 1∼n 排成一排,将会有

    2024年02月12日
    浏览(53)
  • 【algorithm】算法基础课---二分查找算法(附笔记 | 建议收藏)

    🚀write in front🚀 📝个人主页:认真写博客的夏目浅石. 🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝 📣系列专栏:AcWing算法学习笔记 💬总结:希望你看完之后,能对你有所帮助,不足请指正!共同学习交流 🖊 ✉️ 如果无聊的话,就来逛逛我的博客栈吧 stack-frame.cn 关于我

    2024年01月18日
    浏览(29)
  • 【AcWing算法基础课】第五章 动态规划(未完待续)

    本专栏文章为本人AcWing算法基础课的学习笔记,课程地址在这。如有侵权,立即删除。 dp问题的优化 :在基本形式dp上作等价变形。 dp问题的解题方法 : 1)状态表示 集合 属性:最大值/最小值/数量。 2)状态计算 集合划分(不重不漏) 题目链接: 2. 01背包问题 - AcWing题库

    2024年02月12日
    浏览(34)
  • 基础课19——客服系统知识库的搭建流程

    注意:我们在做业务数据收集时,往往是甲方提供给我们的,这时就需要确定一个标准,否则对知识库梳理工作会带来很大的难度,建议和甲方沟通确认一个双方都统一的知识库原材料。 在创建知识库时,我们最常见的就是把问题分为单轮、多轮,来满足不同场景的需求,如

    2024年02月05日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包