大数据实验五 MapReduce初级编程实践
1实验目的
1.通过实验掌握基本的MapReduce编程方法;
2.掌握用MapReduce解决一些常见的数据处理问题,包括数据去重、数据排序和数据挖掘等。
2实验平台
已经配置完成的Hadoop伪分布式环境。
(1)操作系统:Linux(Ubuntu18.04)
(2)Hadoop版本:3.1.3
3实验内容和要求
1.编程实现文件合并和去重操作
- 编写程序实现对输入文件的排序
文章来源:https://www.toymoban.com/news/detail-773482.html
文章来源地址https://www.toymoban.com/news/detail-773482.html
- 对给定的表格进行信息挖掘
到了这里,关于【大数据实验五】 MapReduce初级编程实践的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!