大数据课程K3——Spark的常用案例-Toy模板网

这篇具有很好参考价值的文章主要介绍了大数据课程K3——Spark的常用案例。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

文章作者邮箱：yugongshiye@sina.cn 地址：广东惠州

▲ 本章节目的

⚪ 掌握Spark的常用案例——WordCount；

⚪ 掌握Spark的常用案例——求平均值；

⚪ 掌握Spark的常用案例——求最大值和最小值；

⚪ 掌握Spark的常用案例——TopK；

⚪ 掌握Spark的常用案例——二次排序；

一、案例——WordCount

1. 实现步骤

1. 创建spark的项目，在scala中创建项目导入spark相关的jar包。

大数据课程K3——Spark的常用案例,大数据,spark,分布式

2. 开发spark相关代码。

代码示例：

import org.apache.spark.SparkConf

import org.apache.spark.SparkContext

object WordCountDriver {

def main(args: Array[String]): Unit = {

val conf=new SparkConf().setMaster("spark://hadoop01:7077").setAppName("wordcount")

val sc=new SparkContext(conf)文章来源地址https://www.toymoban.com/news/detail-661095.html

val data=sc.textFile("hdfs://hadoop01:9000/words.txt", 2)

val result=data.flatMap { x => x.split(" ") }.map { x => (x,1) }.reduceByKey(_+_)

result.saveAsTextFile("hdfs://hadoop01:9000/wcresult")

}

3. 将写好的项目打成jar，上传到服务器，进入bin目录。

执行：spark-submit --class cn.tedu.WordCountDriver /home/software/spark/conf/wc.jar

二、案例——求平均值

案例文件：

1 16

2 74

3 51

4 35

5 44

6 95

7 5

8 29

10 60

11 13

12 99

13 7

14 26

正确答案：

代码示例一：

import org.apache.spark.SparkConf

import org.apache.spark.SparkContext

object AverageDriver {

def main(args: Array[String]): Unit = {

val conf=new SparkConf().setMaster("local").setAppName("AverageDriver")

val sc=new SparkContext(conf)

到了这里，关于大数据课程K3——Spark的常用案例的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

大数据课程K3——Spark的常用案例

▲ 本章节目的

一、案例——WordCount

1. 实现步骤

二、案例——求平均值

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2