IDEA上面书写wordcount的Scala文件具体操作

这篇具有很好参考价值的文章主要介绍了IDEA上面书写wordcount的Scala文件具体操作。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

系列文章目录

 IDEA创建项目的操作步骤以及在虚拟机里面创建Scala的项目简单介绍_intellij 创建scala

目录

系列文章目录

1、编写Scala程序

2、更换pom.xml文件

3、更新Maven的依赖文件

4、执行代码即可

总结


前言

本文主要在上述文章的基础上编辑和创建一个WordCount应用程序

创建wordcount项目

1、编写Scala程序

import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf

object WordCount {
  def main(args: Array[String]) {
    val inputFile =  "file:///home/hadoop/wordcount/word.txt"
    val conf = new SparkConf().setAppName("WordCount").setMaster("local")
    val sc = new SparkContext(conf)
    val textFile = sc.textFile(inputFile)
    val wordCount = textFile.flatMap(line => line.split(" ")).map(word => (word, 1)).reduceByKey((a, b) => a + b)
    wordCount.foreach(println)
  }
}

2、更换pom.xml文件

<?xml version="1.0" encoding="UTF-8"?>
<project xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://maven.apache.org/POM/4.0.0">
<modelVersion>4.0.0</modelVersion>
<groupId>dblab</groupId>
<artifactId>WordCount</artifactId>
<version>1.0-SNAPSHOT</version>
<properties>
<spark.version>2.1.0</spark.version>
<scala.version>2.11</scala.version>
</properties>
<dependencies>
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-core_${scala.version}</artifactId>
<version>${spark.version}</version>
</dependency>
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-streaming_${scala.version}</artifactId>
<version>${spark.version}</version>
</dependency>
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-sql_${scala.version}</artifactId>
<version>${spark.version}</version>
</dependency>
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-hive_${scala.version}</artifactId>
<version>${spark.version}</version>
</dependency>
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-mllib_${scala.version}</artifactId>
<version>${spark.version}</version>
</dependency>
</dependencies>
<build>
<plugins>
<plugin>
<groupId>org.scala-tools</groupId>
<artifactId>maven-scala-plugin</artifactId>
<version>2.15.2</version>
<executions>
<execution>
<goals>
<goal>compile</goal>
<goal>testCompile</goal>
</goals>
</execution>
</executions>
</plugin>
<plugin>
<artifactId>maven-compiler-plugin</artifactId>
<version>3.6.0</version>
<configuration>
<source>1.8</source>
<target>1.8</target>
</configuration>
</plugin>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-surefire-plugin</artifactId>
<version>2.19</version>
<configuration>
<skip>true</skip>
</configuration>
</plugin>
</plugins>
</build>
</project>

3、更新Maven的依赖文件

选择任意位置设置maven 里面的generate即下面框选的内容

IDEA上面书写wordcount的Scala文件具体操作

4、执行代码即可

IDEA上面书写wordcount的Scala文件具体操作

可以看到上述统计出来的结果。 

总结

以上就是今天的内容~

最后欢迎大家点赞👍,收藏⭐,转发🚀,
如有问题、建议,请您在评论区留言💬哦。文章来源地址https://www.toymoban.com/news/detail-505689.html

到了这里,关于IDEA上面书写wordcount的Scala文件具体操作的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • IDEA创建jsp文件具体步骤

    1. 创建普通项目 2.文件-项目结构-模块,点击+号,选择web 点击确认 3.配置工件 4.配置tomcat 点击确定 5.创建jsp文件,注意创建位置 6.然后换调试位置 注意此时不能有其他的web项目运行,否则就选不了路径 完成后运行即可

    2024年04月16日
    浏览(33)
  • idea查看git提交的具体文件

    前两天遇到个问题,能查看git提交的历史记录,但是具体提交了哪些文件看不到了,以前是一直可以看到的,花了好几天时间没有解决,最后还是无聊的时候手贱,误打误撞解决了,废话不多说,直接上图 解决前: 解决后

    2024年02月15日
    浏览(40)
  • MapReduce WordCount程序实践(IDEA版)

    Linux:Hadoop2.x Windows:jdk1.8、Maven3、IDEA2021 编程分析 编程分析包括: 1.数据过程分析:数据从输入到输出的过程分析。 2.数据类型分析:Map的输入输出类型,Reduce的输入输出类型; 编程分析决定了我们该如何编写代码。 新建Maven工程 打开IDEA–点击File–New–Project 选择Maven–点

    2024年02月03日
    浏览(32)
  • Spark-用IDEA编写wordcount demo

    Spark版本:3.2.0 Scala版本:2.12.12 JDK:1.8 Maven:3.6.3

    2024年02月15日
    浏览(29)
  • 在IDEA上面连接Sql Server教程

    使用的IDEA为2021版,Sql Server为2012版。 之前进行用IDEA连接Sql Server,一直失败。网上找了很多教程,试了一下午,终于连接成功了,在此分享一下我的连接教程。 1、打开IDEA,点击右侧Database,再点击左侧加号。 2、点击Data Source,选择Microsoft SQL Server。  3、输入Port,User,Password,分别

    2024年02月11日
    浏览(31)
  • ubuntu22.04服务器的双网卡绑定的具体操作步骤和配置文件

    ubuntu22.04服务器的双网卡绑定具体步骤可以分成以下五步,下面按步骤操作 将原内容 修改为 这种方式为自动获取IP的方式,系统将通过连接的DHCP服务器自动获取其IP地址,其中enp1s0,enp7s0为网卡名称,通过ifconfig命令查看 或者使用以下的内容替换对应的IP地址,可以设置固定的局域网

    2024年02月09日
    浏览(56)
  • Scala入门,idea关联Scala

    创建maven项目 配置maven仓库 添加Scala插件 添加相关依赖 添加scala的SDK 需要将其提前安装好:安装Scala 创建Scala文件 阶乘 素数 列表中最大的数 计算列表中所有的和 遍历列表 判断天气 九九乘法表 Scala的类可以使用class类定义,用法与 Java 类定义相似。类可以包含成员变

    2024年02月11日
    浏览(35)
  • 【IDEA+Spark Streaming 3.4.1+Dstream监控套接字流统计WordCount保存至MySQL8】

    把DStream写入到MySQL数据库中 Spark 3.4.1 MySQL 8.0.30 sbt 1.9.2 需要基于Spark Streaming 将实时监控的套接字流统计WordCount结果保存至MySQL 提示:本项目通过sbt控制依赖 在Spark应用中,外部系统经常需要使用到Spark DStream处理后的数据,因此,需要采用输出操作把DStream的数据输出到数据库

    2024年02月14日
    浏览(34)
  • 【Scala入门】Scala下载及安装(Windows)以及Idea创建第一个scala项目

    目录 一、安装准备 二、Scala下载安装 三、Idea 创建Scala项目 在安装之前,确保你的电脑上装有Jdk 8(Jdk 1.8),且环境变量配置正确。如果没有安装Jdk,请参照其他文章先安装Jdk 8(Jdk 1.8)。 (1)确认环境变量方法:使用Win + R 快捷键调出下面窗口,输入“cmd”,按下回车。

    2024年02月05日
    浏览(40)
  • Idea配置Scala开发环境

    1.首先安装scala插件: File---Setting----plugins,在输入框中输入scala,然后点击“Install”即可安装scala,需要稍微等待几分钟。  2 创建项目: File ----new----project-----Maven---Next----输入名称(test)----finish. 3 配置scala运行环境: 在新建的项目上右键------“Add FrameWorkSuppor”-------选中scala-

    2024年02月13日
    浏览(28)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包