[Spark、hadoop]Spark Streaming整合kafka实战

这篇具有很好参考价值的文章主要介绍了[Spark、hadoop]Spark Streaming整合kafka实战。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一．KafkaUtils.createDstream方式

二．KafkaUtils.createDirectStream方式

查询kafka 3.5.1使用spark-streaming-kafka,IDEA,hadoop,spark,kafka,spark,hadoop

温习

Kafka是由Apache软件基金会开发的一个开源流处理平台,它使用Scala和Java语言编写，是一个基于Zookeeper系统的分布式发布订阅消息系统，该项目的设计初衷是为实时数据提供一个统一、高通量、低等待的消息传递平台。

①、Kafka的众多优点：其优点具体：

(1)解耦。Kafka 具备消息系统的优点,只要生产者和消费者数据两端遵循接口约束，就可以自行扩展或修改数据处理的业务过程。

(2)高吞吐量、低延迟。即使在非常廉价的机器上,Kafka也能做到每秒处理几十万条消息，而它的延迟最低只有几毫秒。

(3)持久性。Kafka 可以将消息直接持久化在普通磁盘上，且磁盘读写性能优异。

(4)扩展性。Kafka 集群支持热扩展，Kafka集群启动运行后,用户可以直接向集群添加新的Kafka服务。

(5)容错性。Kafka 会将数据备份到多台服务器节点中，即使Kafka集群中的某台节点宕机，也不会影响整个系统的功能。

(6)支持多种客户端语言。Kafka 支持Java.. NET .PHP、Python等多种语言。

Kafka使用消费组(Consumer Group)的概念统了点对点消息传递模式和发布订阅消息传递模式，当Kafka使用点对点模式时，它可以将待处理的工作任务平均分配给消费组。

一．KafkaUtils.createDstream方式

1.编写SparkStreaming_Kafka_createDstream.scala

查询kafka 3.5.1使用spark-streaming-kafka,IDEA,hadoop,spark,kafka,spark,hadoop

2.切到master节点上创建topic，指定消息的类别

Cd /opt/module/kafka

bin/kafka-topics.sh --create --topic kafka_spark --partitions 3 --replication-factor 1 --zookeeper master:2181,slave1:2181,slave2:2181

查询kafka 3.5.1使用spark-streaming-kafka,IDEA,hadoop,spark,kafka,spark,hadoop

3.先运行程序，启动kafka的消息生产者

[hadoop@master kafka]$ bin/kafka-console-producer.sh --broker-list master:9092 --topic kafka_spark

查询kafka 3.5.1使用spark-streaming-kafka,IDEA,hadoop,spark,kafka,spark,hadoop

4.在master节点发送消息，可以看到控制台输出内容

kafka itcast itcast spark_kafka spark_kafka

查询kafka 3.5.1使用spark-streaming-kafka,IDEA,hadoop,spark,kafka,spark,hadoop

二．KafkaUtils.createDirectStream方式

1.编写SparkStreaming_Kafka_createDirectStream.scala并运行程序

查询kafka 3.5.1使用spark-streaming-kafka,IDEA,hadoop,spark,kafka,spark,hadoop

2.创建topic，发送消息

[hadoop@master kafka]$ bin/kafka-topics.sh --create --topic kafka_direct0 --partitions 3 --replication-factor 1 --zookeeper master:2181,slave1:2181,slave2:2181

查询kafka 3.5.1使用spark-streaming-kafka,IDEA,hadoop,spark,kafka,spark,hadoop

3.启动kafka的消费生产者

[hadoop@master kafka]$ bin/kafka-console-producer.sh --broker-list master:9092 --topic kafka_direct0

查询kafka 3.5.1使用spark-streaming-kafka,IDEA,hadoop,spark,kafka,spark,hadoop

4.在master节点发送消息，可以看到控制台输出内容

查询kafka 3.5.1使用spark-streaming-kafka,IDEA,hadoop,spark,kafka,spark,hadoop 文章来源地址https://www.toymoban.com/news/detail-809934.html

到了这里，关于[Spark、hadoop]Spark Streaming整合kafka实战的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Toy模板网

[Spark、hadoop]Spark Streaming整合kafka实战

温习

一．KafkaUtils.createDstream方式

二．KafkaUtils.createDirectStream方式

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2