海豚调度任务类型Apache SeaTunnel部署指南

这篇具有很好参考价值的文章主要介绍了海豚调度任务类型Apache SeaTunnel部署指南。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

Apache DolphinScheduler已支持Apache SeaTunnel任务类型，本文介绍了SeaTunnel任务类型如何创建，任务参数，以及任务样例。

一、Apache SeaTunnel

SeaTunnel 任务类型，用于创建并执行 SeaTunnel 类型任务。worker 执行该任务的时候，会通过 start-seatunnel-spark.sh 、 start-seatunnel-flink.sh 和 seatunnel.sh 命令解析 config 文件。

二、创建任务

点击项目管理 -> 项目名称 -> 工作流定义，点击“创建工作流”按钮，进入 DAG 编辑页面；
拖动工具栏的任务节点到画板中。

三、任务参数

启动脚本：选择你想要运行任务的启动脚本，包括 seatunnel.sh, start-seatunnel-flink-13-connector-v2.sh, start-seatunnel-flink-15-connector-v2.sh, start-seatunnel-flink-connector-v2.sh, start-seatunnel-flink.sh, start-seatunnel-spark-2-connector-v2.sh, start-seatunnel-spark-3-connector-v2.sh, start-seatunnel-spark-connector-v2.sh, start-seatunnel-spark.sh
FLINK
运行模型：支持 run 和 run-application 两种模式
选项参数：用于添加 Flink 引擎本身参数，例如 -m yarn-cluster -ynm seatunnel
SPARK
部署方式：指定部署模式，cluster client
Master：指定 Master 模型，yarn local spark mesos，其中 spark 和 mesos 需要指定 Master 服务地址，例如：127.0.0.1:7077
SEATUNNEL_ENGINE
部署方式：指定部署模式，cluster local
自定义配置：支持自定义配置或从资源中心选择配置文件
脚本：在任务节点那自定义配置信息，包括四部分：env source transform sink

四、任务样例

该样例演示为使用 Flink 引擎从 Fake 源读取数据打印到控制台。

1.在 DolphinScheduler 中配置 SeaTunnel 环境
若生产环境中要是使用到 SeaTunnel 任务类型，则需要先配置好所需的环境，配置文件如下：/dolphinscheduler/conf/env/dolphinscheduler_env.sh。

2.配置 SeaTunnel 任务节点
根据上述参数说明，配置所需的内容即可。

Config 样例

env {
  execution.parallelism = 1
}

source {
  FakeSource {
    result_table_name = "fake"
    field_name = "name,age"
  }
}

transform {
  sql {
    sql = "select name,age from fake"
  }
}

sink {
  ConsoleSink {}
}

————————————————

原文链接：https://blog.csdn.net/zhengzaifeidelushang/article/details/136685864