从 AutoMQ Kafka 导出数据到 Databend

这篇具有很好参考价值的文章主要介绍了从 AutoMQ Kafka 导出数据到 Databend。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

作者:韩山杰

Databend Cloud 研发工程师

https://github.com/hantmac

从 AutoMQ Kafka 导出数据到 Databend,开源,数据库

Databend是使用 Rust 研发、开源的、完全面向云架构、基于对象存储构建的新一代云原生数据仓库,为企业提供湖仓一体化、计 算和存储分离的大数据分析平台。

本文将介绍如何通过 bend-ingest-kafka 将数据从 AutoMQ for Kafka 导入 Databend。

本文中提及的 AutoMQ Kafka 术语,均特指安托盟丘(杭州)科技有限公司通过 GitHub AutoMQ 组织下开源的 automq-for-kafka 项目。

环境准备

准备 Databend Cloud 以及测试数据

首先到 Databend Cloud 开启你的 Warehouse ,并在 worksheet 中创建数据库库和测试表:

create database automq_db;
create table users (
    id bigint NOT NULL,
    name string NOT NULL,
    ts timestamp,
    status string
);

准备 AutoMQ Kafka 环境和测试数据

参考 部署 AutoMQ 到 AWS▸ 部署好 AutoMQ Kafka 集群,确保 AutoMQ Kafka 与 StarRocks 之间保持网络连通。

在AutoMQ Kafka中快速创建一个名为 example_topic 的主题并向其中写入一条测试 JSON 数据,可以通过以下步骤实现:

创建Topic:

使用 Apache Kafka 命令行工具来创建主题。你需要有 Kafka 环境的访问权限,并且确保 Kafka 服务正在运行。以下是创建主题的命令:

./kafka-topics.sh --create --topic exampleto_topic --bootstrap-server 10.0.96.4:9092  --partitions 1 --replication-factor 1

注意:执行命令时,需要将 topic 和 bootstarp-server 替换为实际使用的 Kafka 服务器地址。

创建 topic 之后可以用以下命令检查 topic 创建的结果。

./kafka-topics.sh --describe example_topic --bootstrap-server 10.0.96.4:9092

生成测试数据:

生成一条简单的 JSON 格式的测试数据,和前文的表需要对应。

{
    "id":1,
    "name":"Test User",
    "ts":"2023-11-10T12:00:00",
    "status":"active"
}

写入测试数据

使用 Kafka 的命令行工具或者编程方式将测试数据写入到 example_topic。以下是使用命令行工具的一个示例:

echo '{"id": 1, "name": "测试用户", "ts": "2023-11-10T12:00:00", "status": "active"}' | sh kafka-console-producer.sh --broker-list 10.0.96.4:9092 --topic example_topic

使用如下命令可以查看刚写入的 topic 数据:

sh kafka-console-consumer.sh --bootstrap-server 10.0.96.4:9092 --topic example_topic --from-beginning

创建 bend-ingest-databend job

bend-ingest-kafka 能够监控 kafka 并将数据批量写入 Databend Table。

部署 bend-ingest-kafka 之后,即可开启数据导入 job。

bend-ingest-kafka --kafka-bootstrap-servers="localhost:9094" 
--kafka-topic="example_topic" 
--kafka-consumer-group="Consumer Group"
--databend-dsn="https://cloudapp:password@host:443" 
--databend-table="automq_db.users" --data-format="json" 
--batch-size=5 --batch-max-interval=30s

注意:将 kafka_broker_list 替换为实际使用的 Kafka 服务器地址。

参数说明

databend-dsn

Databend Cloud 提供的连接到 warehouse 的 DSN,可以参考该文档 获取。

batch-size

bend-ingest-kafka 会积攒到 batch-size 条数据再触发一次数据同步。

验证数据导入

到 Databend Cloud worksheet 中查询 automq_db.users 表,可以看到数据已经从 AutoMq 同步到 Databend Table。

从 AutoMQ Kafka 导出数据到 Databend,开源,数据库

关于 Databend

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

👨‍💻‍ Databend Cloud:databend.cn

📖 Databend 文档:databend.rs/

💻 Wechat:Databend

✨ GitHub:github.com/datafuselab…文章来源地址https://www.toymoban.com/news/detail-788228.html

到了这里,关于从 AutoMQ Kafka 导出数据到 Databend的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据库导出工具

    之前根据数据库升级需求,需要导出旧版本数据(sqlserver 6.5),利用c# winfrom写了一个小工具,导出数据。 →→→→→多了不说,少了不唠。进入正题→→→→ 连接数据库:输入数据库信息 连接成功提示: 数据库列表 根据条件查询表: 导出表 结束!!!! 大鹏一日通风起

    2024年02月10日
    浏览(43)
  • 《数据库系统概论》SQL Server 数据库导出、导入教程

    在SQL Server的使用过程中,大家难免遇到数据库表的导出、导入,从而实现用其它电脑打开数据库。 如果是使用学校实验室(机房)电脑做实验的同学,一定要掌握本技能!!! 1、右键点击数据库,“任务”,“生成脚本”,如下图 2、选择对象操作如图,“选择具体的数据

    2024年02月10日
    浏览(75)
  • (2)数据库mongodb 终端 和 vscode创建数据库 数据导入导出

    可视化工具:  Robo 3T | Free, open-source MongoDB GUI (formerly Robomongo) mongodb安装官网 :MongoDB: The Developer Data Platform | MongoDB 文档: 安装 MongoDB - MongoDB-CN-Manual (mongoing.com) 配置环境变量: 是为了扩大调用命令的范围 具体步骤 :我的电脑点右键-属性-高级系统设置-环境变量-系统变量

    2024年02月09日
    浏览(62)
  • 达梦数据库导入导出

    说明(默认值) USERID 用户名/口令 FILE 导出文件 (dexp.dmp) DIRECTORY 导出文件所在目录 FULL 整库导出 (N) OWNER 以用户方式导出 格

    2024年02月14日
    浏览(75)
  • C#将数据库数据导出为Excel

    1、创建DataChangeExcel方法 2、进行方法调用

    2024年02月16日
    浏览(38)
  • 【openGauss数据库】--运维指南03--数据导出

    👈【上一篇】 💖The Begin💖 点点关注,收藏不迷路💖 【下一篇】👉 🔰 1.1 概述 openGauss提供的 gs_dump 和 gs_dumpall 工具,能够帮助用户导出需要的数据库对象或其相关信息。通过导入工具将导出的数据信息导入至需要的数据库,可以完成数据库信息的迁移。 gs_dump 支持 导出

    2024年02月12日
    浏览(62)
  • TDengine(taos)数据库导出历史数据

    业务需求:导出某个站点的累计充电量,累计放电量,光伏总放电量,进线总功率的所有数据‘ 提示Database changed;即为使用成功; realId即为我想要导出的表,需要导出里面所有的字段; select * from yc_1680037147048042498_1011 /data.csv; 运行即可得到.csv文件; 注意导出路径里不能有

    2024年02月08日
    浏览(76)
  • mysql导出所有数据库命令

    导入所有数据库命令:  在开发过程中,我们经常会需要备份数据库,以防意外情况丢失数据,而mysql的mysqldump命令可以做到。 格式:mysqldump -u用户名 -p密码 数据库名 表名 具体要保存的路径和文件名。 下面介绍如何使用mysqldump命令导出或备份mysql数据库和数据表: 一、在

    2024年02月06日
    浏览(57)
  • C#将数据库数据导出到Excel & 将Excel文件导入到数据库

    1、读取Excel数据并写入到SQLServer数据库中; 2、将SQLServer数据库中的数据写入到Excel表中; 以下部分程序代码:  完整代码程序及配套测试数据库数据如下: https://download.csdn.net/download/XueJiaoKui/85331183 https://download.csdn.net/download/XueJiaoKui/85331183

    2024年02月16日
    浏览(46)
  • ElasticSearch数据库导出数据——(以6.8.2为例)

    我现在是有两套ES环境,一套在内网(有数据),一套在外网(没数据)。 由于开发测试需要,要将内网的数据导出到外边来进行测试。 一、预先准备 1.安装node和npm 2.安装elasticdump 外网机器在线安装 内网机器离线安装 外网准备 验证成功之后,由于内网不能在线安装,需要

    2024年02月16日
    浏览(192)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包