flink1.18.0 flink维表join新思路

1年前作者：Thomas2143分类：Toy博客阅读(7)违法举报

这篇具有很好参考价值的文章主要介绍了flink1.18.0 flink维表join新思路。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

以往常见实现通过Lookup join来实现维表join

弊端:

虽然缓存可以减轻维表负担,但是如果事实表数据量很大,每秒千万条,维度表只有百万条,也就是说你会看到大量的无法关联的数据仍然需要查询维度表. cache缓存千万数据量内存压力又比较大, 那么怎么减轻维表数据库压力,还能做到低延迟.

新方法借助新特性: Configure Operator-level State TTL 配合 regular join + flinkCDC

以往双流join ; a join b,默认两侧状态都一直保留,虽然可以通过 table.exec.state.ttl 配置全局状态过期时间,但是不适合维度表join的场景.

新思路:

a join b(维度表) 既然新版本支持了算子级别的state,那么我们配置a的stateTTL是0,立马失效;

b的state配置为永久,即维度表数据永久不失效. 这里的b表需借助flinkCDC通过维表全量数据和后续增量过来,如果你们以前是hbase,这种方法不适合. 这样做到了状态存储了全量维表数据(前提维度表数据量不能太大)

总结: 维表支持cdc 且数据量不会太大(state存的下且性能够用) 则可以用方法2

问题:

[FLINK-34001] doc of "Configure Operator-level State TTL" error - ASF JIRA

目前测试发现文档写两侧配置ttl=0ms表示不保留状态,但是实际测试发现保留了两侧的状态,且永久保留,目前等待jira回复文章来源地址https://www.toymoban.com/news/detail-819529.html

到了这里，关于flink1.18.0 flink维表join新思路的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

58、Flink维表的实战-6种实现方式维表的join
一、Flink 专栏 Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。 1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。 2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。 3、
2024年02月02日
浏览(6)
Flink：维表 Join 难点和技术方案汇总
博主历时三年精心创作的《大数据平台架构与原型实现：数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行，点击《重磅推荐：建大数据平台太难了！给我发个工程原型吧！》了解图书详情，京东购书链接：https://item.jd.com/12677623.html，扫描左侧
2024年04月08日
浏览(7)
flink sql1.18.0连接SASL_PLAINTEXT认证的kafka3.3.1
阅读此文默认读者对docker、docker-compose有一定了解。 docker-compose运行了一个jobmanager、一个taskmanager和一个sql-client。如下：注意三个容器都映射了/opt/flink目录。需要先将/opt/flink目录拷贝到跟docker-compose.yml同一目录下，并分别重命名，如下图：三个文件夹内容是一样的，只是
2024年02月03日
浏览(11)
Flink1.18.1在CentOS7下的安装和部署
本文是Flink1.18.1在CenOS7下的安装和部署的学习笔记，记录了基本的安装步骤及参数配置，给初学者避坑用。一，安装JDK11 Flink在1.13及其之前的版本，推荐用JDK8。从Flink 1.14开始，官方推荐使用的Java版本是JDK 11，并且从Flink 1.17开始，部分依赖于Flink的第三方库已经弃用了对JDK
2024年04月16日
浏览(8)
flink1.18 广播流 The Broadcast State Pattern 官方案例scala版本
2024年01月23日
浏览(30)
【flink番外篇】15、Flink维表实战之6种实现方式-维表来源于第三方数据源
一、Flink 专栏 Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。 1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。 2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。 3、
2024年01月21日
浏览(9)
Flink1.17.0数据流
官网介绍 Apache Flink 是一个框架和分布式处理引擎，用于对无界和有界数据流进行有状态计算。Flink 被设计为在所有常见的集群环境中运行，以内存中的速度和任何规模执行计算。 1.无限流有一个开始，但没有定义的结束。它们不会在生成数据时终止并提供数据。必须连续处
2024年02月11日
浏览(11)
尚硅谷大数据Flink1.17实战教程-笔记02【Flink部署】
尚硅谷大数据技术-教程-学习路线-笔记汇总表【课程资料下载】视频地址：尚硅谷大数据Flink1.17实战教程从入门到精通_哔哩哔哩_bilibili 尚硅谷大数据Flink1.17实战教程-笔记01【Flink概述、Flink快速上手】尚硅谷大数据Flink1.17实战教程-笔记02【Flink部署】尚硅谷大数据Flink1.17实
2024年02月11日
浏览(10)
决策树模型 IBM SPSS Modeler 18.0
（该文为个人的一个记录，也许有错，可以参考下）决策树模型建立 1.点击源、Excel，在空白处得到一个Excel 点击生成的Excel，导入要处理的数据，再点确定 PS：点击上图中的预览可以查看表格数据 2.点击字段选项、类型，在空白得到一个类型图标点生成的类型图标，点
2024年02月05日
浏览(8)
尚硅谷大数据Flink1.17实战教程-笔记01【Flink概述、Flink快速上手】
尚硅谷大数据技术-教程-学习路线-笔记汇总表【课程资料下载】视频地址：尚硅谷大数据Flink1.17实战教程从入门到精通_哔哩哔哩_bilibili 尚硅谷大数据Flink1.17实战教程-笔记01【Flink概述、Flink快速上手】尚硅谷大数据Flink1.17实战教程-笔记02【Flink部署】尚硅谷大数据Flink1.17实
2024年02月09日
浏览(18)