flink1.15 维表join guava cache和mysql方面优化

7月前作者：Thomas2143 分类：Toy博客阅读(29) 违法举报

这篇具有很好参考价值的文章主要介绍了flink1.15 维表join guava cache和mysql方面优化。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

优化前 mysql响应慢,导致算子中数据输出追不上输入,导致显示cpu busy:100%

优化后效果两个图对应两个时刻:

flink1.15 维表join guava cache和mysql方面优化,总结,guava

-

flink1.15 维表join guava cache和mysql方面优化,总结,guava

-

-- 优化前
select l.id,JSON_EXTRACT(r.msg,'$$.key1') as msgv
(select id,uid from tb1 l where id=?) join (select uid,msg from tb2) r on l.uid=r.uid;

-- 优化后 分两次查询mysql 并且jdbc解析通过flink而不是mysql where的条件都创建了mysql索引
select id,uid from tb1 l where id=?  ;
select uid,msg from tb2 where uid=?  ;

guava

图中guava cache命中率是通过guava自带统计,打印出来的.

1 guava缓存数据量上限 = 类中配置的guava缓存数据上线 * task个数(即flink并行度)

缓存越久命中率越高数据越陈旧这个需要结合业务和命中率综合考虑文章来源地址https://www.toymoban.com/news/detail-798534.html

到了这里，关于flink1.15 维表join guava cache和mysql方面优化的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Flink：维表 Join 难点和技术方案汇总

博主历时三年精心创作的《大数据平台架构与原型实现：数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行，点击《重磅推荐：建大数据平台太难了！给我发个工程原型吧！》了解图书详情，京东购书链接：https://item.jd.com/12677623.html，扫描左侧

2024年04月08日
浏览(37)
【flink番外篇】15、Flink维表实战之6种实现方式-维表来源于第三方数据源

一、Flink 专栏 Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。 1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。 2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。 3、

2024年01月21日
浏览(49)
flink1.15 savepoint 超时报错 java.util.concurrent.TimeoutException

2024年02月07日
浏览(31)
使用 Alluxio 优化 EMR 上 Flink Join

业务背景痛点流式处理的业务场景，经常会遇到实时消息数据需要与历史存量数据关联查询或者聚合，比如电商常见的订单场景，订单表做为实时事实表，是典型的流式消息数据，通常会在 kafka 中，而客户信息，商品 SKU 表是维度表，通常存在业务数据库或者数仓中，是典型

2023年04月09日
浏览(26)
一种基于动态水位值的Flink调度优化算法(flink1.5以前)，等同于实现flink的Credit-based反压原理

首先说明，偶然看了个论文，发现 flink优化原来比我想象中的更简单，得到了一些启发，所以写下这篇帖子，供大家共同学习。看到的论文是《计算机科学与应用》21年11月的一篇名字就叫做：一种基于动态水位值的Flink调度优化算法。感兴趣的小伙伴可以自己看一下，很

2024年02月22日
浏览(35)
基于数据湖的流批一体：flink1.15.3与Hudi0.12.1集成，并配置基于CDH6.3.2的hive catalog

前言：为实现基于数据湖的流批一体，采用业内主流技术栈hudi、flink、CDH（hive、spark）。flink使用sql client与hive的catalog打通，可以与hive共享元数据，使用sql client可操作hive中的表，实现批流一体；flink与hudi集成可以实现数据实时入湖；hudi与hive集成可以实现湖仓一体，用flink实

2024年02月12日
浏览(40)
Flink-SQL join 优化 -- MiniBatch + local-global

问题1. 近期在开发flink-sql期间，发现数据在启动后，任务总是进行重试，运行一段时间后，container heartbeat timeout，内存溢出(GC overhead limit exceede) ，作业无法进行正常工作问题2. 未出现container心跳超时的，作业运行缓慢，超过一天，作业仍存在反压情况查看日志内容发现，出

2024年02月06日
浏览(31)
Guava Cache 介绍

Guava 是 Google 提供的一套 Java 工具包，而 Guava Cache 是该工具包中提供的一套完善的 JVM 级别高并发缓存框架；本文主要介绍它的相关功能及基本使用，文中所使用到的软件版本：Java 1.8.0_341、Guava 32.1.3-jre。缓存在很多情况下非常有用。例如，当某个值的计算或检索代价很高，

2024年02月05日
浏览(30)
【Guava笔记01】Guava Cache本地缓存的常用操作方法

这篇文章，主要介绍Guava Cache本地缓存的常用操作方法。目录一、Guava Cache本地缓存 1.1、引入guava依赖 1.2、CacheBuilder类 1.3、Guava-Cache使用案例

2024年01月23日
浏览(27)
Guava Cache介绍-面试用

Guava Cache是本地缓存，数据读写都在一个进程内，相对于分布式缓存redis，不需要网络传输的过程，访问速度很快，同时也受到 JVM 内存的制约，无法在数据量较多的场景下使用。基于以上特点，本地缓存的主要应用场景为以下几种：对于访问速度有较大要求存储的数据不经

2024年02月07日
浏览(26)