烂sql导致clickhouse集群memory_tracking直线飙升触发熔断

这篇具有很好参考价值的文章主要介绍了烂sql导致clickhouse集群memory_tracking直线飙升触发熔断。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

版 本 v e r s i o n   1 9 . 1 7 . 4 . 1 1     c l i c k h o u s e   集 群 , 主 要 存 日 志 数 据 与 监 控 数 据 。 架 构 为 4 台 主 机 1 2 个 实 例 数 , 数 据 为 单 副 本 。

近 日 , 该 c l i c k h o u s e 集 群 有 一 台 物 理 机 的 硬 件 ( 电 池 ) 损 坏 , 损 坏 的 硬 件 完 成 更 换 后 , 就 有 人 反 馈 数 据 查 询 异 常 , 报 D B : : E x c e p t i o n :   M e m o r y   l i m i t   ( t o t a l )   e x c e e d e d :   w o u l d   u s e   1 1 1 . 7 6   G i B   ( a t t e m p t   t o   a l l o c a t e   c h u n k   o f   5 7 6 6 8 8 0   b y t e s ) ,   m a x i m u m :   1 1 1 . 7 6   G i B  

报 错 指 向 内 存 , 看 查   c l i c k h o u s e _ m e m o r y _ t r a c k i n g   内 存 的 使 用 情 况 , 2 0 2 3 . 0 6 . 2 6   1 7 : 5 7   左 右   c l i c k h o u s e   集 群 各 个 节 点 c l i c k h o u s e _ m e m o r y _ t r a c k i n g 直 线 上 升 ( 除 了 硬 件 异 常 的 节 点 几 乎 始 终 为 0 ) , 最 终 迫 近 单 机 最 大 的 内 存 使 用 量   m a x _ m e m o r y _ u s a g e _ f o r _ a l l _ q u e r i e   的   1 2 0 G , 当 总 内 存 使 用 超 过 1 2 0 G 后 触 发 熔 断 , 中 断 请 求 , 也 就 是 上 文 提 到 的   M e m o r y   l i m i t   ( t o t a l )   e x c e e d e d

烂sql导致clickhouse集群memory_tracking直线飙升触发熔断,bigdata错误解决,sql,clickhouse,数据库

 

  c l i c k h o u s e _ g l o b a l _ t h r e a d _ a c t i v e   正 常 情 况 下 保 持 为 十 位 数 , 异 常 飙 升 至 5 千 多

烂sql导致clickhouse集群memory_tracking直线飙升触发熔断,bigdata错误解决,sql,clickhouse,数据库

 

异 常 时 间 段 c l i c k h o u s e _ q u e r y   请 求 也 有 波 动

烂sql导致clickhouse集群memory_tracking直线飙升触发熔断,bigdata错误解决,sql,clickhouse,数据库

 

2023-06-26 17:50:00 ~ 2023-06-26 18:08:00  这 段 时 间 c l i c k h o u s e 集 群 到 底 在 执 行 什 么 内 容

select query_start_time,query_duration_ms,address,read_rows,query from system.query_log where event_time  between toDateTime('2023-06-26 17:50:00') and toDateTime('2023-06-26 18:08:00') order by read_rows desc limit 10

获 取 到 的 有 用 信 息 , 有 人 执 行   ( 此 类 请 求 存 在 并 发 ) s e l e c t   *   f r o m   x x 1   U N I O N   A L L   s e l e c t   *   f r o m   x x 2   拼 接 最 近 半 年 数 据 的 烂 s q l , 相 当 于 是 1 8 2 个 表 U N I O N   A L L , 数 据 量 达 3 0 0 亿

烂sql导致clickhouse集群memory_tracking直线飙升触发熔断,bigdata错误解决,sql,clickhouse,数据库

 

异 常 时 间 段 c l i c k h o u s e 集 群 日 志 报 错   D B : : E x c e p t i o n :   C a n n o t   s c h e d u l e   a   t a s k   ( v e r s i o n   1 9 . 1 7 . 4 . 1 1   ( o f f i c i a l   b u i l d ) )   ( f r o m   1 7 2 . 2 6 . 1 8 5 . 1 8 6 : 5 1 7 0 8 )   ( i n   q u e r y :   S E L E C T   a p i   F R O M   i o v _ l o g . t _ i o v _ g w _ l o g _ l o c a l _ 2 0 2 3 0 1 2 7 ) ,   S t a c k   t r a c e , 指 向 硬 件 异 常 的 物 理 机   1 7 2 . 2 6 . 1 8 5 . 1 8 6

2023.06.26 17:57:30.120612 [ 34959 ] {a6ee5760-0b1c-410d-a6de-a5016425fe68} <Error> executeQuery: Code: 439, e.displayText() = DB::Exception: Cannot schedule a task (version 19.17.4.11 (official build)) (from 172.26.185.186:51708) (in query: SELECT api FROM iov_log.t_iov_gw_log_local_20230127), Stack trace:

( 便 于 更 好 的 观 察 各 个 指 标 , 贴 一 张 核 心 指 标 汇 总 图 )

烂sql导致clickhouse集群memory_tracking直线飙升触发熔断,bigdata错误解决,sql,clickhouse,数据库

 

原 因 大 致 清 晰 了

1 7 2 . 2 6 . 1 8 5 . 1 8 6   物 理 机 硬 件 损 坏   - >   1 7 2 . 2 6 . 1 8 5 . 1 8 6   有 巨 烂 s q l 查 询   1 8 2 个 分 布 式 表 U N I O N   A L L , 总 数 据 量 达 3 0 0 亿   - >     触 发 1 7 2 . 2 6 . 1 8 5 . 1 8 6   c l i c k h o u s e _ l o c a l _ t h r e a d   线 程 飙 高   - >   触 发     c l i c k h o u s e _ g l o b a l _ t h r e a d _ a c t i v e   线 程 飙 高   - >   c l i c k h o u s e _ m e m o r y _ t r a c k i n g   飙 高   - >   达 到   m a x _ m e m o r y _ u s a g e _ f o r _ a l l _ q u e r i e   阈 值   - >   M e m o r y   l i m i t   ( t o t a l )   e x c e e d e d   报 错   - >   轮 询 重 启 c l i c k h o u s e 集 群 业 务 恢 复

优 化 点

1 、   c l i c k h o u s e _ g l o b a l _ t h r e a d _ a c t i v e   活 跃 线 程 数 监 控 告 警

2 、 c l i c k h o u s e _ m e m o r y _ t r a c k i n g   内 存 使 用 大 小 监 控 告 警

3 、 优 化   m a x _ m e m o r y _ u s a g   单 个 S Q L 在 单 台 机 器 最 大 内 存 使 用 量

4 、 约 束 烂 s q l文章来源地址https://www.toymoban.com/news/detail-522340.html

到了这里,关于烂sql导致clickhouse集群memory_tracking直线飙升触发熔断的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Matlab显示空间不足 help memory——已解决 + Matlab上保存的数据太大,导致保存的数据显示只有1KB——已解决】

    1.当处理一些matlab矩阵数据时会出现一些错误,说 内存不足 help memory , matlab数组超过预设的最大数组大小 。创建大于此限制的数组可能需要较长时间等等这类的问题。这时候,可以从两方面入手解决。【对于我的电脑这个问题是解决了】 2.当Matlab上保存的数据太大,导致保

    2024年02月01日
    浏览(46)
  • ClickHouse集群搭建及ODBC配置

    192.168.122.100  BCEuler01 192.168.122.101  BCEuler02 192.168.122.102  BCEuler03 # systemctl disable firewalld # systemctl stop firewalld # /etc/selinux/config SELINUX=disabled 将BCEuler01设置为时钟同步源 BEEuler01的/etc/chrony.conf: 修改的部分: server 192.168.122.100 iburst allow 192.168.0.0/16 local stratum 10 BCEuler02的/etc/chrony.co

    2024年02月10日
    浏览(41)
  • ClickHouse 集群部署(不需要 Zookeeper)

    目录 一、单节点设置 1. 下载 2. 安装 3. 启动 4. 验证 二、导入示例数据集 1. 下载并提取表数据 2. 创建库表 3. 导入数据 4. 优化表 5. 查询示例 三、集群部署 0. 安装前准备 1. 安装配置 ClickHouse Keeper (1)安装 ClickHouse Server 和 ClickHouse Client (3)重启 ClickHouse (4)验证 Keeper 实例

    2024年04月25日
    浏览(28)
  • ClickHouse高可用集群分片-副本实操(四)

    目录 一、ClickHouse高可用之ReplicatedMergeTree引擎 二、 ClickHouse高可用架构准备-环境说明和ZK搭建  三、高可用集群架构-ClickHouse副本配置实操 四、ClickHouse高可用集群架构分片 4.1 ClickHouse高可用架构之两分片实操  4.2 ClickHouse高可用架构之两分片建表实操 什么是CK的副本引擎

    2023年04月20日
    浏览(36)
  • ClickHouse(二十一):Clickhouse SQL DDL操作-临时表及视图

      进入正文前,感谢宝子们订阅专题、点赞、评论、收藏!关注IT贫道,获取高质量博客内容! 🏡个人主页:含各种IT体系技术,IT贫道_Apache Doris,大数据OLAP体系技术栈,Kerberos安全认证-CSDN博客 📌订阅:拥抱独家专题,你的订阅将点燃我的创作热情! 👍点赞:赞同优秀创作

    2024年02月12日
    浏览(45)
  • ClickHouse SQL与引擎--基本使用(一)

    1.查看所有的数据库 2.创建库 3.创建本地表 4.查看表结构 5如何使用表引擎    检测函数类型(clickhouse中数据的类型) 算数函数 求和 差值     求余数   取反   绝对值 最大公约数 最小公倍数 比较函数 比较函数(始终返回0表示false 或 1表示true) 逻辑函数 逻辑操作符(返回0表

    2024年02月14日
    浏览(81)
  • ckman:非常好用的ClickHouse可视化集群运维工具

    ckman ,全称是 ClickHouse Management Console , 即 ClickHouse 管理平台。它是由擎创科技数据库团队主导研发的一款用来管理和监控 ClickHouse 集群的可视化运维工具。目前该工具已在 github 上开源,开源地址为:github.com/housepower/ckman。 我们不妨思考一下这样的场景:如果要部署一个

    2024年01月25日
    浏览(56)
  • OLAP系列:三、clickhouse Docker集群部署指南(3分片1副本模式)

    一是为了学习容器,另外也是帮助一些同学解决机器资源紧缺,能够在一台是宿主机部署一套clickhouse集群服务。 本章内容适合开发测试环境使用,生产环境还需要更多细节的处理工作,只能作为参考。 二、部署准备 1、机器准备 172.25.16.108 2、创建容器网络 3、镜像准备 1、下

    2024年02月12日
    浏览(54)
  • ClickHouse生产运维系列[部署篇]-02_Zookeeper介绍及集群安装部署

    Zookeeper是Apache开源的一个分布式框架,它主要为分布式应用提供协调服务。 Zookeeper最早由雅虎研究院开发,是Google Chubby的开源实现,后来托管到Apache,并于2010年11月正式成为Apache的顶级项目。 有个比较有意思的是,大数据生态系统里很多组件选用动物或昆虫来命名,比如我

    2024年04月09日
    浏览(39)
  • 大数据技术之Clickhouse---入门篇---SQL操作、副本

                           星光下的赶路人star的个人主页                        积一勺以成江河,累微尘以崇峻极 基本上来说传统关系型数据库(以 MySQL 为例)的 SQL 语句,ClickHouse 基本都支持, 这里不会从头讲解 SQL 语法

    2024年02月13日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包