TiDB 多集群告警监控-中章-融合多集群 Grafana

这篇具有很好参考价值的文章主要介绍了TiDB 多集群告警监控-中章-融合多集群 Grafana。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

 author:longzhuquan

背景

随着公司XC改造步伐的前进,越来越多的业务选择 TiDB,由于各个业务之间需要物理隔离,避免不了的 TiDB 集群数量越来越多。虽然每套 TiDB 集群均有两个详细的监控 Dashboard、Grafana,但对于运维来说几十套集群的监控、告警、巡检均需消耗巨大的精力。上篇介绍了监控工具的安装,以及业务组如何规范的设置。本章着重介绍如何将多套集群 Grafana 数据统一管理。

监控大盘介绍

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

在夜莺仪表盘-监控仪表盘界面,通过预先配置好想要查看的图表,用户在未来查看时只需点击即可直接浏览一系列图表,无需逐一选择。例如,在 MySQL 监控中,资深 DBA 可以事先将重要的图表以及应关注的图表都配置到监控大盘中。详细介绍可参考 仪表盘 介绍。

先看看单张效果

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

怎么样是不是似曾相识?没错监控大屏可以适配TiDB的 Grafana,上一篇接入数据源之后,其实夜莺即可通过查询到所有普罗米修斯的数据,也可以将 TIDB 的监控数据全部查询。前提是在此页面进行 PromQL 的编写。

优雅的 COPY TiDB 监控

前面已经看到效果,但如果按照官方一个一个的图标的编辑,那把TiDB一套集群图标编辑完,估计也过年了。那有没有更方便的方式呢?

经过我司大量的实践,已经适配出了一套常用的监控数据,并且已经提交给夜莺官方,在最新企业版“仪表盘-内置仪表盘”可以看到 TIDB 监控模版。各位可直接使用。开源版暂时未放出,不过有兴趣的需要可私聊题主,或者在文章下留言,即可得到同款模版(由于文章限制 json 文件不太好进行附件)。

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

如得到文件后点击 仪表盘-监控仪表盘-对于业务组-批量导入-导入仪表盘 JSON 即可

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

导入完成后进入图表-点击修改按钮-选择tidb_datasource-取消隐藏变量-保存

即可在页面上自由选择数据源,选择完对应数据源(数据源与业务组一一对应)后建议在隐藏此变量,达到固定效果。

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

开源互相融合

上述方式过于复杂,并且没办法完美复刻 TiDB Grafana 监控项目。我们也观察到这点,目前正在与双方沟通协调此事,最终效果达到能将 TiDB 大盘完美展现在夜莺中。目前没办法直接展现原因由于双方的 grafana 版本不适配,后续可直接 COPY。不过目前也有一些进展,以其中一个大盘为例

点击保存-保存为文件-在通过上个章节的方式导入,即可实现完整复刻。不过目前仅仅支持几个特定的JSON模版。更多模版还需适配,当然如有强烈需求也可在文章留言反馈。我们可以尽量提供JSON模版。

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

成果展示

按照不同业务组区分不同集群

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

每个业务组拥有自己的大盘以及数据源

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

并且还可以将所有集群数据融合进同一个大盘,方便DBA监掌握百台机器资源使用情况。

TiDB 多集群告警监控-中章-融合多集群 Grafana,夜莺监控,tidb,nightingale

结语

此篇介绍如何融合 Grafana ,目前看还存在一些适配性问题,但已经基本满足了需求。下篇将介绍如何补齐 TiDB 目前没有的监控指标,以及特殊需求的处理。文章来源地址https://www.toymoban.com/news/detail-813613.html

到了这里,关于TiDB 多集群告警监控-中章-融合多集群 Grafana的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Prometheus+Grafana+AlertManager监控SpringBoot项目并发送邮件告警通知

    Docker搭建并配置Prometheus Docker拉取并配置Grafana Docker安装并配置Node-Exporter Docker安装并配置cAdvisor Docker安装并运行Alertmanager 新建项目,引入依赖 新建接口,运行程序 Prometheus配置文件中已添加该项目地址,运行后到Prometheus页面中查看连接情况 成功 引入依赖 新增push接口,用于

    2024年02月11日
    浏览(32)
  • Springboot 集成Prometheus 数据采集 使用grafana 监控报告告警 邮件配置

    目录 Springboot 相关 Pom 重点包 如果有需要可以增加安全包-一般内部机房没啥事-(非必选) Application.yml配置文件-(非必选) Application.properties management.endpoints.web.exposure.include介绍 启动类 查看监控信息 Prometheus Prometheus.yml 配置 如果使用类安全包-(非必选) 启动就可以看到了

    2024年02月11日
    浏览(41)
  • Windows:prometheus + grafana + wmi_exporter+ 主机信息监控页面 + 支持主机信息告警

    下载地址:Download | Prometheus 选择对应的系统的版本下载并解压压缩包,运行程序 本人在window系统上操作 双击 验证 浏览器输入http://localhost:9090/ 点击Staatus=Targets 出现以下即成功   下载地址:Download Grafana | Grafana Labs 同理选择对应的系统下载(本人通篇均使用window系统 下载并

    2024年02月12日
    浏览(34)
  • 【Linux】部署Prometheus + Grafana简介、监控及设置告警详细操作(多种方式安装,亲测无问题)

    🍁 博主简介   🏅云计算领域优质创作者   🏅华为云开发者社区专家博主   🏅阿里云开发者社区专家博主 💊 交流社区: 运维交流社区 欢迎大家的加入! 服务器类型 IP地址 组件 Prometheus 服务器、agent 服务器、grafana 服务器 172.16.11.209 Prometheus、node_exporter、Grafana

    2024年02月13日
    浏览(32)
  • ElasticSearch监控与告警:实时监控集群健康状态

    ElasticSearch是一个开源的搜索和分析引擎,它可以为应用程序提供实时的、可扩展的搜索功能。ElasticSearch是一个分布式系统,它可以在多个节点上运行,以实现高可用性和高性能。在生产环境中,监控和告警是关键的,以确保集群的健康状态和性能。 在本文中,我们将讨论

    2024年02月20日
    浏览(31)
  • Telegraf-Influxdb-Grafana容器化部署拓展(Https、AD域、告警集成)并监控Cisco设备指标

    还记得在去年的笔记中提到过使用python的pysnmp模块,配合Influxdb,Grafana收集Cisco设备指标。链接如下:https://blog.csdn.net/tushanpeipei/article/details/117329794 。在该实例中,我们通过python编写脚本收集设备信息,并将收集的信息格式化后发送到Influxdb进行存储,最后Grfana从Influxdb中读取

    2023年04月08日
    浏览(62)
  • K8s集群nginx-ingress监控告警最佳实践

    本文分享自华为云社区《K8s集群nginx-ingress监控告警最佳实践》,作者:可以交个朋友。 nginx-ingress作为K8s集群中的关键组成部分。主要负责k8s集群中的服务发布,请求转发等功能。如果在访问服务过程中出现404和502等情况,需要引起注意。 可以通过CCE集群插件kube-prometheus-s

    2024年04月22日
    浏览(25)
  • k8s集群监控cadvisor+prometheus+grafana部署

    目录 1.新建命名空间monitor 2.部署 2.1部署cadvisor 2.2部署node_exporter 2.3部署prometheus 2.4部署rbac权限 2.5.部署 metrics 2.6部署grafana 3.测试监控效果 参考文章: k8s集群部署cadvisor+node-exporter+prometheus+grafana监控系统 - cyh00001 - 博客园 准备工作: Cluster集群节点介绍: master:192.168.136.21(以

    2024年01月16日
    浏览(41)
  • 二进制部署Prometheus + Grafana监控集群,及各exporter安装

    Prometheus三大组件: Server 主要负责数据采集和存储,提供PromQL查询语言的支持。 Alertmanager 警告管理器,用来进行报警。 Push Gateway 支持临时性Job主动推送指标的中间网关。 Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是Google B

    2024年02月13日
    浏览(37)
  • Linux 集群监控部署:prometheus + node-exporter + Grafana

    之前我们有用到top、free、iostat等等命令,去监控服务器的性能,但是这些命令,我们只针对单台服务器进行监控,通常我们线上都是一个集群的项目,难道我们需要每一台服务器都去敲命令监控吗?这样显然不是符合逻辑的,Linux中就提供了一个集群监控工具 – prometheus。

    2024年02月04日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包