Monitor 监控架构

这篇具有很好参考价值的文章主要介绍了Monitor 监控架构。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

采集器: 负责采集监控数据的,采集到数据之后传输给服务端,通常是直接写入时序库

对时序库的数据 :

  • 分析部分: 告警规则判断, 并进行通知
  • 可视化: 通过各种图表来合理地渲染各类监控数据

image.png

采集器

采集器:负责采集监控数据

采集器的部署方式 :

  • 跟随监控对象部署,如: 所有的机器上都部署一个采集器,采集机器的 CPU、内存、硬盘、IO、网络相关的指标
  • 远程探针式,如: 选取一个中心机器做探针,同时探测很多机器的 PING 连通性

采集器的数据,推给服务端的两种方法 :

  • 直接推给时序库
  • 先推给 Kafka,再由 Kafka 写到时序库。更复杂情况,可能会用 Kafka + Flink + 时序库
采集器 优点 缺点 推荐场景
Telegraf 指标的全家桶 不适合 Prometheus 生态 配合 InfluxDB 使用
Exporters 生态庞大 Exporter 水平参差不齐 Kubermetes
Grafana-Agent 指标, 日志, 链路统一 采集器集成不全 Kubermetes
Categraf 指标, 日志, 链路统一 采集器集成不全 物理机, 虚拟机, 容器都适用

Telegraf

Telegraf 是 InfluxData 公司的产品

  • All-In-One 采集器,支持各种采集插件
  • 与 Prometheus、Graphite、Datadog、OpenTSDB、InfluxDB 配合存储

Telegraf 采集数据多为字符串类型,这类数据推给 Prometheus,VictoriaMetrics、M3DB、Thanos (数值型时序数据) 要转为数值型存储

对于标签变化的指标 (标签非稳态结构) ,与 Prometheus 生态的时序库对接时 ,要把这类标签丢弃掉

  • 设置 Telegraf : metric_version = 2
  • drop_tag : 删除不要的标签

Exporters

Exporter : 专门对接 Prometheus 生态的组件

  • Exporter 组件众多,如: mysqld_exporter,redis_exporter,snmp_exporter,jmx_exporter

由于 Prometheus 影响较大,很多中间件都内置暴露 /metrics 监控数据的接口

  • 如: kube-apiserver、kube-proxy、kube-scheduler ,etcd,ZooKeeper、 RabbitMQ、HAProxy

Grafana-Agent

Grafana-Agent 是 Grafana 公司推出的 All-In-One 采集器

  • 能采集指标数据,也能采集日志数据 , 链路数据

Grafana-Agent 有个框架,方便导入各类 Exporter,如: Node-Exporter、Kafka-Exporter、Elasticsearch-Exporter、Mysqld-Exporter

  • 用 PUSH 方式推送监控数据,完全兼容 Node-Exporter 指标
  • 支持用 PULL 方式去抓取其他 Exporter 的数据,再通过 Remote Write 将采集到的数据转发给服务端
  • 对日志采集,集成了 Loki 生态的日志采集器 Promtail
  • 对链路数据,集成了 OpenTelemetry Collector

Categraf

Categraf 是快猫团队开源的一款监控采集器

  • 支持 metrics、logs、traces 的采集
  • 只采集数值型时序数据 (标签是稳态结构) ,通过 Remote Write 方式推送数据给后端存储(Prometheus、VictoriaMetrics、M3DB、Thanos)
  • 支持读取 prometheus.yml 的 scrape 配置,对接各类服务发现机制

时序库

时序库 优点 缺点
OpenTSDB 指标设计较灵活 基于 Hbase, Cassandra 架构较复杂
influxDB 与 Grafana , Telegraf 整合良好 只开源单机版本
TDEngine 集群爸爸开源 , 针对设备场景优化设计 不支持 Prometheus Querier 接口
M3DB 抗住大容量 , 扩展方便 对 CPU,内存要求较高 , 架构复杂
VictoriaMetrics 集群版 , 架构简单 , 支持 Prometheus Querier 接口
TimescaleDB 基于 PostgreSQL 开发 国内应用较少

OpenTSDB

OpenTSDB 出现较早,2010 年左右就有了

  • OpenTSDB 是基于 HBase 封装或 基于 Cassandra 封装

架构图 :
image.png

InfluxDB

InfluxDB 来自 InfluxData

  • 针对时序存储场景专门设计了存储引擎、数据结构、存取接口,国内使用范围较广泛
  • InfluxDB 配合 Grafana、Telegraf 使用,生态非常完备
  • InfluxDB 开源版本是单机

TDEngine

TDEngine 是国产版 InfluxDB,针对物联网设备的场景做了优化,性能很好,能配合 Grafana、Telegraf 使用

  • 集群版是开源
  • 内置支持了流式计算
  • 支持 Prometheus 的 remote_read 和 remote_write 接口

image.png

M3DB

M3DB 是 Uber 的时序数据库

  • 声称能抗住 66 亿监控指标,
  • M3DB 是全开源,但架构原理较复杂

VictoriaMetrics

VM (VictoriaMetrics) : 架构非常简单清晰,采用 merge read 方式,避免数据迁移

  • 用一批云上虚拟机,挂上云硬盘,部署 VM 集群,用单副本,是非常轻量可靠的集群方式
  • 实现了 Prometheus 的 Query 类接口,如: /api/v1/query/api/v1/query_range/api/v1/label/<label-key>/values
  • 能当 Prometheus 的 Backend,或 Prometheus 的替代品

VM 架构图 :
image.png

TimescaleDB

TimescaleDB : timescale.inc 开发的一款时序数据库,基于 PostgreSQL 设计

  • 当数据量到百亿或千亿行时,数据库性能会下降

告警引擎

告警引擎 : 处理告警规则,生成告警事件

告警引擎的两种架构 :

  • 数据触发式 : 服务端接收到监控数据后,还会发给告警引擎,告警引擎判断是否告警
  • 周期轮询式 : 架构简单,指标关联计算较容易实现。产品如: Prometheus、Nightingale、Grafana

生成事件后,给告警发送的模块

  • 该模块负责事件聚合、收敛,并通知不同的接收者
  • 告警发送的产品: PagerDuty,能接收各类事件源的事件,只用配置 OnCall 响应

数据展示

监控数据的可视化用 Grafana

  • 采用插件式架构,支持不同类型的数据源,图表非常丰富
  • 很多公司的商业化产品中,甚至直接内嵌了 Grafana
  • 新版本已修改了开源协议 (AGPLv3) ,基于 Grafana 二次开发,要公开代码

监控数据可视化的两类需求 :文章来源地址https://www.toymoban.com/news/detail-416564.html

  • 即时查询 : 临时起意,要追查监控数据
  • 监控大盘(Dashboard) : 日常巡检和问题排查,放重点关注的指标

到了这里,关于Monitor 监控架构的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • API Monitor简易使用教程 监控Windows dll调用 监控Windows API调用 查看函数名,参数类型,参数,返回值

    1、API Filter窗口:选定要监听的dll函数或windows API,可以打断点 选中并右键勾上Breakpoint 选 Before Call 2、Monitor New Process 窗口 :选择要运行的exe 3、Summary窗口:会列出所有调用的函数。点函数,查看函数名,参数类型,参数,返回值等。还能设断点。 当调用到断点的函数调用时

    2024年01月21日
    浏览(48)
  • QT上位机开发(动态数据采集与监控)

    【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】         上位机开发中,有一种类型的应用软件很特殊,它几乎没有什么交互操作,主要的工作就是检测和显示。如果说在此基础上有什么扩展的话,可能就是安全监控和报警。所以,这个上

    2024年01月22日
    浏览(44)
  • 物联网制糖工业如何数据采集与远程监控

    智慧糖厂是实现从原料处理、制糖煮炼、成品包装、码垛仓储等全生产流程的自动化智能工厂。其中多个撕解设备、压榨设备、加热设备、搅拌设备、烘干设备、分离设备等相互连接、协同工作,达到高效生产、流畅生产等目的、因此,对于制糖设备的数据采集与远程监控十

    2024年02月20日
    浏览(42)
  • 记一次SQLServer复制监控器(replication monitor)复制延迟数值为NULL的异常处理

      在SQLServer复制(订阅发布),在正常运行的情况下,发布节点一直有写入,订阅节点也正常复制到了这些数据,但分发节点的复制监控器面板(replication monitor)无法看到部分发布对象的延迟信息。如下,经过重启SQLServer服务,重启SQLServer Agent服务,重启操作系统等尝试后,

    2024年01月17日
    浏览(40)
  • HiWoo Cloud数据采集监控系统的强大实力与价值

    在数字化时代,数据已经成为企业运营的核心驱动力。然而,随着业务的发展和数据的增长,如何有效地采集、监控和管理数据成为企业面临的一大挑战。HiWoo Cloud数据采集监控系统凭借其强大的技术实力和丰富的行业经验,为企业提供了卓越的数据采集监控解决方案。通过

    2024年01月24日
    浏览(41)
  • 上位机软件wincc通过工业网关采集plc数据实现组态监控

    WinCC是一个组态软件,可以用于数据采集与监控、自动化控制、工业物联网等领域。WinCC可以帮助用户实现工厂自动化和过程自动化的解决方案,提供可视化的监控界面和数据采集分析功能,支持多种协议和设备,如Siemens、Modbus、OPC等。 如何使用WinCC采集PLC数据?工业网关可

    2024年02月15日
    浏览(45)
  • 制造业物联网革命:智慧工厂数据采集与远程监控管理

    智慧工厂是指运用现代信息技术和物联网技术,实现制造业生产过程的智能数字化。智慧工厂的工业设备不仅能够自动化运行,还可以通过网络技术帮助企业实现数据采集、远程监控与管理。4G工业网关便成为了智慧工厂通讯的重要组成部分,起到了连接工业设备和数据平台

    2024年02月11日
    浏览(50)
  • 热压机PLC数据采集远程监控物联网解决方案

                              热压机PLC数据采集远程监控物联网解决方案 热压机是制造行业中重要的设备之一,广泛应用于木材加工、纸制品生产、塑料加工等领域。随着工业自动化技术的发展,热压机的自动化程度也越来越高。然而,热压机的远程监控仍然是制造企业普遍

    2024年01月25日
    浏览(52)
  • 基于MQTT协议的物联网网关实现远程数据采集及监控

    在数字化时代的浪潮中,工业界正面临着前所未有的变革与机遇。而在这场变革中,基于MQTT协议的物联网网关崭露头角,成为连接工业设备、实现远程数据采集与监控的利器。其中,HiWoo Box作为一款出色的工业边缘网关,引领着这股数字化风潮,下面我们一起探寻其在实现远

    2024年02月11日
    浏览(60)
  • 19基础设施监控工具 Zabbix 的基本用法,包括数据采集、报警

    Zabbix 是一款免费开源的网络监控工具,可以监控各种网络设备、服务器、应用程序等,并提供报警机制。它可以在 Windows、Linux、Unix 等平台上运行,支持多种数据库(MySQL、PostgreSQL、Oracle、SQLite),同时提供了 Web 界面进行管理和监控。 Zabbix 可以通过源码或二进制包安装。

    2024年02月06日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包