Flink Metrics监控 pushgateway搭建

这篇具有很好参考价值的文章主要介绍了Flink Metrics监控 pushgateway搭建。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Flink Metrics 简介

Flink Metrics 是 Flink 集群运行中的各项指标,包含机器系统指标,比如:CPU、内存、线程、JVM、网络、IO、GC 以及任务运行组件(JM、TM、Slot、作业、算子)等相关指标。
Flink 一共提供了四种监控指标:分别为 Counter、Gauge、Histogram、Meter。
Flink 主动方式共提供了 8 种 Report。
使用 PrometheusPushGatewayReporter 方式 通过 prometheus + pushgateway + grafana 组件搭建 Flink On Yarn 可视化监控。
当 用户 使用 Flink 通过 session 模式向 yarn 集群提交一个 job 后,Flink 会通过 PrometheusPushGatewayReporter 将 metrics push 到 pushgateway 的 9091 端口上,然后使用外部系统 prometheus 从 pushgateway 进行 pull 操作,将指标采集过来,通过 Grafana可视化工具展示出来。

2.1 配置 Reporter

链接:https://pan.baidu.com/s/1Bk0-3zLCK8Tn65QkIwVncw 
提取码:qfob 

普罗米修斯监控flink,flink,大数据,python

2.1.1 导包

将 flink-metrics-prometheus_2.11-1.13.2.jar 包导入 flink-1.13.2/bin 目录下

2.1.2 配置 Reporter

选取 PrometheusPushGatewayReporter 方式,通过在官网查询 Flink 1.13.2 Metrics 的配置后,在 flink-conf.yaml 设置,配置如下:

latency.metrics.interval: 60

metrics.reporter.promgateway.class: org.apache.flink.metrics.prometheus.PrometheusPushGatewayReporter

metrics.reporter.promgateway.host: IP地址A
metrics.reporter.promgateway.port: 9091
metrics.reporter.promgateway.jobName: flink-metrics-ppg
metrics.reporter.promgateway.randomJobNameSuffix: true
metrics.reporter.promgateway.deleteOnShutdown: false
#metrics.reporter.promgateway.groupingKey: k1=v1;k2=v2
#metrics.reporter.promgateway.interval: 60 SECONDS

2.2 部署 pushgateway

Pushgateway 是一个独立的服务,Pushgateway 位于应用程序发送指标和 Prometheus 服务器之间。

Pushgateway 接收指标,然后将其作为目标被 Prometheus 服务器拉取。可以将其看作代理服务,或者与 blackbox exporter 的行为相反,它接收度量,而不是探测它们。

2.2.1 解压 pushgateway

普罗米修斯监控flink,flink,大数据,python

2.2.2. 启动 pushgateway

进入到 pushgateway-1.4.1 目录下

./pushgateway &

查看是否在后台启动成功

ps aux|grep pushgateway

2.2.3. 登录 pushgateway webui

普罗米修斯监控flink,flink,大数据,python

2.3 部署 prometheus.2.3. 登录 pushgateway webui

Prometheus(普罗米修斯)是一个最初在 SoundCloud 上构建的监控系统。

2.3.1 解压prometheus-2.30.0

普罗米修斯监控flink,flink,大数据,python

2.3.2 编写配置文件

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
      - targets: ['IP地址A:9090']
        labels:
          instance: 'prometheus'
  - job_name: 'linux'
    static_configs:
      - targets: ['IP地址A:9100']
        labels:
          instance: 'localhost'
  - job_name: 'pushgateway'
    static_configs:
      - targets: ['IP地址A:9091']
        labels:
          instance: 'pushgateway'

2.3.3 启动prometheus

./prometheus --config.file=prometheus.yml &

启动完后,可以通过 ps 查看一下端口

ps aux|grep prometheus

2.3.4 登录prometheus webui

普罗米修斯监控flink,flink,大数据,python

2.4 部署 grafana

Grafana 是一个跨平台的开源的度量分析和可视化工具,可以通过将采集的数据查询然后可视化的展示

2.4.1 解压grafana-8.1.5

 普罗米修斯监控flink,flink,大数据,python

2.4.2 启动grafana-8.1.5     

./bin/grafana-server web &

2.4.3 登录 grafana

登录用户名和密码都是 admin

普罗米修斯监控flink,flink,大数据,python

grafana 配置中文教程:

Prometheus data source | Grafana documentation

2.4.4 配置数据源、创建系统负载监控

要访问 Prometheus 设置,请将鼠标悬停在配置(齿轮)图标上,然后单击数据源,然后单击 Prometheus 数据源,根据下图进行操作。

普罗米修斯监控flink,flink,大数据,python

 操作完成后,点击进行验证。

普罗米修斯监控flink,flink,大数据,python

2.4.5 添加仪表盘

点击最左侧 + 号,选择 DashBoard,选择新建一个 pannel

普罗米修斯监控flink,flink,大数据,python

 普罗米修斯监控flink,flink,大数据,python

至此,Flink 的 metrics 的指标展示在 Grafana 中了

使用 Lateny marker,所有需要在 flink-conf.yaml 配置参数

latency.metrics.interval

系统配置截图如下:

普罗米修斯监控flink,flink,大数据,python

全链路吞吐计算方式 :

全链路吞吐 = 单位时间处理数据数量 单位时间

提交任务到Flink on Yarn集群

# -m jobmanager 的地址
# -yjm 1024 指定 jobmanager 的内存信息
# -ytm 1024 指定 taskmanager 的内存信息
bin/flink run \
-t yarn-per-job -yjm 
4096 -ytm  8800 -s 96  \
--detached  -c com.threeknowbigdata.datastream.XgboostModelPrediction \
examples/batch/WordCount.jar  \

输入14911,点击Load

这个14911是一个其他人发布的一个Dashboard。这个id是从Grafana官方提供的Dashboard网站 https://grafana.com/grafana/dashboards/ 里找到的。以后要添加其他类型的比如flink或者mysql监控报表,都可以从这个网站找到。

如果成功就可以看到如下界面,默认都是折叠的

普罗米修斯监控flink,flink,大数据,python文章来源地址https://www.toymoban.com/news/detail-592000.html

到了这里,关于Flink Metrics监控 pushgateway搭建的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Promethus(普罗米修斯)监控系统

    Prometheus(由go语言(golang)开发)是一套开源的监控报警时间序列数据库的组合。适合监控docker容器。因为kubernetes(俗称k8s)的流行带动了prometheus的发展。 Overview | Prometheus 时间序列数据(TimeSeries Data) : 按照时间顺序记录系统、设备状态变化的数据被称为时序数据。 应用的场景很多

    2024年02月03日
    浏览(45)
  • Docker的监控-Prometheus(普罗米修斯)

    docker top   #容器的动态进程 docker stats #列出每个容器的cpu、内存、io   docker logs  #查看容器日志  emerg  alert   crit  error  warning  notice  info  debug 一、sysdig  轻量级的系统监控程序 docker run -it --rm --name sysdig --privileged=true --volume=/var/run/docker.sock:/host/var/run/docker.sock --volume=

    2024年02月06日
    浏览(35)
  • Python圈的普罗米修斯——一套近乎完善的监控系统

    普罗米修斯(Prometheus)是一个SoundCloud公司开源的监控系统。当年,由于SoundCloud公司生产了太多的服务,传统的监控已经无法满足监控需求,于是他们在2012年决定着手开发新的监控系统,即普罗米修斯。 普罗米修斯(下称普罗)的作者 Matt T.Proud 在2012年加入SoundCloud公司,他从

    2024年02月07日
    浏览(38)
  • 【云原生监控系列第一篇】一文详解Prometheus普罗米修斯监控系统(山前前后各有风景,有风无风都很自由)

    zabbix是传统的监控系统,出现比云原生早,使用的是SQL关系型数据库;而Prometheus基于谷歌的borgemon使用go语言开发,使用TSDB数据库,所以支持云原生。zabbix最新发布的6.0版本,知道自己处于生死存亡时刻,也支持了Prometheus使用的TSDB数据库。 Prometheus 是一个开源的服务监控系

    2024年02月03日
    浏览(44)
  • 完美的分布式监控系统——Prometheus(普罗米修斯)与优雅的开源可视化平台——Grafana(格鲁夫娜)

            prometheus与grafana之间是相辅相成的关系。作为完美的分布式监控系统的Prometheus,就想布加迪威龙一样示例和动力强劲。在猛的车也少不了仪表盘来观察。于是优雅的可视化平台Grafana出现了。         简而言之Grafana作为可视化的平台,平台的数据从Prometheus中取到来进

    2024年02月14日
    浏览(58)
  • grafana+prometheus+pushgateway+flink可视化实时监控

    采集层 flink APP和linux system两部分,是我们要收集指标数据的组件 传输层 Pushgateway:是一个推送收集和推送数据的组件 Node_exporter:数据导出组件 存储计算层 Prometheus:系统监控和预警框架 应用层 Grafana:可视化展示平台 浏览器打开: http://ip服务器:9090 修改配置文件 promethe

    2024年02月13日
    浏览(37)
  • actuator/prometheus使用pushgateway上传jvm监控数据

             prometheus已经部署pushgateway服务,访问{pushgateway.server:9091}可以看到面板 基于springboot引入支持组件,版本可以 开启配置          在pushgateway面板中会显示新增的服务,在prometheus中也可能看到采集的数据

    2024年02月12日
    浏览(38)
  • Kubernetes核心指标监控——Metrics Server详解

    从Kubernetes v1.8 开始,资源使用情况的监控可以通过 Metrics API的形式获取,例如容器CPU和内存使用率。这些度量可以由用户直接访问(例如,通过使用kubectl top命令),或者由集群中的控制器(例如,Horizontal Pod Autoscaler)使用来进行决策,具体的组件为Metrics Server,用来替换之

    2024年01月18日
    浏览(63)
  • 可观测性-Metrics-数据库连接池HikariCP监控

    HikariCP 其内部提供了 setMetricRegistry() 方法,让我们可以注入MetricRegistry来实现对连接池指标的收集。这样我们可以较为方便的监控连接池的运行状态。 添加依赖 示例 结果: 指标详解 对应的指标在 com.zaxxer.hikari.metrics.PoolStats 中。 指标 详解 hikaricp.connections 当前总连接数,包

    2024年02月06日
    浏览(40)
  • prometheus使用missing-container-metrics监控pod

    Kubernetes 默认情况下使用 cAdvisor 来收集容器的各项指标,足以满足大多数人的需求,但还是有所欠缺,比如缺少对以下几个指标的收集: OOM kill 容器重启的次数 容器的退出码 missing-container-metrics 这个项目弥补了 cAdvisor 的缺陷,新增了以上几个指标,集群管理员可以利用这些

    2024年02月08日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包