【ES实战】ES集群节点迁移与缩容补充说明

这篇具有很好参考价值的文章主要介绍了【ES实战】ES集群节点迁移与缩容补充说明。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

【ES实战】ES集群节点迁移与缩容补充说明

【ES实战】ES集群节点迁移与缩容

1、集群的现状分析和集群的规划

(新机器部署安装角色不知道排的是否正确?)

  • 确认目前的部署方式
    • 确认项
      • master与data实例是否分离部署
      • 单机器是否部署了多个data角色实例
      • 确认服务器存储使用情况
    • 确认方式:可以通过GET _cat/nodes?v&s=ip命令和GET _cat/indices?v&s=store.size:desc命令结果来确认。
      • node.rolemdi代表masterdata未分离
      • node.rolemi代表master角色不包含data
      • node.roledi代表data角色不包含master
      • 同一个IP下出现多个包含d的代表,同一台机器下部署了多个data实例。
      • store.size代表目前主分片和副本分片一共占的存储大小。
  • 新的部署要求
    1. 若不是完全替换集群中所有的机器,则端口号与之前保持一致。
    2. master与data实例分离部署,一台机器上可以部署一个data实例和一个master。
    3. 若集群原来采用的是单机部署多个data实例,则新扩容的机器上也可以部署多个data实例
    4. 若集群未采用单机多data实例部署,则不进行单机多data实例部署。
    5. 若单机需要部署1个master+2个data实例,则服务器最低配置需要20C 128G。存储按实际情况来。

2、集群健康关注点,变化关注点

(扩容,迁移后重点关注查看哪些项?)

通过命令来查询集群的健康情况和节点实例情况

  • GET _cat/health?v:查询集群健康情况,status 值可以为green,yellow,red三种。

    • green:集群上所有索引的主分片和副本分片全部属于正常状态。
    • yellow:集群上所有索引的主分片均已正常,还存在部分副本分片为正常。
    • red:集群上存在部分主分片不正常。

    对于索引分片未正常的情况,可以参考:【ES实战】分片无法分配

  • GET _cat/nodes?v&s=ip:查询集群上节点实例的情况,检查对应的实例是否已经正确加入集群。角色(node.role)是否正确。

  • GET _cat/shards?v&s=state,ip,index:查询集群上索引分片的情况。检查集群分片的迁移情况,state不为STARTED,均需要关注。

    对于数据迁移可以参考:【ES实战】节点数据的清空

    对于索引分片无法正常的情况,可以参考:【ES实战】分片无法分配

3、集群的可缩容实例个数

(用户上报的缩容数字和预操作数不匹配的时候不知道如何处理)

  • 通过排除节点数据且不下节点的方式,将数据集中在某个数量的ES实例中,通过监控,存储,集群未发生故障,排除的节点数量代表集群目前实际可以缩容的机器数。
  • 因为集群健康度导致的资源浪费(无法正常缩容的),需要对业务对集群进行治理。治理方向主要为大分片,无用索引,无效数据生命周期等等。
  • 对于为达到最小化部署标准(3台机器),可以尝试与用户沟通进行缩容。
  • 通过告警寻找故障率较高的机器,优先缩容和替换。

4、监控指标说明

(查看集群情况promes的时候重点关注哪些项?)

  • 集群层面

    • 集群状态(cluster status)
    • 节点数(nodes)
    • 待执行任务数(pending tasks)
    • 索引个数(indices)
    • 总存储(Size)
    • 分片数(total shards)
    • 未分配分片(unassigned)
    • 正在初始化分片(initializing)
    • 正在迁移的分片(relocating)
  • 节点层面

    • 读、写、删除的tps、延迟,包括各节点的最小值、最大值、均值、当前值
    • 各节点的监控指标:cpu使用率(CPU utilization),节点负载(load average),节点内存使用(Memory useage),磁盘使用率(Disk of path usage)
    • heap使用内存(heap used)进程启动内存为31G、GC次数(GC count)、GC耗时(GC time)
    • 读、写线程的情况,rejected属性的线程数量,只增不减(重启实例重置),不一定代表当前的最大值,可代表历史最大值
      • 写数据线程:bulk线程池活跃线程数(bulk active)、index 线程池活跃线程数(index active)、bulk线程池排队的任务数(bulk queue)、index线程池排队的任务数(index queue)、拒绝的bulk任务数(bulk rejected)、拒绝的index任务数(index rejected)
      • 读数据线程:search线程池活跃线程数(search active)、get线程池活跃线程数(get active)、search线程池排队的任务数(search queue)、get线程池排队的任务数(get queue)、拒绝的search任务数(search rejected)、拒绝的get任务数(get rejected)
  • 索引层面文章来源地址https://www.toymoban.com/news/detail-409007.html

    • 索引主分片数(index primary shards)
    • 索引的副本数(index replicas)
    • 索引存储大小(Index Size)
    • 索引segment个数(Segment Count)
    • *索引segment占用内存(Segment Memory)
    • 索引写tps(Index Rate)
    • 索引读tps(Search Rate)
    • 索引refresh频率(Refresh Rate)
    • 索引Flush频率(Flush Rate)
    • 索引删除文档数(Document deleted count)
    • 索引Translog大小(transLog size)

到了这里,关于【ES实战】ES集群节点迁移与缩容补充说明的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 工作纪实36-ES跨集群迁移

    https://blog.csdn.net/andy_only/article/details/111319175 https://codeleading.com/article/40964498185/ 添加配置、重启ES https://github.com/elasticsearch-dump/elasticsearch-dump https://www.elastic.co/guide/en/logstash/6.7/plugins-inputs-elasticsearch.html?spm=a2c4e.10696291.0.0.34dd19a4GGsCSh https://bbs.huaweicloud.com/blogs/265963 https://www.51cto.

    2024年02月13日
    浏览(36)
  • ES(5)单节点集群

    PUT http://101.43.146.44:9200/users body: 返回结果 当集群中只有一个节点在运行时,意味着会有一个单节点故障问题–没有冗余。我们可以再启动一个节点防止数据丢失。

    2024年02月16日
    浏览(47)
  • ES集群部署说明

    集群(cluster) ES的一个概念就是去中心化,字面上理解就是无中心节,与集群中任何一个节点的通信和与整个集群通信是等价的。 2、节点(node) ES集群中节点粗略分为: 1)候选主节点(主要负责主节点选举,被选举成为主节点后,管理集群变更,如创建或删除索引,跟踪

    2023年04月18日
    浏览(35)
  • linux查看es节点使用情况,elasticsearch(es) 如何查看当前集群中哪个节点是主节点(master)

    elasticsearch 查看当前集群中的 master 节点是哪个需要使用 _cat 监控命令,具体如下。 查看方法 es 主节点确定命令,以 kibana 上查看示例如下: GET _cat/nodesv 返回结果示例如下: ip heap.percent ram.percent cpu load_1m load_5m load_15m node.role master name 172.16.16.188 52 99 5 2.59 1.70 1.45 mdi - elastic3

    2023年04月15日
    浏览(43)
  • Es三节点+vip集群搭建部署方案

    Es 集群架构图 ! 官网教程: https://elasticsearch.bookhub.tech/set_up_elasticsearch/installing_elasticsearch/ 确定 Es 安装目录 机器名 内网IP Es 版本 重点目录 es-node01 192.18.233.240 7.15.1 安装目录: /home/work/elasticsearch/ 数据目录: /mnt/es/esdata 快照仓库: /mnt/es/snapshot 日志目录: /mnt/logs/eslogs es-no

    2024年02月04日
    浏览(43)
  • 不可用的ES节点重启后重新加入集群

    如果一个之前不可用的ES节点重启后重新加入集群,而该节点上还有旧的数据,ES会做以下几件事: ES会发现node2上有旧的数据分片 会将node2上的分片标记为不可分配(unassigned) 会将node2上的分片数据与其他 Master eligible 节点上的 primary/replica 数据对比 如果数据不一致,ES会: 保留其他节

    2024年02月16日
    浏览(30)
  • ES踩坑记录之集群间通信异常造成节点无法加入

    公司新搭了一套ES集群,4台机器,ES版本7.5.0,前期搭建十分顺利,但集群运行一段时间后会出现问题。问题具体体现为节点间通讯异常,集群会重新选主,但选主之后只能通过新的主节点进行集群操作,其他节点无法加入主节点。 通过查询ES的日志,我们发现如下报错: 大

    2024年02月12日
    浏览(47)
  • 【ES实战】节点数据的清空

    节点数据清空处理 ES数据节点清空处理,指的就是数据的迁移,将在数据节点A的数据迁移得到其他数据节点。 可以通过动态配置 cluster.routing.allocation.exclude_ip ,来实现,以下是举例的操作步骤: 1、查询集群原来的配置 出于某种原因,集群中原来就已经排除了某些数据节点

    2024年02月05日
    浏览(25)
  • 【Elasticsearch】小白实战!ES使用Reindex迁移数据

    文章有点长,如果你想认真阅读,建议到我语雀文档上观看,格式友好 - ES 迁移工作 最近有一个需求是需要我负责将服务器A里的 ES 数据迁移到服务器B上,但是由于环境不通,所以就先在公司的测试环境和我本地上进行测试,因为之前没有接触过 ES 数据的迁移,所以上手时

    2024年02月05日
    浏览(40)
  • docker容器中快速部署ES集群的详细操作步骤(6个节点)

    ElasticSearch集群 1.集群原理 ElasticSearch是天生支持集群的,他不需要依赖其他的服务发现和注册的组件,如zookeeper这些,因为他内置了一个名字叫ZenDiscovery的模块,是ElasticSearch自己实现的一套用于节点发现和选主等功能的组件,所以ElasticSearch做起集群来非常简单,不需要太多

    2024年02月09日
    浏览(51)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包