【Elasticsearch】索引恢复（recovery）流程梳理之EXISTING

这篇具有很好参考价值的文章主要介绍了【Elasticsearch】索引恢复（recovery）流程梳理之EXISTING_STORE索引数据恢复。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

介绍

索引recovery是指索引数据恢复，包含以下几种类型

recovery过程包含以下几个阶段

今天我们介绍下从本地存储的数据恢复的recovery流程，后面我会另写一篇博客介绍从另一个节点恢复数据的过程。文章来源地址https://www.toymoban.com/news/detail-801434.html

更新recovery状态为index，获取最后一个提交点（commit point）的提交的segment info（segment的元数据）。如果有说明索引文件都存在，没有则抛出异常
用segment info填充recovery state中的lucene index数据，例如cat api就需要这个数据，观测recovery进度。如果是EMPTY_STORE的情况，将在目录下创建Index, translog相关的文件
进入VERIFY_INDEX阶段。如果开启index.shard.check_on_startup，则检查索引文件（默认关闭），会进行检查checksum或检查文件的每个字节，取决于这个配置
进入TRANSLOG阶段。打开新的engine,关闭GcDeletes（因为recovery时允许执行doc的CRUD，所以需要保证delete operation不会被丢失，因为delete操作执行后将没有记录。gc_delete详见https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-delete.html）
生成translog快照，遍历从local checkpoint到最后的每条数据进行回放，回放重走Lucene写入流程
执行flush来commit新写入的数据，清除translog
进入FINALIZE阶段。执行refresh，将缓冲数据写入segment，使数据可读;打开GcDeletes
如果整体流程成功，发送shard started请求给master；失败则发送shard failure