1 详细理解lucene存储结构
存储结构 :
索引(Index) :文章来源:https://www.toymoban.com/news/detail-486137.html
- 一个目录一个索引,在Lucene中一个索引是放在一个文件夹中的。
段(Segment) :文章来源地址https://www.toymoban.com/news/detail-486137.html
- 一个索引(逻辑索引)由多个段组成, 多个段可以合并, 以减少读取内容时候的磁盘IO。
- Lucene中的数据写入会先写内存的一个Buffer,当Buffer内数据到一定量后会被flush成一个Segment,每个Segment有自己独立的索引,可独立被查询,但数据永远不能被更改。这种模式避免了随机写,数据写入都是批量追加,能达到很高的吞吐量。Segment中写入的文档不可被修改,但可被删除,删除的方式也不是在文件内部原地更改,而是会由另外一个文件保存需要被删除的文档的DocID,保证数据文件不可被修改。Index的查询需要对多个Segment进行查询并对
到了这里,关于Lucene(8):Lucene底层储存结构的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!