前言
jieba
分词是中文里面比较好的分词器,而当前Elasticsearch官方没有直接集成jieba
分词,需要我们通过配置plugins
的方式使用jieba分词器作为es的analyzer。
一、环境介绍 :
- centOS7
- elasticsearch 7.9.0
- elasticsearch-jieba-plugin-7.4.2 (简单的修改,即可适配不同版本的ES)
二、下载针对es的jieba分词插件,当前jieba分词插件对es的支持情况如图
jieba分词插件github地址
-
本次下载的是7.4.2
三、打包&安装&使用
1、修改文件
- jieba分词插件没有7.9.0版本的,本次下载的是7.4.2
- 为了适配不同版本ES需要修改
jieba
分词插件版本
根目录下的:build.gradle
主要修改 version和依赖ES的版本,例如为7.9.0的ES打包,这里都改成7.9.0
src/main/resources目录下的:plugin-descriptor.properties
主要修改 version 和 elasticsearch.version 分别表示插件的版本和支持ES的版本,同样,如果是支持7.9.0的插件,都改为7.9.0就可以。
2、自动化打包构建jieba分词插件,需要提前下载gradle工具
- centOS7安装gradle
# 找到下载文件,解压
unzip elasticsearch-jieba-plugin-7.4.2.zip
# 进入文件夹
cd elasticsearch-jieba-plugin-7.4.2
# gradle进行编译
gradle pz
3、拷贝生成的包至Elashticsearch安装路径下的plugins路径
#创建存放 jieba 插件路径
mkdir -p plugins/elasticsearch-jieba-plugin
- 打包好的插件在目录: ./build/distributions
cp build/distributions/elasticsearch-jieba-plugin-7.9.0.zip ${elasticsearch_home}/plugins/elasticsearch-jieba-plugin
4、解压缩文件并删除压缩包
unzip elasticsearch-jieba-plugin-7.9.0.zip
rm elasticsearch-jieba-plugin-7.9.0.zip
5、重新启动ES服务
nohup ./bin/elasticsearch >>elasticsearch.log &
-
可以看到es启动日志,已加载
jieba
插件
6、用kibana测试jieba分词
- 繁体
GET /_analyze
{
"analyzer": "jieba_search",
"text": "中華人民共和國"
}
- 中文
GET /_analyze
{
"analyzer": "jieba_index",
"text": "中华人民共和国"
}
四、 CentOS7安装gradle
五、 Kibana 7.9.0插件的安装
六、 ElasticSearch7.9.0集群搭建详细步骤
总结
版本不兼容的处理方法
文章来源:https://www.toymoban.com/news/detail-408716.html
如果此篇文章有帮助到您, 希望打大佬们能
关注
、点赞
、收藏
、评论
支持一波,非常感谢大家!
如果有不对的地方请指正!!!文章来源地址https://www.toymoban.com/news/detail-408716.html
到了这里,关于Elasticsearch7.X集成jieba分词插件的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!