Elasticsearch7.X集成jieba分词插件

这篇具有很好参考价值的文章主要介绍了Elasticsearch7.X集成jieba分词插件。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

  • jieba分词是中文里面比较好的分词器,而当前Elasticsearch官方没有直接集成jieba分词,需要我们通过配置plugins的方式使用jieba分词器作为es的analyzer。

一、环境介绍 :

  • centOS7
  • elasticsearch 7.9.0
  • elasticsearch-jieba-plugin-7.4.2 (简单的修改,即可适配不同版本的ES)

二、下载针对es的jieba分词插件,当前jieba分词插件对es的支持情况如图

jieba分词插件github地址
Elasticsearch7.X集成jieba分词插件

  • 本次下载的是7.4.2
    Elasticsearch7.X集成jieba分词插件

三、打包&安装&使用

1、修改文件

  • jieba分词插件没有7.9.0版本的,本次下载的是7.4.2
  • 为了适配不同版本ES需要修改 jieba 分词插件版本

根目录下的:build.gradle
主要修改 version和依赖ES的版本,例如为7.9.0的ES打包,这里都改成7.9.0
src/main/resources目录下的:plugin-descriptor.properties
主要修改 version 和 elasticsearch.version 分别表示插件的版本和支持ES的版本,同样,如果是支持7.9.0的插件,都改为7.9.0就可以。

2、自动化打包构建jieba分词插件,需要提前下载gradle工具

  • centOS7安装gradle
# 找到下载文件,解压
unzip elasticsearch-jieba-plugin-7.4.2.zip
# 进入文件夹
cd elasticsearch-jieba-plugin-7.4.2
# gradle进行编译
gradle pz

3、拷贝生成的包至Elashticsearch安装路径下的plugins路径

#创建存放 jieba 插件路径
mkdir -p plugins/elasticsearch-jieba-plugin
  • 打包好的插件在目录: ./build/distributions
cp build/distributions/elasticsearch-jieba-plugin-7.9.0.zip ${elasticsearch_home}/plugins/elasticsearch-jieba-plugin

4、解压缩文件并删除压缩包

unzip elasticsearch-jieba-plugin-7.9.0.zip
rm elasticsearch-jieba-plugin-7.9.0.zip

5、重新启动ES服务

nohup ./bin/elasticsearch >>elasticsearch.log &
  • 可以看到es启动日志,已加载jieba插件
    Elasticsearch7.X集成jieba分词插件

6、用kibana测试jieba分词

  • 繁体
GET /_analyze
{
  "analyzer": "jieba_search",
  "text": "中華人民共和國"
}

Elasticsearch7.X集成jieba分词插件

  • 中文
GET /_analyze
{
  "analyzer": "jieba_index",
  "text": "中华人民共和国"
}

Elasticsearch7.X集成jieba分词插件

四、 CentOS7安装gradle

五、 Kibana 7.9.0插件的安装

六、 ElasticSearch7.9.0集群搭建详细步骤

总结

版本不兼容的处理方法
Elasticsearch7.X集成jieba分词插件

如果此篇文章有帮助到您, 希望打大佬们能关注点赞收藏评论支持一波,非常感谢大家!
如果有不对的地方请指正!!!文章来源地址https://www.toymoban.com/news/detail-408716.html

到了这里,关于Elasticsearch7.X集成jieba分词插件的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Elasticsearch7.15.2 安装ik中文分词器后启动ES服务报错的解决办法

    下载elasticsearch ik中文分词器,在elasticsearch安装目录下的plugins文件夹下创建名为ik的文件夹,将下载的ik中文分词器解压缩到新建的ik文件夹下,再次运行 ./bin/elasticsearch启动ES服务时出现以下错误: Exception in thread \\\"main\\\" java.nio.file.NotDirectoryException: /Users/amelia/work/elasticsearch-7.1

    2024年02月12日
    浏览(60)
  • springboot集成elasticsearch7.17.3

    环境: jdk1.8 springboot: 2.7.0 spring elastisearch官方文档 1、引入es依赖 2、配置文件application.yaml 1、定义实体类 Book 2、注解: @Document 作用:标识要持久化到Elasticsearch的域对象, 如定义索引名 @Document(indexName=\\\"books\\\") @Id 作用:定义标识符 - 文档id @Id private Long id; @Field 作用:对持久化

    2024年01月25日
    浏览(50)
  • SpringBoot集成Elasticsearch7.4 实战(一)

    在网上已经有好多关于Elasticsearch的介绍,就不在翻来覆去讲一些基本概念,大家感兴趣的可以自己去找一些资料巩固下。这次只为了顾及众多首次接触Elasticsearch,案例都讲的很浅显,还有就是受个人能力所限,各位读者发现有错误之处,也可进行讨论和指出。 本篇文章主要

    2023年04月09日
    浏览(55)
  • SpringBoot集成Elasticsearch7.x(3)|(aggregations之指标聚合查询)

    章节 第一章链接: SpringBoot集成Elasticsearch7.x(1)|(增删改查功能实现) 第二章链接: SpringBoot集成Elasticsearch7.x(2)|(复杂查询) 第三章链接: SpringBoot集成Elasticsearch7.x(3)|(aggregations之指标聚合查询) 第四章链接: SpringBoot集成Elasticsearch7.x(4)|(aggregations之分桶聚合查询)

    2024年02月05日
    浏览(52)
  • ElasticSearch-集成ik分词器

    本文已收录于专栏 《中间件合集》   我们在项目中集成了ElasticSearch服务之后,需要对内容进行分词处理。这时候就需要用到分词器。其实ElasticSearch服务自身也会带有分词器。ElasticSearch服务自带的分词器是单个字进行分的。在我们的业务当中要求对整个词进行拆分。这时

    2024年02月11日
    浏览(34)
  • Spring boot 2.3.12集成ElasticSearch7.6.2并进行CRUD

    本篇博客主要讲解Spring boot 2.3.12集成ElasticSearch7.6.2并进行CRUD操作。其它版本的spring boot集成ElasticSearch类似,只需要具体各自的版本是否匹配。通过本篇博客能够成功集成ElasticSearch并进行CRUD操作,适合刚接触ElasticSearch需要进行简单CRUD操作的读者。 在集成ElasticSearch之前需要明

    2023年04月08日
    浏览(51)
  • springboot集成Elasticsearch7.16,使用https方式连接并忽略SSL证书

    千万万苦利用科学上网找到了,记录一下

    2024年02月09日
    浏览(48)
  • Elasticsearch安装分词插件[ES系列] - 第499篇

    历史文章( 文章 累计490+) 《 国内最全的Spring Boot系列之一 》 《 国内最全的Spring Boot系列之二 》 《 国内最全的Spring Boot系列之三 》 《 国内最全的Spring Boot系列之四 》 《 国内最全的Spring Boot系列之 五 》 《 国内最全的Spring Boot系列之六 》 ElasticSearch应用场景以及技术

    2024年02月02日
    浏览(43)
  • Jieba分词统计词频及自定义分词词典

    统计词频的测试文本如下: 编写代码 运行代码查看统计结果 2.1 创建词典 首先我们创建一个 user_dict.txt 文本文件,在文件中添加我们需要的词典,如下所示: 2.2 编写代码 接着我们编写代码进行词典的测试,测试的文本如下: 首先我们 不导入 自定义的分词词典,看看分词

    2024年02月13日
    浏览(38)
  • elasticsearch插件ik分词器,无法启动解决方案

    首先7以后的版本一定要与es的版本保持一致 下载包只能下载这个路径的文件,版本号与自己的es版本保持一致 https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v8.6.0/elasticsearch-analysis-ik-8.6.0.zip这里可以直接替换    docker容器无法启动,可以删除宿主机的plugins文件夹后重新

    2024年02月15日
    浏览(55)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包