es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

这篇具有很好参考价值的文章主要介绍了es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

中文分词器ik分词器

介绍

安装

使用分词器

Ik分词器配置文件

Mysql 热更新词库


中文分词器ik分词器

介绍

中文分词器按照中文进行分词,中文应用最广泛的是ik分词器

安装

官网下载对应版本zip

下载  放到  plugins 目录 新建 ik文件夹 考入解析zip

重启 es

//分成小单词

使用分词器

ik_max_word分成小单词

get /_analyze

{

  "analyzer":"ik_max_word",

  "text":"周日没顾上看"

}

//分成小句子

get /_analyze

{

  "analyzer":"ik_smart",

  "text":"周日没顾上看"

}

//存储用小单词存储查询用句子分词器查询

Put /myindex

{

       “mappings”:{

              “properties”:{

                     “text”:{

       “type”:”text”,

       “analyzer”:”ik_max_word”,

       “search_analyzer”:”ik_smart”

}

}

}

}

put /myindex/_doc/1

       {“text”:”中华人民共和国大会堂”}

Get /myindex/_search?q=text

       :中华人民共和国大会堂

Ik分词器配置文件

Ikkarayzer.cfg.xml

可以配置常用值,和停用值

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

自定义新词文件,可加 新索引词,和停止字典词,重启即可

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

建立 my.dic 文件写入

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

Mysql 热更新词库

因为普通的更新词库需要重启es 不合适

后端写一个接口服务,在配置中配置上远程获取服务接口

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

官方推荐实现改ik源码实现

官方推荐直接修改源码读取数据库数据

下载源码

Idea 导入项目mvaen

改源码

       Org.witea.analyzer.dic.Dictionary 160 行代码

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

加载主词典和停用词典

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

加载mysql 词典

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

加载mysql驱动

加载mysql.pom配置依赖

获取数据

打包替换jar

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

配置文件拷贝

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

Mysql驱动包拷贝

es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

 

ok

持续更新文章来源地址https://www.toymoban.com/news/detail-468946.html

到了这里,关于es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Elasticsearch学习笔记二】es的Mapping字段映射、Mapping字段常用类型、Mapping映射的创建、查看和更新、es数据迁移、ik分词器

    目录 1、Mapping字段映射概述 2、Mapping字段常用类型 3、映射中对时间类型详解 1)采取自动映射器来映射 2)手工映射提前指定日期类型 4、ES的keyword的属性ignore_above 5、Mapping映射的查看和创建 1)查看mapping信息:GET 索引名/_mapping 2)创建映射:PUT /索引名 3) 查看所有索引映

    2024年01月20日
    浏览(47)
  • es安装中文分词器 IK

    1.下载 https://github.com/medcl/elasticsearch-analysis-ik 这个是官方的下载地址,下载跟自己es版本对应的即可 那么需要下载 7.12.0版本的分词器 2.安装 1.在es的 plugins 的文件夹下先创建一个ik目录 bash cd /home/apps/elasticsearch/plugins/ mkdir ik 2.然后将下载解压后的文件放入到ik文件夹下 3.重启

    2024年02月21日
    浏览(30)
  • Elasticsearch之ik中文分词篇

    es在7.3版本已经支持中文分词,由于中文分词只能支持到单个字进行分词,不够灵活与适配我们平常使用习惯,所以有很多对应中文分词出现,最近使用的是ik分词器,就说说它吧。 安装可以百度下有很多教程,需要注意的是ik分词器的版本要跟es版本对应上,避免出现不必要

    2024年02月02日
    浏览(51)
  • 本地elasticsearch中文分词器 ik分词器安装及使用

    ElasticSearch 内置了分词器,如标准分词器、简单分词器、空白词器等。但这些分词器对我们最常使用的中文并不友好,不能按我们的语言习惯进行分词。 ik分词器就是一个标准的中文分词器。它可以根据定义的字典对域进行分词,并且支持用户配置自己的字典,所以它除了可

    2024年02月05日
    浏览(55)
  • Elasticsearch安装中文分词器IK Analyzer

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 本文介绍IK Analyzer分词器的安装配置、使用以及ES数据迁移。 克隆IK分词器项目,根据README的描述选择对应版本的分支。浏览器访问ES的ip+端口就能看到版本信息,所以我需要切到master分支。 打开pom需要

    2024年02月12日
    浏览(42)
  • Elasticsearch教程(35) ik中文分词器+pinyin拼音分词器+同义词

    闲来无事,发现上一篇ES博客还是 去年9月份 写的中文ik分词器 pinyin 首字母 search_as_you_type 组合使用,该篇文章还挖了一个 大坑 没有填,快一年了,是时候填下坑了。 针对股票查询这个特点场景,再结合一般使用者的搜索习惯,暂时确定如下7种期望效果。 上一篇博客Elast

    2023年04月09日
    浏览(31)
  • Elasticsearch7.8.0版本进阶——IK中文分词器

    通过 Postman 发送 GET 请求查询分词效果,在消息体里,指定要分析的文本 输出结果如下: 由上图输出结果可知,ES 的默认分词器无法识别中文中测试、单词这样的词汇,而是简单的将每个字拆完分为一个词,这样的结果显然不符合我们的使用要求,所以我们需要下载 ES 对应

    2024年02月01日
    浏览(32)
  • 【ELK04】ES 分词计算、IK分词器安装使用手册和热词动态更新

    本小结主要了解的内容是: 了解分词器的概念 掌握IK分词器和热词配置 ES中为了方便查询,提供多维度的查询功能,对存储在索引中的文档进行分词计算,但是文本内容不同,类型不同,语言不同分词计算逻辑就不会一样. 文本分析使Elasticsearch能够执行全文搜索,其中搜索返回所有

    2024年02月04日
    浏览(30)
  • elasticsearch安装中文分词IK启动异常:java.nio.file.AccessDeniedException

    启动错误信息如下: 问题原因:plugins中添加的ik目录没有权限; 解决方案:进入elasticsearch容器对应plugins目录下,进行 chmod 777 ik 授权即可。

    2024年02月03日
    浏览(52)
  • Elasticsearch使用系列-ES增删查改基本操作+ik分词

    ES是一个NoSql数据库应用。和其他数据库一样,我们为了方便操作查看它,需要安装一个可视化工具 Kibana。 官网: https://www.elastic.co/cn/downloads/kibana 和前面安装ES一样,选中对应的环境下载,这里选择windows环境,注意安装的版本一定要和ES的版本一致,不然可能会启动不起来。

    2024年02月01日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包