Elasticsearch分词器--空格分词器(whitespace analyzer)-Toy模板网

这篇具有很好参考价值的文章主要介绍了Elasticsearch分词器--空格分词器(whitespace analyzer)。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

介绍

文本分析，是将全文本转换为一系列单词的过程，也叫分词。analysis是通过analyzer(分词器)来实现的，可以使用Elasticearch内置的分词器，也可以自己去定制一些分词器。除了在数据写入时将词条进行转换，那么在查询的时候也需要使用相同的分析器对语句进行分析。

分词器名称	处理过程
Standard Analyzer	默认的分词器，按词切分，小写处理
Simple Analyzer	按照非字母切分(符号被过滤)，小写处理
Stop Analyzer	小写处理，停用词过滤(the, a, this)
Whitespace Analyzer	按照空格切分，不转小写
Keyword Analyzer	不分词，直接将输入当做输出
Pattern Analyzer	正则表达式，默认是\W+(非字符串分隔)

实战

1、空格分词器展示

POST：http://localhost:9200/_analyze/

{
  "analyzer": "whitespace",
  "text": "hello this my white space analyzer"
}

结果：按照空格进行分词处理

{
    "tokens":[
        {
            "token":"hello",
            "start_offset":0,
            "end_offset":5,
            "type":"word",
            "position":0
        },
        {
            "token":"this",
            "start_offset":6,
            "end_offset":10,
            "type":"word",
            "position":1
        },
        {
            "token":"my",
            "start_offset":11,
            "end_offset":13,
            "type":"word",
            "position":2
        },
        {
            "token":"white",
            "start_offset":14,
            "end_offset":19,
            "type":"word",
            "position":3
        },
        {
            "token":"space",
            "start_offset":20,
            "end_offset":25,
            "type":"word",
            "position":4
        },
        {
            "token":"analyzer",
            "start_offset":26,
            "end_offset":34,
            "type":"word",
            "position":5
        }
    ]
}

$Elasticsearch分词器--空格分词器(whitespace analyzer),Lucene\Elasticsearch学习,elasticsearch,搜索引擎,中文分词$

2、空格分词器创建与查询

目前我们有一些应用场景需要根据空格分词之后的内容进行精准查询，这样空格分词器就满足我们的需求了。

（1）创建索引，针对想要分词的字段指定空格分词器

whitespace_analyzer_1：指定为whitespace

content：指定为空格分词器

{
  "settings": {
    "analysis": {
      "analyzer": {
        "whitespace_analyzer_1": {
          "type": "whitespace"
        }
      }
    }
  },
  "mappings": {
    "_doc": {
      "properties": {
        "id": {
          "type": "keyword"
        },
        "title": {
          "type": "text"
        },
        "content": {
          "type": "text",
          "analyzer": "whitespace_analyzer_1"
        }
      }
    }
  }
}

$Elasticsearch分词器--空格分词器(whitespace analyzer),Lucene\Elasticsearch学习,elasticsearch,搜索引擎,中文分词$

（2）索引查询

保存一条数据：

{
  "id": "002",
  "title": "科目2",
  "content": "this is whitespace"
}

根据分词查询：

{
  "query": {
    "match": {
      "desc": "this"
    }
  }
}

$Elasticsearch分词器--空格分词器(whitespace analyzer),Lucene\Elasticsearch学习,elasticsearch,搜索引擎,中文分词$

根据不存在的分词查询则查询不到

{
  "query": {
    "match": {
      "desc": "that"
    }
  }
}

$Elasticsearch分词器--空格分词器(whitespace analyzer),Lucene\Elasticsearch学习,elasticsearch,搜索引擎,中文分词$ 文章来源地址https://www.toymoban.com/news/detail-756274.html

到了这里，关于Elasticsearch分词器--空格分词器(whitespace analyzer)的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Elasticsearch分词器--空格分词器(whitespace analyzer)

介绍

实战

1、空格分词器展示

2、空格分词器创建与查询

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2