ElasticSearch中实现模糊查询效果(类似数据库中like功能)

这篇具有很好参考价值的文章主要介绍了ElasticSearch中实现模糊查询效果(类似数据库中like功能)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

ElasticSearch中实现模糊查询效果(类似数据库中like功能)

场景:

业务要求提供一个es查询功能,实现类似模糊查询效果,并且命中字段显示红色。举例说明:

es中字段内容 输入(即关键字) 是否输出
你好,中国,强大的祖国 中国 是(则‘中国’两个字飘红)
你好,中国,强大的祖国 俄国
你好,中国,强大的祖国 最大

实现方式:

这种实现方式主要是用es的query_string查询方式,不过需要对输入条件做区分处理才能实现模糊查询效果。

首先,先复习一下query_string查询方式的特点:

{
	"query": {
		"query_string": {
			"query": "中国"
		}
	},
	"size": 10,
	"from": 0,
	"sort": []
}
pom依赖:

我用的elasticsearch版本是6.8.1,springboot版本是2.3.5.RELEASE,因此pom依赖的版本不对,需要先排除再引入正确的包。

    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
        <exclusions>
            <exclusion>
                <artifactId>spring-data-elasticsearch</artifactId>
                <groupId>org.springframework.data</groupId>
            </exclusion>
        </exclusions>
    </dependency>
    <dependency>
        <groupId>org.springframework.data</groupId>
        <artifactId>spring-data-elasticsearch</artifactId>
        <version>3.2.6.RELEASE</version>
    </dependency>
代码:
import org.apache.commons.lang3.StringUtils;
import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.client.core.CountRequest;
import org.elasticsearch.client.core.CountResponse;
import org.elasticsearch.index.query.BoolQueryBuilder;
import org.elasticsearch.index.query.QueryBuilder;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.search.SearchHit;
import org.elasticsearch.search.builder.SearchSourceBuilder;
import org.elasticsearch.search.fetch.subphase.highlight.HighlightBuilder;
import org.elasticsearch.search.fetch.subphase.highlight.HighlightField;
import org.springframework.stereotype.Service;

import javax.annotation.Resource;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.LinkedList;
import java.util.List;
import java.util.Map;

/**
 * 弹性搜索核心服务
 *
 * @author lukou
 * @date 2023/05/15
 */
@Service
public class ElasticSearchCoreService {

    /**
     * 常量和
     */
    private static final String CONSTANT_AND = " AND ";
    /**
     * 常量不
     */
    private static final String CONSTANT_NOT = " NOT ";
    /**
     * 常量或
     */
    private static final String CONSTANT_OR = " OR ";

    @Resource
    private RestHighLevelClient restHighLevelClient;

    /**
     * 通过query_string方法查询统计
     *
     * @param index   指数
     * @param keyword 关键字
     * @return {@link CountResponse}
     * @throws IOException ioexception
     */
    public CountResponse queryCount(String index, String keyword) throws IOException {
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        searchSourceBuilder.query(this.queryString(keyword));
        CountRequest request = new CountRequest(index);
        request.source(searchSourceBuilder);
        return restHighLevelClient.count(request, RequestOptions.DEFAULT);
    }

    /**
     * 通过query_string方法查询搜索
     *
     * @param index   指数
     * @param keyword 关键字
     * @param from    起始位置
     * @param size    大小
     * @return {@link SearchResponse}
     * @throws IOException ioexception
     */
    public SearchResponse querySearch(String index, String keyword, int from, int size) throws IOException {
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        searchSourceBuilder.query(this.queryString(keyword)).highlighter(redHighlightBuilder())
                .from(from)
                .size(size);
        SearchRequest request = new SearchRequest(index);
        // preference解决分页数据不准确的问题(和分片有关系)
        request.source(searchSourceBuilder).preference(String.valueOf(keyword.hashCode()));
        return restHighLevelClient.search(request, RequestOptions.DEFAULT);
    }

    /**
     * 通过query_string方法查询字符串
     * 按照逻辑表达式切割(AND OR NOT)
     *
     * <pre>
     * "123 AND abc"
     * "123 OR abc"
     * "123 NOT abc"
     * "NOT 123 NOT abc"
     * </pre>
     *
     * @param key 关键
     * @return {@link QueryBuilder}
     */
    public QueryBuilder queryString(String key) {
        //Bool查找
        BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
        if (StringUtils.contains(key, CONSTANT_AND)) {
            // 包含AND
            String[] keys = key.split(CONSTANT_AND);
            for (String s : keys) {
                boolQueryBuilder.must(QueryBuilders.queryStringQuery(convert(s)));
            }
            return boolQueryBuilder;
        } else if (StringUtils.contains(key, CONSTANT_OR)) {
            String[] keys = key.split(CONSTANT_OR);
            for (String s : keys) {
                boolQueryBuilder.should(QueryBuilders.queryStringQuery(convert(s)));
            }
            return boolQueryBuilder;
        } else if (StringUtils.contains(key, CONSTANT_NOT)) {
            List<String> keys = new ArrayList<>(Arrays.asList(key.split(CONSTANT_NOT)));
            if (keys.get(0).startsWith("NOT ")) {
                keys.set(0, keys.get(0).replaceAll("Not ", ""));
                for (String s : keys) {
                    boolQueryBuilder.mustNot(QueryBuilders.queryStringQuery(convert(s)));
                }
                return boolQueryBuilder;
            }
            String keyword = keys.remove(0);
            boolQueryBuilder.must(QueryBuilders.queryStringQuery(convert(keyword)));
            for (String s : keys) {
                boolQueryBuilder.mustNot(QueryBuilders.queryStringQuery(convert(s)));
            }
            return boolQueryBuilder;
        }
        boolQueryBuilder.must(QueryBuilders.queryStringQuery(convert(key)));
        return boolQueryBuilder;
    }

    /**
     * 转换
     * 判断是不是字母、数字、汉字
     *
     * @param key 关键
     * @return {@link String}
     */
    public String convert(String key) {
        //在执行查询时,搜索的词不会被分词器分词,而是直接以一个短语的形式查询
        String res = "\"" + key + "\"";
        if (key.matches("^[A-Za-z0-9]*$")) {
            res = "*" + key + "*";
        }
        if (key.matches("^[\u4e00-\u9fa5][A-Za-z0-9]*$")) {
            res = key + "*";
        }
        return res;
    }

    /**
     * 红色突出显示生成器
     *
     * @return {@link HighlightBuilder}
     */
    public HighlightBuilder redHighlightBuilder() {
        HighlightBuilder highlightBuilder = new HighlightBuilder();
        //高亮的字段
        highlightBuilder.field("*");
        //是否多个字段都高亮
        highlightBuilder.requireFieldMatch(true);
        //前缀后缀
        highlightBuilder.preTags("<span style='color:red'>");
        highlightBuilder.postTags("</span>");
        return highlightBuilder;
    }

    /**
     * 构建突出标记
     *
     * @param hits 支安打
     * @return {@link List}<{@link Map}<{@link String}, {@link Object}>>
     */
    public List<Map<String, Object>> buildHighlightTags(SearchHit[] hits) {
        //解析结果
        List<Map<String, Object>> result = new LinkedList<>();
        for (SearchHit hit : hits) {
            //解析高亮的字段
            //获取高亮字段
            Map<String, HighlightField> highlightFields = hit.getHighlightFields();
            Map<String, Object> sourceAsMap = hit.getSourceAsMap();
            for (String s : highlightFields.keySet()) {
                if (s != null) {
                    sourceAsMap.put(s, highlightFields.get(s).getFragments()[0].toString());//替换掉原来的内容
                }
            }
            result.add(sourceAsMap);
        }
        return result;
    }
}
测试:
import org.elasticsearch.action.search.SearchResponse;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;

import javax.annotation.Resource;
import java.io.IOException;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

@RestController
public class TestController {

    @Resource
    private ElasticSearchCoreService elasticSearchCoreService;

    @GetMapping("/test")
    public Map<String, Object> test(String index, String keyword) throws IOException {
        SearchResponse searchResponse = elasticSearchCoreService.querySearch(index, keyword, 0, 10);
        long total = searchResponse.getHits().getTotalHits();
        List<Map<String, Object>> mapList = elasticSearchCoreService.buildHighlightTags(searchResponse.getHits().getHits());
        Map<String, Object> result = new HashMap<>();
        result.put("total", total);
        result.put("data", mapList);
        return result;
    }
}
造数据:

新建索引tmp_1以及插入5条数据

PUT http://localhost:9200/tmp_1

{
	"settings": {
		"number_of_shards": 1,
		"number_of_replicas": 0
	},
	"mappings": {
		"_doc": {
			"properties": {
				"@timestamp": {
					"type": "date"
				},
				"@version": {
					"type": "text",
					"fields": {
						"keyword": {
							"type": "keyword",
							"ignore_above": 256
						}
					}
				},
				"name": {
					"type": "keyword"
				},
				"sfz": {
					"type": "text"
				},
				"content": {
					"type": "text"
				},
				"address": {
					"type": "text"
				}
			}
		}
	}
}
POST http://localhost:9200/tmp_1/_doc

{
	"@version": "1",
	"@timestamp": "2020-06-19T09:06:26.446Z",
	"name": "唐伯虎",
	"sfz": "3212111990018989",
	"content": "当你无话可说的时候就别说话,在你不知如何回答别人的话的时候就保持沉默,这就是生活中一个很好的策略",
	"address": "江苏省南京市"
}
POST http://localhost:9200/tmp_1/_doc

{
	"@version": "1",
	"@timestamp": "2020-06-19T09:06:26.446Z",
	"name": "唐伯龙",
	"sfz": "3212111990018989",
	"content": "凡事都有偶然的凑巧,结果却又如宿命的必然",
	"address": "江苏省无锡市"
}
POST http://localhost:9200/tmp_1/_doc

{
	"@version": "1",
	"@timestamp": "2020-06-19T09:06:26.446Z",
	"name": "唐小虎",
	"sfz": "321211199709227654",
	"content": "一个人如果刻意逃避他所惧怕的东西,到头来会发现自己只是抄了近路去见它",
	"address": "江苏省苏州市"
}
POST http://localhost:9200/tmp_1/_doc

{
	"@version": "1",
	"@timestamp": "2020-06-19T09:06:26.446Z",
	"name": "李小龙",
	"sfz": "1234211186709222348",
	"content": "虫子被踩后缩起来,这是明智的,它借此减少重新被踩的概率。用道德的语言就叫:谦恭",
	"address": "江苏省常州市"
}
POST http://localhost:9200/tmp_1/_doc

{
	"@version": "1",
	"@timestamp": "2020-06-19T09:06:26.446Z",
	"name": "李四",
	"sfz": "436754187709087623",
	"content": "你好,1234,你好5678",
	"address": "上海市"
}
调用接口:
http://localhost:8081/test?index=tmp_1&keyword=你好
# 响应
{
    "total": 1,
    "data": [
        {
            "@timestamp": "2020-06-19T09:06:26.446Z",
            "address": "上海市",
            "sfz": "436754187709087623",
            "@version": "1",
            "name": "李四",
            "content": "<span style='color:red'>你</span><span style='color:red'>好</span>,1234,<span style='color:red'>你</span><span style='color:red'>好</span>5678"
        }
    ]
}
http://localhost:8081/test?index=tmp_1&keyword=唐小虎
# 响应
{
    "total": 1,
    "data": [
        {
            "@timestamp": "2020-06-19T09:06:26.446Z",
            "address": "江苏省苏州市",
            "sfz": "321211199709227654",
            "@version": "1",
            "name": "<span style='color:red'>唐小虎</span>",
            "content": "一个人如果刻意逃避他所惧怕的东西,到头来会发现自己只是抄了近路去见它"
        }
    ]
}

测试场景没有全面覆盖,如有错误,欢迎指正。文章来源地址https://www.toymoban.com/news/detail-532717.html

到了这里,关于ElasticSearch中实现模糊查询效果(类似数据库中like功能)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • JavaWeb04(登录&绑值&模糊查询&功能实现&连接数据库)

    目录 一.实现登录功能  2.2 制作简易验证码 2.3 完成登录验证 2.4 登录实现 ①连接字符串 private static final String URL=\\\"jdbc:oracle:thin:@localhost:1521:orcl\\\"; ②加载驱动  OracleDriver private static final String URL=\\\"jdbc:oracle:thin:@localhost:1521:orcl\\\";      二.实现表格版的绑定数据 2.1 效果预览 2.2 代

    2024年02月02日
    浏览(52)
  • 微信小程序 连接云数据库(不使用云函数)进行 登录、注册、查询(包括模糊查询)快速实现 亲测可用

    当连接MySQL的时候总是出现各种各样的小问题,可以选用微信小程序自带的云数据库 注:测试号不能建立云数据库 按图中步骤来 第4步中,有两种添加方式 第一种 第二种 注意: 如果你是粘贴复制的,他会报错 非数字字符\\\"无法使用外部字符串表示法位于第1行 。这时,在第

    2023年04月20日
    浏览(60)
  • ES 实现数据库or查询效果

    ES :有两种常用查询           must   必须满足查询条件         should 非必须满足查询条件  如果想实现类似与mysql中的or 查询效果,必须使用should查询。但是shuold 会查询出不满足条件的数据 ,这必须加一个属性 \\\"minimum_should_match\\\": \\\"1\\\" 必须满足should条件中的一个查询

    2024年02月11日
    浏览(39)
  • 如何玩mysql5.7实现分词查询,来实现类似ES的效果

    背景:在做海外主数据项目的时候,PM提出了一个需求,说是类似于搜索的功能。但是需要实现根据输入的字符串进行相似度的查询,并且计算出输入的字符串与查出的字符串的相似度是多少。 思考:第一次听到需求的时候感觉还挺简单的,以为不就是个迷糊查询吗?但仔细

    2024年02月01日
    浏览(40)
  • Elasticsearch模糊查询

    Elasticsearch模糊查询 不计算相关度评分 前缀搜索匹配的是term,而不是field。即搜索倒排索引 前缀搜索的性能很差 前缀搜索没有缓存 前缀搜索尽可能把前缀长度设置的更长命中索引越少,性能会好 要注意分词器,如果分词器分词了会导致前缀匹配失败.尤其是中文要设置中文分词

    2024年02月12日
    浏览(40)
  • Elasticsearch模糊查询之Wildcard

    在 Elasticsearch 中,Wildcard 查询通常用于在文本中查找匹配通配符模式的词语。Wildcard 查询是一种基于通配符的查询,它使用单个字符(?)代表一个字符,使用星号(*)代表零个或多个字符。 Wildcard 查询可用于对单个词执行模糊匹配,也可以用于对短语进行模糊匹配。它可

    2024年02月14日
    浏览(41)
  • ElasticSearch中文分词和模糊查询

            ElasticSearch是一个一个分布式的实时文档存储,每一个字段都可以被索引与搜索,并且能支持PB级别的结构化或者非结构化数据。早期我们应用的全局搜索是简单的SQL模糊查询,为了分担数据库压力所以用了ES,选择他的原因除了以上几点外,还有其提供的API方式简单

    2024年02月03日
    浏览(52)
  • Springboot 整合ElasticSearch 常用的插入查询,模糊查询,范围查询

    repository.deleteById(id); } catch (Exception ex) { ex.printStackTrace(); return false; } return true; } public Dog saveDog(Dog dog) { try { Dog save = repository.save(dog); System.out.println(“结果:”+save.toString()); return save; } catch (Exception ex) { ex.printStackTrace(); return null; } } public Boolean saveDogAll(List dogsList) { try { reposit

    2024年04月22日
    浏览(43)
  • elasticsearch7.17.3 实现类似mysql的like查询

    前言:现在想要实现在elasticsearch中类似于mysql的like查询方式,有下面几种方法可以参考 建议 :wildcard方法是纯纯的like查询方式平替,但是性能差,上百GB的数据量后就会很慢。根据自己业务量需求,前面两种方式能解决的情况下尽量用前面两种方式。前两种方式可以修改索

    2024年02月08日
    浏览(47)
  • springboot整合elasticsearch实现类似于mysql的like查询

    目录 一、ES分页查询常用方式 二、引入es的依赖 三、es配置文件 四、es工具类 五、分页查询示例 1.from + size from表示从第几行开始,size表示查询多少条文档。from默认为0,size默认为10,最灵活的分页方式。 2.scroll 不适合用来做实时搜索,而更适用于后台批处理任务,如日志导

    2023年04月09日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包