Lucene(10):Lucene相关度排序

这篇具有很好参考价值的文章主要介绍了Lucene(10):Lucene相关度排序。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1 什么是相关度排序

Lucene对查询关键字和索引文档的相关度进行打分,得分高的就排在前边。

1.1 如何打分

Lucene是在用户进行检索时实时根据搜索的关键字计算出来的,分两步:

  • 计算出词(Term)的权重
  • 根据词的权重值,计算文档相关度得分。

1.2 什么是词的权重

明确索引的最小单位是一个Term(索引词典中的一个词),搜索也是要从Term中搜索,再根据Term找到文档,Term对文档的重要性称为权重,影响Term权重有两个因素:文章来源地址https://www.toymoban.com/news/detail-495419.html

  • Term Frequency (tf): 指此Term在此文档中出现了多少次。tf 越大说明越重要。 词(Term)在文档中出现的次数越多,说明此词(Term)对该文档越重要,如“Lucene”这个词,在文档中出现的次数很多,说明该文

到了这里,关于Lucene(10):Lucene相关度排序的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ElasticSearch学习篇10_Lucene数据存储之BKD动态磁盘树

    基础的数据结构如二叉树衍生的的平衡二叉搜索树通过左旋右旋调整树的平衡维护数据,靠着二分算法能满足一维度数据的logN时间复杂度的近似搜索。对于大规模多维度数据近似搜索,Lucene采用一种BKD结构,该结构能很好的空间利用率和性能。 本片博客主要学习常见的多维

    2024年03月15日
    浏览(46)
  • 排序相关问题

    本篇博客在B站做了内部分享,标题为「排序相关问题」 MySQL的ORDER BY有两种排序实现方式: 利用有序索引获取有序数据 (不得不进行)文件排序 在explain中分析时,利用有序索引获取有序数据显示 Using index ,文件排序显示 Using filesort 。 以下几种优化方式,可能使order by利用到索引

    2024年02月09日
    浏览(38)
  • 【数据结构】——排序算法的相关习题

    1、直接插入排序 1、对n个元素进行直接插入排序,需要进行()趟处理。 A、n B、n+1 C、n-1 D、2n 解析: (C) 直接插入排序是将要排序的序列按照的大小插入至已排好序的子序列中,一直进行直到整个序列有序,所以对n个元素进行直接插入排序,一共插入元素n-1次,

    2024年02月03日
    浏览(43)
  • C#中sort排序相关用法介绍

     C#中,List.Sort() 不仅为我们提供了默认的排序方法,还为我们提供了4种自定义排序的方法,通过默认排序方法,我们无需重写任何Sort()方法的实现代码,就能对单参数类型的List数据进行单一规则的排序,如果通过对这些方法进行改进我们可以轻松做到对多参数、多规则的复

    2024年02月15日
    浏览(59)
  • ES:先按相关性分数进行排序,分数相同时再按其他字段排序

    最近,在公司学习ES的使用,导师给了个题目,如何对一个文档先计算分数,用分数进行排序,在分数相同的情况下再按照别的字段(如时间)进行排序,为此,从来没接触过ES的我开启了艰难的学习之路 本文参考自 ES权威指南(中文版) 以下是目录: 相关性算分描述了一个

    2024年02月05日
    浏览(42)
  • 排序算法&分析——什么时候 用 什么排序

    了解各种排序,详见排序专栏 纵观排序算法的历史,有哪些排序算法的速度可以到达 O ( n   l o g ( n ) ) O(n~log(n)) O ( n   l o g ( n )) ? 冒泡排序 ( B u b b l e Bubble B u bb l e S o r t Sort S or t ):冒泡排序是最简单的排序算法之一。它通过多次比较和交换相邻元素的方式,将最大(或

    2024年02月11日
    浏览(43)
  • Springcloudalibaba整合es!实现相关性排序,集成完代码真香

    org.springframework.boot spring-boot-starter-data-elasticsearch 2.0.1.RELEASE com.querydsl querydsl-apt 4.2.2 com.querydsl querydsl-jpa 4.2.2 ma.glasnost.orika orika-core 1.5.2 相关性排序实现思路原理图: ============= 核心代码实现: kibana:查询json { “function_score” : { “query” : { “bool” : { “must” : [ { “multi_match”

    2024年04月22日
    浏览(29)
  • 【数据结构】【算法】二叉树、二叉排序树、树的相关操作

    树结构是以分支关系定义的一种层次结构,应用树结构组织起来的数据,逻辑上都具有明显的层次关系。 操作系统中的文件管理系统、网络系统中的域名管理、数据库系统中的索引管理等都使用了树结构来组织和管理数据。 树 Tree 是由n个节点组成的有限集合。在任意一颗非

    2024年02月04日
    浏览(52)
  • 10 快速排序-左右指针法

    void QuickSort(int *arr, int begin, int end) {         if (begin = end)         {                 return;         }         int left = begin;         int  right = end;         int key = begin;         while (begin end)         {                 while (endbegin arr[end] = arr[key])                 {    

    2024年01月21日
    浏览(53)
  • 【ARM 嵌入式 C 入门及渐进 10 -- 冒泡排序 选择排序 插入排序 快速排序 归并排序 堆排序 比较介绍】

    C语言中常用的排序算法包括冒泡排序、选择排序、插入排序、快速排序、归并排序、堆排序。下面我们来一一介绍: 冒泡排序 (Bubble Sort):冒泡排序是通过比较相邻元素的大小进行排序。如果当前元素比下一个元素大,就交换它们两个的位置。重复这个过程直到最后,最

    2024年02月07日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包