召回:效果评估

这篇具有很好参考价值的文章主要介绍了召回:效果评估。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

召回评估方法

  • 最好肯定是线上ab,但是ps资源和线上流量都有限。
  • 首先auc高并不代表召回的好,实际上好的召回可能auc低一些,但是会召回出更符合真实分布的内容,实际工作中auc当作参考就好。
  • 拿Top K召回结果与用户实际点击做交集并计算precision/recall,感觉现在大多都是用的这个方法,但是我总感觉极端条件下N路召回全都100%准确率召回率,那其实5路变成1路就好了,而且完全在拟合精排,又陷入了无探索的困境,因为召回的结果未被用户点击,未必说明用户不喜欢,而可能是由于该召回结果压根没有给用户曝光过。参考[召回通道的评级指标——recall@k];Airbnb所使用的方法是看“用户实际点击”在“召回结果”中的平均位置。
  • 召回diff率。其实我现在还比较喜欢拿这个来预估要不要上线,因为diff高才有bagging一路召回的价值(当然还有是否保送,精排是否能排出来的问题),diff高就有上线一试的价值;另外一个就是,如果分层来看diff大,也可以一试,看效果时,也只分层效果;或者看单路召回通道唯一或者非唯一占比。
  • 人肉debug:最近搞了一个模型,自己经常会拿组里同学的uid来打印召回结果,然后人肉评估一下靠不靠谱。虽然有点蠢,但是确实能帮我验证模型/机制做没做对,也能有个摸底的效果。
  • 还可以是:多样性+类目符合率+doc的goods粒度统计cxr_pv价值等
  • i2i召回效果分析
    1 曝光点击pay上的覆盖变化:
        合并的数据占比是:原swing取top0.8+其它(如clk2pay)取top0.2

文章来源地址https://www.toymoban.com/news/detail-425561.html

到了这里,关于召回:效果评估的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 混淆矩阵、精确率、召回率和F1值:如何评估分类器的性能?

    ❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈 (封面图由文心一格生成) 在机器学习中,分类是一项非常重要的任务。在

    2024年02月02日
    浏览(59)
  • 分类模型评估指标——准确率、精准率、召回率、F1、ROC曲线、AUC曲线

    机器学习模型需要有量化的评估指标来评估哪些模型的效果更好。 本文将用通俗易懂的方式讲解分类问题的混淆矩阵和各种评估指标的计算公式。将要给大家介绍的评估指标有:准确率、精准率、召回率、F1、ROC曲线、AUC曲线。 所有事情都需要评估好坏,尤其是量化的评估指

    2024年02月11日
    浏览(56)
  • 【超详细】机器学习sklearn之分类模型评估 混淆矩阵、ROC曲线、召回率与精度、F1分数

    机器学习之分类模型的评估 学习分类模型评估的方法: 1、混淆矩阵 2、分类结果汇总 3、ROC曲线 4、召回率与精度 5、F1分数 一、评估分类器性能的度量 1、真正(true positive, TP)或f++,对应的是被分类模型正确预测的正样本数。 2、假负(false negative, FN)或f±对应的是被分类模型错

    2023年04月08日
    浏览(89)
  • 搜索中关于稀疏检索和稠密向量检索的召回效果比较

    不同检索方式说明 最近在做搜索召回提升相关的研究工作。对比了稀疏检索和稠密向量检索的效果。其中使用的搜索引擎为elasticsearch8.x版本。稀疏检索包括BM25的检索方式,以及es官方在8.8之后版本提供的稀疏向量模型的方式。稠密向量检索,是指借助机器学习的模型做文本

    2024年02月21日
    浏览(36)
  • 路由器的MTU值设置成多少效果最好

    而一般ADSL宽带的MTU在1450与1492之间,系统与ISP之间MTU的不符就会直接导致数据在网络传输过程中不断地进行分包、组包,浪费了宝贵的传输时间,也严重影响了宽带的工作效率。这就要求我们必须将本机MTU值设为与ISP所使用的MTU值一样后才能快速浏览网页、下载数据。但是,

    2024年02月05日
    浏览(33)
  • 聚类效果评估

    目录 1.轮廓系数(Silhouette Coefficient) 1.1 为什么轮廓系数可以评价聚类效果的好坏? 1.2 平均轮廓系数 2. 其他聚类质量函数 2.1方差比准则(Variance Ratio Criterion, VRC)  2.2 戴维斯-博尔丁指数(Davies-Bouldin指数,DB指数)   评价聚类结果效果的指标通常有:误差平方和(Sum of the Square

    2024年02月09日
    浏览(36)
  • MATLAB - 评估拟合优度、评价拟合效果

    用一个或多个模型拟合数据后,您应该评估拟合的好坏。第一步应该是目测 \\\"曲线拟合器 \\\"应用程序中显示的拟合曲线。除此之外,工具箱还提供了这些方法来评估线性和非线性参数拟合的拟合优度: 拟合优度统计 残差分析 置信度和预测边界 正如统计文献中常见的那样,\\\"拟

    2024年03月28日
    浏览(38)
  • 在ARM板上实现qt虚拟键盘 Qwidget实现 官方虚拟键盘、第三方虚拟键盘qtvirtualkeyboard //Qwidget最简单但效果不是最好

    在使用qt的虚拟键盘以前,我的开发板qt环境中并没有安装虚拟键盘库,所以这里还会顺便介绍如何在开发板上已安装qt环境的前提下,继续更新qt的组件。 开发板qt版本:5.15.2 在这里,我默认你已经有自己动手交叉编译过qt源码了,否则你将缺少部分细节和前置知识。首先在

    2024年04月09日
    浏览(353)
  • 全网最好的子网划分方法与例题解析

    目录 1 子网划分的定义: 2 掩码介绍 3、子网划分要解决的问题: 4 子网划分步骤 5 范例1根据ip和掩码求所有子网和网络广播地址: 6 范例2根据ip和掩码求同网段地址 7 合并子网的例子根据ip范围合并,并添加回程路由: 8、其他范例: 8.1求子网号 8.2 路由聚合 8.3 求最多主机

    2024年02月06日
    浏览(42)
  • Delphi Http Https 最好的解决方法(一)

    当前文章主要解决Delphi调用http、https的常见报错。 开发工具: Delphi XE 10.1 Berlin版本 可能所需的控件包: QDAC 请自行下载。   dll_init 接口初始化,程序启动时调用,主要是对工具类实例的创建   dll_post 发送post请求,支持http、https   dll_get 发送get请求,支持http、https   dll_uni

    2024年02月08日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包