我想简单的写写nce和infonce

这篇具有很好参考价值的文章主要介绍了我想简单的写写nce和infonce。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


我这两天都在看infonce 的推导,我表示很头大。今天感觉看明白了,写出来大家讨论一下。

为什么有nce

为了解决一个问题:多分类问题,尤其是类别相当大的时候msoftmax 函数中分母计算量大的问题。
softmax:我想简单的写写nce和infonce
类别上百万的时候,咋算

nce 方案: 不算

咋算? 不算,转化一下,二分类好算吧,用二分类来算。
怎么转化 :如上我们要求的是p(w|c) 分布,nce 方案是,我们转化为一个二分类问题。正样本是p(w,c) 中的,负样本是噪声分布q(w)中的,那么根据后验概率,我们可以求
p(label=1 |w,c),p(label=0|w,c) ,怎么求的看下图,kd 代表 p(w,c)中获取的kd 个正样本,kn 代表q(w) 中kn个负样本。
我想简单的写写nce和infonce
那么转化为的二分问题就是求D变量的二分类函数, 就可以区p(w,c) 和 q(w) 。 即是 Noise Contrastive Estimation 噪声对比估计。用相求的分布(正样本分布)和噪声分布做对比。
ps: 关于负样本数量的问题,有一些推导,记住一点就好,负样本愈多,模型越精准。其实我理解就是负样本分布越正确(不一定准确)

为什么有infonce

nce 是将数据分布求解转化为了二分类问题,而infonce 是将数据分布,转化成了多分类问题,但是比softmax 下面的全分类要少,(全分类我自己创的名词,大家理解就好)
infonce 取一个正样本, 负样本会采样N-1个,组成一个N分类问题,优化N类logistic 函数。
以上写的太简单了,但意思确实是这样的。
具体细节如下
我想简单的写写nce和infonce
这里转化为分类问题就是
我想简单的写写nce和infonce
(对上面式子懵逼的小伙伴:上面的这个公式就是求N个样本中,正样本正好是t+k 的概率,对就是这个)
然后对应的多分类损失函数就是(暂时将fk函数看p(x|c),这是一个正比关系,具体推导可以看相关文章:https://zhuanlan.zhihu.com/p/334772391)
我想简单的写写nce和infonce

所以infonce 和nce 啥关系

实际上就是同时使用了求原始分布转化为求分类问题这个路子。 我认为这里面很值得借鉴的是softmax 转化为二分类问题与转化为多分类问题的这个过程。文章来源地址https://www.toymoban.com/news/detail-428979.html

参考文章

  1. https://zhuanlan.zhihu.com/p/334772391
  2. https://zhuanlan.zhihu.com/p/317711322

到了这里,关于我想简单的写写nce和infonce的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【FPGA】zynq 单端口RAM 双端口RAM 读写冲突 写写冲突

    RAM 的英文全称是 Random Access Memory,即随机存取存储器,简称随机存储器,它可以随时把数据写入任一指定地址的存储单元,也可以随时从任一指定地址的存储单元中读出数据,其读写速度是由时钟频率决定的。 具体的分类讲解可以看SDRAM、DRAM及DDR FLASH ROM概念详解这篇文章

    2024年02月04日
    浏览(52)
  • 百万粉丝都在看的Python上手教程----滚雪球学Python

    前言: Hello大家好,我是Dream。 今天为大家带来一本书: 《滚雪球学Python》 一起来看看吧~ 《滚雪球学Python》之所以这样命名本书,是希望大家用滚雪球的思维学习编程语言,“滚”的第一遍,从全局掌握Python技术体系,“滚”的第二遍继续为自己的技术栈沾上更多的雪花,

    2024年01月24日
    浏览(51)
  • 【Python】重磅!这本30w人都在看的Python数据分析畅销书更新了!

    Python 语言极具吸引力。自从 1991 年诞生以来,Python 如今已经成为最受欢迎的解释型编程语言。 【文末送书】今天推荐一本Python领域优质数据分析书籍,这本30w人都在看的书,值得入手。 pandas 诞生于2008年。它是由韦斯·迈金尼(Wes McKinney)于2008年开始开发的,最初的目标是

    2024年02月05日
    浏览(49)
  • 这两天的一些碎碎念

       一直以来我都不算是一个非常热爱运维岗位的一个人,其实本行工作对于我来说只是一个工作。运维的广度很大,说什么工作了7年了,可最终总感觉还曾是一窍不通。    什么shell啊,什么python啊,什么大数据啊,7年里,真的只懂点皮毛,我扪心自问,确实只是把它当做

    2024年02月07日
    浏览(37)
  • 20场面试斩获大厂offer,你在我这能学到什么?,面试真题解析 某市开展安全生产专项整治小宋在

    先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7 深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前! 因此收集整理了一份《2024年最新Android移动开发全套学习资

    2024年04月25日
    浏览(46)
  • 告诉ChatGPT,我想读博了!

    上篇文章详细写了如何体验ChatGPT。在实际使用中发现它对固定模板式的文字工作做的比较好。于是我瞬间想起了毕业前被论文支配的恐惧,我突然有一个大胆的想法, 那么ChatGPT是否能帮我写一篇毕业论文呢? 以大家最常用的图书管理系统为例。在毕业论文的第一步,我们先

    2023年04月18日
    浏览(43)
  • 我想开通期权?如何开通期权账户?

    场内期权的合约由交易所统一标准化定制,大家面对的同一个合约对应的价格都是一致的,比较公开透明,期权开户当天不能交易的,期权开户需要满足20日日均50万及半年交易经验即可操作,下文科普我想开通期权?如何开通期权账户? 的知识点。 本文来自:期权酱 个人投

    2024年02月10日
    浏览(45)
  • 两天学会微服务网关Gateway-Gateway路由规则

    锋哥原创的微服务网关Gateway视频教程: Gateway微服务网关视频教程(无废话版)_哔哩哔哩_bilibili Gateway微服务网关视频教程(无废话版)共计17条视频,包括:1_Gateway简介、2_Gateway工作原理、3_Gateway HelloWorld快速入门等,UP主更多精彩视频,请关注UP账号。 https://www.bilibili.com

    2024年03月18日
    浏览(48)
  • 一篇文章教你ctfd平台搭建&ctfd动态靶机创建&docker的使用&ctf动态flag的实现 来我这就够了!

    目录 一、ctfd的搭建 先换个源 开始安装docker 启动Docker服务并设置为开机启动 下载CTFd修改版 构建镜像 部署容器 二、开始部署一个ctfd赛题 现成的题库演示: 一个docker镜像: 选择dynamic_docker: 部署完很多很多的题目 点击开启,点击网址 三、怎么自己写一个ctf题目 👌好!首先

    2024年02月04日
    浏览(40)
  • 百度发布文心一言,我想说几句

    大家好,我是记得诚。 今天下午百度公司正式发布了文心一言,算是国内第一个交卷的互联网公司。 在ChatGPT和GPT-4的双重夹击下,可想而知百度的压力。 ChatGPT发布的时候,热度非常的高,大家对其都非常的感兴趣。 我是非常不喜欢追热点的一个人,因为我深知一个道理,

    2024年02月01日
    浏览(55)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包