论文笔记:基于CLIP引导学习的多模式假新闻检测

这篇具有很好参考价值的文章主要介绍了论文笔记:基于CLIP引导学习的多模式假新闻检测。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

背景

  对于我们这一代人来说,在线社交网络在很大程度上取代了以报纸和杂志为代表的传统信息交流方式。人们喜欢在社交媒体上寻找朋友或分享观点。然而,在线网络也促进了假新闻的广泛和快速传播。
  文中提出了一个FND-CLIP框架,即基于对比语言-图像预训练(CLIP)的多模态假新闻检测网络。其中的多模态特征由两个模态的相似性加权的CLIP特征串联得到。引入了一个模态关注模块来自适应地重新加权和聚合特征。
  图一是使用模型的几个例子,每条新闻的三个注意力得分分别是文字得分、图像得分和融合得分。
论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习

模型

  文中提出,进行假新闻检测的一般流程为:
y ^ = F c l s ( F M i x ( F T x t ( x T x t ) , F i m g ( x I m g ) ) ) \hat{y}=F_{cls}(F_{Mix}(F_{Txt}(x_{Txt}),F_{img}(x_{Img}))) y^=Fcls(FMix(FTxt(xTxt),Fimg(xImg)))  其中, F c l s F_{cls} Fcls是分类头, F M i x F_{Mix} FMix F I m g F_{Img} FImg F T x t F_{Txt} FTxt分别是融合模型、文本模型和图像模型, y ^ \hat{y} y^是最终预测标签。 x T x t x_{Txt} xTxt x I m g x_{Img} xImg是预训练模型提取出的特征。
  那么如何保证两种模式提供的特征在后期都能被利用,否则语义空间的空白会使融合的特征无法准确地表示图像和文本之间的相关性。本文采用了一种简单而有效的方法,选择CLIP模型来生成跨模态特征和度量跨模态相似性,在特征提取和对齐之后,本文使用一个轻量级的网络来实现 F c l s F_{cls} Fcls,该网络可以预测出整数。
  CLIP(Contrastive Language-Image Pre-training)一种基于对比文本-图像对的预训练模型。他分别有一个图像和一个文本编码器,输出的结果从一开始就是对齐的。模型结构:
论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习
  本文的模型结构:
论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习  那我们来看看本文的模型,其实尊都非常简单,就是BERT和ResNet提取的特征和CLIP两个编码器提取的特征分别拼起来作为单模态特征,CLIP两个编码器输出的特征作为融合模态的特征,由于CLIP两个编码器的结果本身就是对齐的,在计算一个余弦相似度调节融合特征的强度。现在我们就获得了两个单模态和一个融合模态,使用了一个改于SeNet的注意力网络对它们融和,然后过分类头就行了。
  公式推导(懒得写了,放图片看吧):

  1. 得到两个单模特征:
    论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习

  2. 得到融合特征:
    论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习

  3. 计算相似度并加权,得到最终的三个模态:
    论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习
    论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习

  4. 根据attention机制的结果得到最终特征:
    论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习

  损失函数用的是交叉熵,可以看这篇:交叉熵损失(Cross Entropy Loss)学习笔记

实验

  在微博和Fakenewsnet里面那两个数据集上的实验:
论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习
  消融实验:
论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习
  分类结果的可视化:
论文笔记:基于CLIP引导学习的多模式假新闻检测,论文笔记,论文阅读,学习文章来源地址https://www.toymoban.com/news/detail-812283.html

到了这里,关于论文笔记:基于CLIP引导学习的多模式假新闻检测的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • BioMed-CLIP 论文阅读笔记

    Abstract 本文聚焦于将VLP(vision-language processing)拓展到生物医学领域,介绍了一种迄今为止最大的生物医学VLP研究(使用了从PubMed Central中提取的15M 图像文本对) PMC-15M 数据集的规模远大于现有数据集,并且涵盖不同你那个范围的生物医学图像。基于 CLIP 结构,作者提出了

    2024年02月04日
    浏览(45)
  • CLIP原理解读——大模型论文阅读笔记一

    通过自然语言处理来的一些监督信号,可以去训练一个迁移效果很好的视觉模型。 论文的作者团队收集了一个超级大的图像文本配对的数据集,有400 million个图片文本的配对, 模型最大用了ViT-large,提出了CLIP(Contrastive Language-Image Pre-training),是一种从自然语言监督中学习

    2024年02月08日
    浏览(44)
  • 基于jsp的新闻发布系统(论文)

    Internet的蓬勃发展,使新闻的传播方式发生了巨大的变化,传统的信息传播媒体电视、广播、报纸已经不再是人们茶余饭后的主要精神甜点,人们更多的开始关注网络新闻。由于互联网所容纳的信息量大、内容丰富、信息及时、准确,更有相关信息的全面的介绍与比较,大大

    2024年02月02日
    浏览(38)
  • 毕设 基于Python实现的新闻搜索引擎(源码+论文)

    # 0 简介 今天学长向大家介绍适合作为毕设的项目: 毕设分享 基于Python实现的新闻搜索引擎(源码+论文) 项目获取: https://gitee.com/sinonfin/algorithm-sharing 使用的库有: requests BeautifulSoup4 爬虫分为两部分,网络通信部分(scraper.py)与适配器(adapers/*.py)部分。 网络部分也分为两

    2024年02月05日
    浏览(46)
  • 刷论文的感觉太棒了!(对比学习 / CLIP改进 / 视频理解)

    😍😍😍更多精彩福利😍😍😍 1. 对比学习论文总结 学习视频: 李沐-MoCo论文逐段精读 李沐-对比学习论文综述 阶段 代表工作 百花齐放(18-19中) Inst Disc : memory Bank, 每张图都是一个类别(个体判别) Inva Spread : end-to-end, 在同一mini-batch中选正负样本 CPC V1 :用预测未来的代

    2023年04月14日
    浏览(80)
  • CLIP论文笔记——Learning Transferable Visual Models From Natural Language Supervision

    一个强大的无监督训练模型 通过NLP来的监督信号得到迁移学习 进行图片与文字的配对实现监督的信号,解决了需要打标签进行训练的限制,增强了模型的泛化能力 CLIP的结构包含两个模型 Text Encoder 和 Image Encoder ,Text Encoder用于提取文本特征,Image Encoder用来提取图像特征 C

    2024年02月02日
    浏览(39)
  • 毕设项目 基于Python实现的新闻搜索引擎(源码+论文)

    # 0 简介 今天学长向大家介绍适合作为毕设的项目: 毕设分享 基于Python实现的新闻搜索引擎(源码+论文) 项目获取: https://gitee.com/assistant-a/project-sharing 使用的库有: requests BeautifulSoup4 爬虫分为两部分,网络通信部分(scraper.py)与适配器(adapers/*.py)部分。 网络部分也分为两

    2024年04月10日
    浏览(44)
  • 毕设开题分享 基于Python实现的新闻搜索引擎(源码+论文)

    # 0 简介 今天学长向大家介绍适合作为毕设的项目: 毕设分享 基于Python实现的新闻搜索引擎(源码+论文) 项目获取: https://gitee.com/sinonfin/algorithm-sharing 使用的库有: requests BeautifulSoup4 爬虫分为两部分,网络通信部分(scraper.py)与适配器(adapers/*.py)部分。 网络部分也分为两

    2024年01月23日
    浏览(47)
  • 基于Vue框架的思源新闻发布平台设计与实现(论文+源码)_kaic

    摘  要 经过针对全校随机抽取的100名学生进行的研究发现,有约69%的学生,并不关心思源新闻,一些学生表示思源每天发生的大小事与他们无关。这项调查突显了需要提供一个能激发学生对思源校园新闻感兴趣的平台。因此本文为思源学院全院师生设计一个基于Vue框架的思

    2024年02月05日
    浏览(48)
  • 论文推荐:基于联合损失函数的多任务肿瘤分割

    以FFANet为主干,加入分类的分支,将模型扩展为多任务图像分割框架,设计了用于分类和分割的联合损失函数。 1、FFANet和分割分支 FFANet作为骨干网络,作为对VoVNet的重新设计和优化,FFANet在骨干网中加入了残差连接,使VoVNet可以学习更多的特性。设计了一种特殊的特征融合

    2023年04月23日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包