paddlenlp:社交网络中多模态虚假媒体内容核查

这篇具有很好参考价值的文章主要介绍了paddlenlp:社交网络中多模态虚假媒体内容核查。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、背景

随着新媒体时代信息媒介的多元化发展,各种内容大量活跃在媒体内中,与此同时各类虚假信息也充斥着社交媒体,影响着公众的判断和决策。如何在大量的文本、图像等多模态信息中,通过大数据与人工智能技术,纠正和消除虚假错误信息,对于网络舆情及社会治理有着重大意义。

二、任务

本次赛题要求选手基于官方指定数据集,通过建模同一事实跨模态数据之间的关系 (主要是文本和图像),实现对任一模态信息能够进行虚假和真实性的检测。鼓励参赛选手通过大模型解决问题,进行技术探索。

三、数据集

本次比赛提供从国内外主流社交媒体平台上爬取的含有不同领域声明的数据集。

1、初赛阶段

训练集与验证集: 提供中文训练集5694条以及英文数据4893条,同时公开英文验证集611条与中文验证集711条供选手优化模型。

评测数据: 提供文娱、经济、健康领域的测试数据,这些领域的数据较容易区分。英文与中文数据集的测试集各600条。参赛队伍上传的结果文本的每一行就是对应的分类结果,该数据不公布,用于评测。

2、评分标准

采用在三个不同类别上的macro F1的高低进行评分,兼顾了准确率与召回率,是谣言检测领域主流的自动评价指标。自动指标排名是计算两个测试集上的Macro F1平均值排序得到。专家会参考自动指标排名、技术方案和现场陈述进行最终的排名。

四、环境操作

该模型运行在百度的飞桨平台,本文运行的是基于Ernie版的baseline。
1、点击【运行一下】
paddlenlp:社交网络中多模态虚假媒体内容核查,nlp
2、选择运行的环境,我们选择【V100 32GB】,这里算力卡基本就是依据你图片的入模容量决定。算力卡余额是有限的,所以尽量用【基础版】环境进行代码编写,编写完后再用【V100 32GB】来进行训练。
paddlenlp:社交网络中多模态虚假媒体内容核查,nlp
3、将/home/aistudio/data/data229919/data.zip 文件拷贝(单击右键进行复制)到根目录,在根目录进行解压(单机右键进行解压),会生成一个 queries_dataset_merge 的文件夹
paddlenlp:社交网络中多模态虚假媒体内容核查,nlp
4、后续的操作就是右图中的代码运行了,此操作和notebook基本一致,点运行即可,最后等待大约两个小时四十分钟,就能得到训练模型的结果了。

5、模型预测的文件需要改动一下,将这里的路径改为 best_model/model_best.pdparams
paddlenlp:社交网络中多模态虚假媒体内容核查,nlp
6、最后再把预测结果打包成zip

!zip test.zip result.csv 

五、写在最后

本次记录主要还是以学习为主,花了一个周末的时间,调试和跑通流程。探索了一个带大家最快上手的路径,降低大家的入门难度。下次再和大家分享对baseline的一些学习,以及可以做模型调整的地方。

看完觉得有用的话,记得点个赞,不做白嫖党~文章来源地址https://www.toymoban.com/news/detail-636632.html

到了这里,关于paddlenlp:社交网络中多模态虚假媒体内容核查的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 云计算的社交媒体:如何利用社交媒体增强云计算的影响力

    云计算和社交媒体都是当今世界最热门的话题之一。云计算提供了一种更高效、灵活和可扩展的计算资源分配方式,而社交媒体则为人们提供了一种更直接、实时和广泛的沟通方式。然而,这两者之间存在着紧密的联系,它们可以相互补充,共同提高影响力。在本文中,我们

    2024年04月27日
    浏览(35)
  • 【信息与内容安全】实验二:虚假人脸检测实验

    摘要: 在此次实验中,先尝试了自己手动搭建了一个 CNN 进行虚假人脸的分类实验,但发现有训练速度慢准确率低等缺点。所以尝试使用已有的模型(resnet-18)和预训练的参数进行迁移学习,包括尝试了直接把卷积层借用为固定特征提取器和 Fine-tuning 的方法,大大提高了训练

    2024年02月04日
    浏览(50)
  • 去中心化社交:Web3如何重新定义社交媒体

    随着区块链技术的快速发展,Web3正在崭露头角,成为社交媒体领域的一股新潮流。去中心化社交的理念与技术创新正在重新定义用户的社交体验,颠覆传统社交媒体的中心化模式。本文将深入探讨Web3对社交媒体的影响,以及去中心化社交是如何重塑人们在数字世界中的社交

    2024年01月18日
    浏览(55)
  • 社交媒体数据恢复:Facebook

    在使用Facebook的过程中,可能会出现数据丢失的情况,如误删了重要的帖子、照片或其他文件。在这种情况下,你可以尝试以下方法来恢复Facebook的数据。 首先,确保你备份了Facebook的数据。如果你定期备份数据,那么恢复起来就会更加容易。如果你没有备份,那么可以尝试以

    2024年04月27日
    浏览(29)
  • 设计和构建区块链社交媒体平台

    集中式社交媒体,例如 Facebook 和 Twitter,并不适合所有用例。 例如,集中式社交媒体平台与中央权威机构(提供商)相关联。 该提供商有能力删除或隐藏用户帖子。 此外,由于集中式社交媒体是一个可变记录,它可能会被更改。 这有各种各样的后果。 例如,用户可能很难

    2024年01月17日
    浏览(36)
  • 跨境电商社交媒体:选择合适的平台

    正如您在使用社交媒体的九种方法中了解到的那样,跨境电商优先考虑社交媒体营销可能会更有利可图。有数十个平台可供选择,每个平台都迎合了具有不同兴趣、特征和位置的独特受众。 那么您应该关注哪个社交媒体平台以及如何以最大效率工作?  目录     Facebook 谁在

    2024年02月09日
    浏览(59)
  • 社交媒体数据分析:解读Facebook用户行为

    在当今数字化时代,社交媒体已经成为人们生活不可或缺的一部分,而Facebook作为这个领域的巨头,承载了数十亿用户的社交活动。这庞大的用户群体产生了海量的数据,通过深度数据分析,我们能够深入解读用户行为,从而更好地满足用户需求、提升用户体验,同时为平台

    2024年01月21日
    浏览(41)
  • Facebook的时间机器:回溯社交媒体的历史

    社交媒体的历史可以追溯到互联网的早期发展阶段。在Web 1.0时代,互联网主要是一个信息发布平台,用户主要是被动地接收信息。但随着Web 2.0的兴起,互联网逐渐转变为一个互动和参与的平台,社交媒体应运而生。Facebook作为这一时代的先驱,成为了全球范围内最受欢迎的社

    2024年04月27日
    浏览(32)
  • 指纹浏览器可以帮社交媒体营销做什么?

    社交媒体营销是指利用各种社交媒体平台,在上面发布内容进行营销、销售、公共关系处理的行为,并与目标受众进行良好的互动。像Facebook、YouTube、Instagram、Twitter、Tiktok、Linkedin等都是常见的社交媒体营销平台。 与买家建立良好的关系 了解消费者的习惯和及时得到反馈 增

    2024年02月13日
    浏览(40)
  • 22.3D等距社交媒体菜单的悬停特效

    2024年02月10日
    浏览(28)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包