论文笔记--Learning Political Polarization on Social Media Using Neural Networks

这篇具有很好参考价值的文章主要介绍了论文笔记--Learning Political Polarization on Social Media Using Neural Networks。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. 文章简介

  • 标题:Learning Political Polarization on Social Media Using Neural Networks
  • 作者:LORIS BELCASTRO, RICCARDO CANTINI, FABRIZIO MAROZZO, DOMENICO TALIA AND PAOLO TRUNFIO
  • 日期:2020
  • 期刊:IEEE

2. 文章概括

  文章提出了一种基于神经网络对政治两极化观点进行分析的方法IOM-NN, 基于两组case的分析结果表明该方法相比于传统的分析方法准确率更高,得到的结果更加接近真实结果,甚至比民意调查结果更可靠。

3. 相关工作

  简单的介绍一下近年来常用的通过社交媒体来分析公共观点、预测选举结果的一些方法。现存的方法一般可分为三类:

  • Volume-based:计算各个候选人的博客/点赞/评论的数量,预测选票结果。但基于volume的方法常常受到发文数量的影响,比如某用户发文特别多,则其支持的候选人被预测的可能性会变大。IOM-NN则优化为基于用户数量的预测,从而避免了该问题。
  • Sentiment- or opinion-based: 利用NLP/文本挖掘技术尝试理解用户对某候选人或某党派的观点。IOM-NN使用了BOW词袋模型和神经网络相结合来对博文进行分类,进一步对撰写博文的博主进行分类。
  • Network-based:分析社交媒体用户的网络结构,从而可以理解公共观点的动态。

4. 文章重点技术

文章提出了IOM-NN(Iterative Opinion Mining using Neural Network)方法。主要步骤如下
论文笔记--Learning Political Polarization on Social Media Using Neural Networks,论文阅读,论文阅读,神经网络,nlp,分类,自然语言处理

4.1 Collection of posts

4.1.1 数据下载

  定义 E \mathcal{E} E为不同党派 F = { f 1 , … , f n } F=\{f_1, \dots, f_n\} F={f1,,fn}之间的竞争时间。则数据收集阶段我们需要知道如下信息

  • K c o n t e x t K_{context} Kcontext表示和事件 E \mathcal{E} E相关的通用关键词集合
  • K F ⊕ = K f 1 ⊕ ∪ ⋯ ∪ K f n ⊕ K_F^\oplus = K_{f_1}^{\oplus} \cup \dots \cup K_{f_n}^{\oplus} KF=Kf1Kfn表示和各个党派相关的postive keywords(支持该党派的关键词)。
    接下来我们下载收集包含上述任一组关键词中一个或多个关键词的博客,得到数据集。

4.1.2 数据预处理

  • 将文本转化为小写,将特殊的accent字符替换为对应的普通字符
  • 取单词的stem
  • 移除停词
  • 不考虑非本国家的人发表的该国语言的博文。
    最终输出的结果为博文集合 P P P

4.1.3 统计显著性分析

  在使用数据之前,文章分析了数据集的年龄、性别和地理分布,为了确定用户是否具有代表性

4.2 Classification of Posts

  下表为文章对博文进行分类的伪代码。
论文笔记--Learning Political Polarization on Social Media Using Neural Networks,论文阅读,论文阅读,神经网络,nlp,分类,自然语言处理

  • 第一部分(1-9行)为算法的初始化过程:先尝试对每个博文进行分类(分类方法为返回一个0-1向量,表示该博文是否包含某个党派对应的关键词集合 K f ⊕ K_f^{\oplus} Kf,如果某博文属于且仅属于其中一个党派 f f f,则将博文 p p p分类到该党派,并将结果对 < p , f > <p, f> <p,f>加入到已分类的博文集合 C 0 C^0 C0。最终剩余为分类的集合记作 N 0 N^0 N0
  • 第二部分(10~21行)对分类规则和结果进行迭代的更新,每一步的更新方法类似初始化过程,区别为迭代过程中,文章会迭代地利用前面所有步骤的分类结果训练一个神经网络模型,然后通过神经网络模型对当前未分类的博文集合进行预测,得到一个概率向量,如果该向量某概率值大于给定阈值 t h th th,则将该博文分类到该党派,并将结果对加入到已分类的集合中。迭代停止条件为当前轮次有分类结果的占比大于等于某阈值(已经有足够多的分类结果),或者当前轮次有分类结果的占比小于等于某阈值(无法再通过迭代优化)。
    下图为该算法的图示
    论文笔记--Learning Political Polarization on Social Media Using Neural Networks,论文阅读,论文阅读,神经网络,nlp,分类,自然语言处理

4.3 Polarization of users

  下图为对用户极性进行分析的伪代码:
论文笔记--Learning Political Polarization on Social Media Using Neural Networks,论文阅读,论文阅读,神经网络,nlp,分类,自然语言处理

  • 聚合:首先文章按照用户将上述分类结果进行聚合,得到字典 C U = ( u , P u ) C_U={(u, P_u)} CU=(u,Pu),其中 P u P_u Pu表示拥护 u u u对应的所有博文的分类结果list。
  • 过滤:接下来,对字典中的每一个结果对,文章会首先判断用户是否满足以下过滤条件,全部满足的拥护才被保留
    • 在该事件至少发文 m i n P o s t minPost minPost
    • 该拥护的博文中存在至少 2 / 3 2/3 2/3的博文是关于某个党派的
  • 分极:针对上述未被过滤的博文对,文章按照下图所示方法对用户进行分极。具体来说,文章生成一个用户 u u u对应的百分比向量,用该向量进行聚合、归一化得到最终的分极向量 S S S
    论文笔记--Learning Political Polarization on Social Media Using Neural Networks,论文阅读,论文阅读,神经网络,nlp,分类,自然语言处理

5. 文章亮点

  文章提出了一种基于迭代式的神经网络进行政治极化预测的方法,该方法只需收集关键词和博文数据,便可自适应地迭代训练得到一个较为准确的分类结果。在2018意大利选举和2016美国总统竞选数据集上,该方法表现超过其它测试的算法,几乎接近真实结果。未来或可考虑通过该方法替代昂贵的民意调查来进行竞选结果预测、支持率调研等。

6. 原文传送门

Learning Political Polarization on Social Media Using Neural Networks文章来源地址https://www.toymoban.com/news/detail-767914.html

到了这里,关于论文笔记--Learning Political Polarization on Social Media Using Neural Networks的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 论文阅读-A General Language for Modeling Social Media Account Behavior

      论文链接:https://arxiv.org/pdf/2211.00639v1.pdf 目录 摘要 1 Introduction 2 Related work 2.1 Automation 2.2 Coordination 3 Behavioral Language for Online Classification  3.1 BLOC alphabets 3.1.1 Action alphabet 3.1.2 Content alphabets 3.2 BLOC models 3.2.1语言模式 3.2.2 Vector models 4 Discriminative power of BLOC 4.1 Characterizing individu

    2024年02月09日
    浏览(46)
  • (WWW2023)论文阅读-Detecting Social Media Manipulation in Low-ResourceLanguages

    论文链接:https://arxiv.org/pdf/2011.05367.pdf         社交媒体被故意用于恶意目的,包括政治操纵和虚假信息。大多数研究都集中在高资源语言上。然而,恶意行为者会跨国家/地区和语言共享内容,包括资源匮乏的语言。         在这里,我们调查是否以及在何种程度上

    2024年02月12日
    浏览(37)
  • 【图像修复】论文阅读笔记 ----- 《Image inpainting based on deep learning: A review》

    原文下载链接1:https://www.sciencedirect.com/science/article/abs/pii/S0141938221000391 原文下载链接2:http://s.dic.cool/S/KSS4D4LC 本篇论文综述发表于2021年。文章总结了基于深度学习的不同类型神经网络结构的修复方法,然后分析和研究了重要的技术改进机制;从模型网络结构和恢复方法等方

    2024年02月01日
    浏览(63)
  • [论文阅读笔记24]Social-STGCNN: A Social Spatio-Temporal GCNN for Human Traj. Pred.

    论文: 论文地址 代码: 代码地址 作者在这篇文章中直接用GNN对目标的轨迹时空特征进行建模, 并用时序CNN进行预测, 代替了训练难度较大和速度较慢的RNN类方法. 行人轨迹预测是一个比较有挑战性的任务, 有着许多的应用. 一个行人的轨迹不仅是由自己决定的, 而且受其周围目标

    2024年02月16日
    浏览(44)
  • 虚拟现实与社交 virtual reality and social media: the future of connection

    虚拟现实(Virtual Reality, VR)和社交媒体(Social Media, SM)是当今最热门的技术话题之一。随着科技的发展,这两种技术已经成为了人们日常生活中不可或缺的一部分。VR技术可以让人们在虚拟世界中与其他人互动,而社交媒体则使得人们可以在线上与远处的朋友保持联系。在这篇文

    2024年04月26日
    浏览(32)
  • 论文阅读-Neighbor Contrastive Learning on Learnable Graph Augmentation(AAAI2023)

            人为设计的图增强,可能会破坏原始图的拓扑结构,同时相邻节点被视为负节点,因此被推离锚点很远。然而,这与网络的同质性假设是矛盾的,即连接的节点通常属于同一类,并且应该彼此接近。本文提出了一种端到端的自动GCL方法,称为NCLA,将 邻居对比学习

    2024年02月14日
    浏览(39)
  • 论文阅读:Whole slide images classification model based on self-learning sampling

    这是一篇发表在BSPC(Biomedical Signal Processing and Control)上的关于WSI分类的文章, 作者是上海科技大学的学生/老师。 论文链接为:https://www.sciencedirect.com/science/article/pii/S1746809423012594 代码:暂未开源 深度学习与计算病理学的结合的增加放大了整个WSI在现代临床诊断中的应用。然而

    2024年02月02日
    浏览(42)
  • 社交媒体中的表情符号结合大数据 AI 的研究 Analyzing Emoji Use in Social Media Posts Insights

    作者:禅与计算机程序设计艺术 在社交媒体中,由于使用了表情符号表述自己的情感,使得用户对某类产品或服务表达出的态度更加直观、生动。在这一领域,研究人员需要收集和分析社交媒体上的文字和图片数据,以此探索用户对于 popular emojis 的态度倾向及其产生的影响

    2024年02月08日
    浏览(45)
  • 论文阅读06-Task Offloading Optimization in Mobile Edge Computing based on Deep Reinforcement Learning

    标题:Task Offloading Optimization in Mobile Edge Computing based on Deep Reinforcement Learning 会议:MSWiM ’23 (CCF-C) 注:本文仅用户学习。 问题:边缘计算可以很好地缓解云计算网络拥塞和高通信开销等问题。然而,考虑到边缘计算资源是有限的,需要采用合理的优化策略提高首先资源的

    2024年02月21日
    浏览(54)
  • 【论文导读】- GraphFL: A Federated Learning Framework for Semi-Supervised Node Classification on Graphs

    原文地址:https://arxiv.org/abs/2012.04187 Graph-based semi-supervised node classification (GraphSSC) has wide applications, ranging from networking and security to data mining and machine learning, etc. However, existing centralized GraphSSC methods are impractical to solve many real-world graph-based problems, as collecting the entire graph and labeli

    2024年02月02日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包