【论文阅读笔记】Detecting AI Trojans Using Meta Neural Analysis

这篇具有很好参考价值的文章主要介绍了【论文阅读笔记】Detecting AI Trojans Using Meta Neural Analysis。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

个人阅读笔记,如有错误欢迎指出!

会议:2021 S&P        Detecting AI Trojans Using Meta Neural Analysis | IEEE Conference Publication | IEEE Xplore

问题:

        当前防御方法存在一些难以实现的假设,或者要求直接访问训练模型,难以在实践中应用。

创新:

        通过元分类器来预测给定目标模型是否被后门攻击。该方法不对攻击策略进行假设,仅为黑盒访问。

        为了在不了解攻击策略的情况下训练元模型,提出了jumbo learning,按照一般分布对一组特洛伊模型进行采样。然后将查询集与元分类器一起动态优化,以区分木马和良性模型。

方法:

        构建多个影子模型,将影子模型和影子模型的标签一同输入到元分类器中对影子模型进行分类。

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

        1、影子模型生成。生成了一组良性和木马影子模型。使用相同的干净数据集和不同的模型初始化来训练良性模型。对于木马模型提出了一个通用的木马分布,并从中采样了各种木马设置,并应用到中毒攻击生成不同的木马影子模型中。

        2、元训练。设计特征提取函数来获得影子模型的表示向量,并训练元分类器来检测后门模型。通过查询得到一组结果向量作为标签,并把该结果向量和影子模型的表示向量一同输入到元分类器中进行训练。在训练迭代中优化分类器和查询集。

        3、目标模型检测。给定一个目标模型,利用优化的查询集来提取模型的表示。然后,我们将表示提供给元分类器,预测是否是后门模型。

1、影子模型的生成

        jumbo learning:

        对不同后门设置进行建模并生成不同后门模型。是有毒样本和中毒标签,是trigger的shape和位置,是图案,是透明度。

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

        通过随机采样来获得不同的后门设置,下图是采样的后门示例。

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

        对每种中毒设置都训练其相应的影子模型,伪代码如下。首先随机采样木马攻击设置(第3行)。然后根据设置毒害数据集(第4-8行),并训练木马阴影模型(第9行)。多次重复这个过程以生成一组不同的木马模型。采样算法(第3行)和模型训练算法(第9行)对于不同的任务将是不同的。

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

2、元训练:基于上述生成的后门影子模型训练元分类器。

        特征提取函数:将一组查询提供给阴影模型,并使用输出向量作为其表示特征。对于影子模型有二进制标签表示该影子模型是良性or中毒。输入查询影子模型得到个向量。通过串联所有的输出向量,可以得到表示向量作为影子模型的特征

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

        元分类器:两层全连接网络

        元训练:希望同时优化查询集和元分类器的参数。随机选择查询集,预先计算所有表示向量​,并且仅优化元分类器。对于具有和相应的标签​,元训练只是通过基于梯度的优化来最小化二元分类器的损失:

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

        用损失函数同时优化查询集和元分类器的参数

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

        仅在良性影子模型上训练的元分类器

        训练模型以确定输入是否与其训练样本相似。如SVM将训练超平面,该超平面将所有训练数据与原点分离,同时最大化从原点到超平面的距离ρ

本文使用了一类神经网络,优化目标如下:

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

3、目标模型检测

        将模型表示向量输入到元分类器中,预测其标签

实验:

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记

detecting ai trojans using meta neural analysis,论文笔记,人工智能,论文阅读,笔记文章来源地址https://www.toymoban.com/news/detail-819386.html

到了这里,关于【论文阅读笔记】Detecting AI Trojans Using Meta Neural Analysis的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 论文笔记--Learning Political Polarization on Social Media Using Neural Networks

    标题:Learning Political Polarization on Social Media Using Neural Networks 作者:LORIS BELCASTRO, RICCARDO CANTINI, FABRIZIO MAROZZO, DOMENICO TALIA AND PAOLO TRUNFIO 日期:2020 期刊:IEEE   文章提出了一种基于神经网络对政治两极化观点进行分析的方法IOM-NN, 基于两组case的分析结果表明该方法相比于传统

    2024年02月03日
    浏览(56)
  • MINT: Detecting Fraudulent Behaviors from Time-series Relational Data论文阅读笔记

    2. 问题定义 时间序列关系数据(Time Series Relation Data) 这个数据是存放在关系型数据库中,每一条记录都是泰永时间搓的行为。 更具体地,每条记录表示为 x = ( v , t , x 1 , x 2 , … , x m − 2 ) x = (v,t,x_1,x_2,dots,x_{m-2}) x = ( v , t , x 1 ​ , x 2 ​ , … , x m − 2 ​ ) ,其中 v v v 代表带

    2024年04月15日
    浏览(37)
  • [论文阅读笔记25]A Comprehensive Survey on Graph Neural Networks

    这是一篇GNN的综述, 发表于2021年的TNNLS. 这篇博客旨在对GNN的基本概念做一些记录. 论文地址: 论文 对于图像数据来说, CNN具有平移不变性和局部连接性, 因此可以在欧氏空间上良好地学习. 然而, 对于具有图结构的数据(例如社交网络 化学分子等)就需要用GNN来学习. 最早期的GN

    2024年02月11日
    浏览(60)
  • Nerf论文阅读笔记Neuralangelo: High-Fidelity Neural Surface Reconstruction

    公众号:AI知识物语;B站暂定;知乎同名 视频入门介绍可以参考 B站——CVPR 2023最新工作!Neuralangelo:高保真Nerf表面重建 https://www.bilibili.com/video/BV1Ju411W7FL/spm_id_from=333.337.searchcard.all.clickvd_source=03387e75fde3d924cb207c0c18ffa567 图1所示。本文提出Neuralangelo,一种用神经体渲染从RGB图像

    2024年02月08日
    浏览(46)
  • Swin-transformer论文阅读笔记(Swin Transformer: Hierarchical Vision Transformer using Shifted Windows)

    论文标题:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 论文作者:Ze Liu, Yutong Lin, Yue Cao, Han Hu, Yixuan Wei, Zheng Zhang, Stephen Lin, Baining Guo 论文来源:ICCV 2021,Paper 代码来源:Code 目录 1. 背景介绍 2. 研究现状 CNN及其变体 基于自注意的骨干架构 自注意/Transformer来补充CN

    2024年02月07日
    浏览(50)
  • 论文阅读 HighlightMe: Detecting Highlights from Human-Centric Videos

    摘要: 我们提出了一种与领域和用户偏好无关的方法来检测以人为中心的视频中的精彩片段摘录。我们的方法适用于视频中多种可观察到的以人为中心的模态的基于图形的表示,例如姿势和面部。我们使用配备时空图卷积的自动编码器网络来检测基于这些模式的人类活动和交

    2024年02月16日
    浏览(44)
  • (WWW2023)论文阅读-Detecting Social Media Manipulation in Low-ResourceLanguages

    论文链接:https://arxiv.org/pdf/2011.05367.pdf         社交媒体被故意用于恶意目的,包括政治操纵和虚假信息。大多数研究都集中在高资源语言上。然而,恶意行为者会跨国家/地区和语言共享内容,包括资源匮乏的语言。         在这里,我们调查是否以及在何种程度上

    2024年02月12日
    浏览(37)
  • 【论文阅读笔记】Fibroglandular Tissue Segmentation in Breast MRI using Vision Transformers--A multi-institut

    Müller-Franzes G, Müller-Franzes F, Huck L, et al. Fibroglandular Tissue Segmentation in Breast MRI using Vision Transformers–A multi-institutional evaluation[J]. arXiv preprint arXiv:2304.08972, 2023.【代码开放】 本文创新点一般,只做简单总结 【论文概述】 本文介绍了一项关于乳房MRI中纤维腺体组织分割的研究,主

    2024年02月03日
    浏览(43)
  • 【论文阅读笔记】RAAGR2-Net: A brain tumor segmentation network using parallel processing of multiple spatial

    Rehman M U, Ryu J, Nizami I F, et al. RAAGR2-Net: A brain tumor segmentation network using parallel processing of multiple spatial frames[J]. Computers in Biology and Medicine, 2023, 152: 106426.【开放源码】 【论文核心思想概述】 本文介绍了一种名为RAAGR2-Net的新型脑肿瘤分割网络,这是一个基于编码器-解码器架构,用

    2024年02月03日
    浏览(43)
  • 论文阅读:Meta-Prompting

    元提示:任务-不可知论框架 强化 语言模型 “不可知论”,通常用来描述可以应用于多种不同任务的模型,指模型并非为解决特定任务而设计 github.com 摘要: 元提示引导 LM 将复杂的任务分解为更小、更易于管理的子任务,子任务由同一 LM 的不同“专家”实例处理,每个实例

    2024年04月12日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包