文献研读|AIGC溯源场景及研究进展

这篇具有很好参考价值的文章主要介绍了文献研读|AIGC溯源场景及研究进展。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言:本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。

如下图所示,在AIGC生成阶段,有4种溯源场景:

1)生成模型溯源训练数据
2)微调模型溯源预训练模型
3)AIGC溯源训练数据/训练概念
4)AIGC溯源生成模型
文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源
下面分别对不同溯源场景下的相关工作进行介绍。



Detection and Attribtion of Models Trained on Generated Data. ICASSP, 2024.

Scenario: 生成模型溯源训练数据

RQ1:模型的训练数据为 real data / fake data?
RQ2:若模型的训练数据为 fake data,则由哪个 GAN 生成?

目标:判断 target model 的训练数据来源

核心思想:
Real dataset 分成:training data, probing dataset,testing data.

  1. 首先用 training data 训练 GANs,得到 GAN-generated data;
  2. 分别用 GAN-generated data 和 real data 训练 surrogate models 和 target models;
  3. 使用 probing dataset 探测 surrogate model 得到 output,用GAN数据训练的 surrogate model 的输出标签均为0,用真实数据训练的 surrogate model 的输出标签均为1,得到 binary dataset;
  4. 使用 binary dataset 训练 detector 。
  5. 使用 testing dataset 探测 target model 得到 output,如果该 target model 基于GAN数据训练,则其 output 送入 detector 的预测标签应该为0,否则应该为1.
    文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源

若为溯源问题,则对于步骤3:

  • Closed-World Attribution:binary dataset 改成多标签分类问题
  • Open-World Attribution:probing set 改为GAN生成数据,若probe image 和 model 训练使用的GAN数据来源一致,则标签为 1。

Matching Pairs: Attributing Fine-Tuned Models to their Pre-Trained Large Language Models. ACL, 2023.

Scenario: 微调模型溯源预训练模型
文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源
Code: https://github.com/IBM/model-attribution-in-machine-learning

核心思想:通过联合微调模型与预训练模型生成结果与提示词的特征,训练分类器,采用集成学习的方式确定微调模型对应的预训练模型。
文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源


Evaluating Data Attribution for Text-to-Image Models. ICCV, 2023.

Page: https://github.com/peterwang512/GenDataAttribution

Scenario: AIGC 溯源训练数据

核心思想:首先构建具有对应关系的溯源数据集,然后使用对比学习的方式,优化特征提取器。

文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源

数据集构建

文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源

特征提取器训练

文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源

特征提取器训练的目标是:使得具有对应关系的合成图像+范本图像距离更近,而无对应关系的合成图像+范本图像距离更远。具体使用对比学习损失来进行训练。


ProMark: Proactive Diffusion Watermarking for Causal Attribution. CVPR, 2024.

Scenario: AIGC 溯源训练概念(概念水印)
文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源

核心思想:使用水印嵌入的方式,实现概念水印的嵌入和提取。

文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源


DE-FAKE: Detection and Attribution of Fake Images Generated by Text-to-Image Generation Models, CCS, 2023.

Scenario: AIGC 溯源生成模型

文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源

核心思想:训练二/多分类器,溯源生成模型。

(1)Image-Only: image 特征提取,后训练(ResNet-18)
(2)Hybrid: image 和 prompt 的特征联合提取拼接,后训练(CLIP+MLP)

文献研读|AIGC溯源场景及研究进展,论文研读,AIGC,溯源,水印,概念水印,AIGC溯源


参考文献文章来源地址https://www.toymoban.com/news/detail-854554.html

  1. Han G, Salem A, Li Z, et al. Detection and Attribution of Models Trained on Generated Data. ICASSP, 2024.
  2. Foley M, Rawat A, Lee T, et al. Matching Pairs: Attributing Fine-Tuned Models to their Pre-Trained Large Language Models. ACL, 2023.
  3. Wang S Y, Efros A A, Zhu J Y, et al. Evaluating data attribution for text-to-image models. ICCV, 2023.
  4. Asnani V, Collomosse J, Bui T, et al. ProMark: Proactive Diffusion Watermarking for Causal Attribution. CVPR, 2024.
  5. Sha Z, Li Z, Yu N, et al. De-fake: Detection and attribution of fake images generated by text-to-image generation models. CCS, 2023.

到了这里,关于文献研读|AIGC溯源场景及研究进展的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 武器目标分配问题研究进展: 模型、算法与应用

    源自:系统公正与电子技术 作者:李梦杰  常雪凝  石建迈  陈超  黄金才  刘忠 武器目标分配问题是指挥控制与任务规划领域的关键难点之一, 也是军事运筹领域的基础研究课题。经过多年研究, 武器目标分配问题在陆海空天电等领域都得到了广泛研究, 涌现出了大量模型

    2024年02月10日
    浏览(41)
  • 机器人自动轴孔装配研究进展

    【摘 要】 轴孔装配是加工制造业常见的一类操作任务。基于工业机器人研究轴孔自动装配,对于机器人在装配领域的应用具有重要价值。对于高精密和形状复杂的零件,高效可靠的轴孔装配仍然具有很大挑战性。基于此,从控制的角度对机器人自动轴孔装配进行了全面梳理

    2024年01月17日
    浏览(41)
  • 区块链技术研究综述:原理、进展与应用

    来源:区块链技术研究综述:原理、进展与应用     期刊:通信学报。 #blockchain 相当于对区块链先进行一个系统的了解吧                                                  区块链的层次化技术结构。 #未解决的问题 上述文 献虽 然归纳得较为完整,

    2024年02月13日
    浏览(41)
  • 详解信道估计的发展与最新研究进展(MIMO)

    目录 一. MIMO信道估计的重要性 二. 最经典的两种信道估计方法 2.1 最小二乘信道估计(LS) 2.2 最小均方误差信道估计(MMSE)  三. 优化传统的MIMO信道估计技术 四. 介绍压缩感知技术 五. 基于压缩感知的MIMO信道估计 5.1 压缩感知怎么用在MIMO信道估计 5.2 改进压缩感知用在信道估计

    2023年04月09日
    浏览(48)
  • 基于机器视觉的表面缺陷检测方法研究进展(2022最新)

    参考文献:基于机器视觉的表面缺陷检测方法研究进展-赵朗月 此文章仅为作者阅读学习记录,如有错误欢迎指正交流,如果对你有帮助还望点赞支持,谢谢! 给出了缺陷的定义、分类及缺陷检测的一般步骤,阐述传统方法、机器学习、深度学习,并比较和分析了优缺点。

    2024年02月08日
    浏览(36)
  • 区块链在车联网数据共享领域的研究进展

    摘要 车联网中实现高效、安全的共享数据对智慧交通的发展具有重要意义。将区块链技术与车联网相结合,在促进车联网数据共享和隐私保护改善方面都有巨大的潜力,但仍然存在区块链技术如何保证车联网数据安全共享的问题。针对这一问题,对区块链和车联网技术融合的最新

    2024年02月08日
    浏览(46)
  • 时空知识图谱研究进展与展望Spatiotemporal Knowledge Graph

    时空知识图谱研究进展与展望 时空知识图谱研究进展与展望 陆锋1, 2, 4, 5, *,  诸云强1, 2, 4,  张雪英3, 4 作者信息  + Spatiotemporal Knowledge Graph: Advances and Perspectives LU Feng1, 2, 4, 5, *,  ZHU Yunqiang1, 2, 4,  ZHANG Xueying3, 4 Author information  + 文章历史  + 摘要 地理信息 的不断泛

    2024年04月22日
    浏览(42)
  • 《多智能体博弈学习研究进展--罗俊仁,张万鹏》论文笔记

    目录 一、引言 二、多智能体学习简介 2.1多智能体学习系统组成  2.2 多智能体学习概述  2.3 多智能体学习研究方法分类   三、 多智能体博弈学习框架  3.1 多智能体博弈基础模型及元博弈  3.1.1 多智能体博弈基础模型   3.1.2 元博弈模型 3.2 均衡解概念与博弈动力学 3.2.1 均

    2024年02月02日
    浏览(43)
  • 内存计算研究进展- 针对图计算的近数据计算架构

        针对图计算的近数据计算架构的代表性工作有: Seoul National University的 Tesseract和 Georgia Institute of Technology 的 GraphPIM,具体如下。 1 Tesseract     Tesseract是一个针对图计算的可编程的内存计算系统架构,它综合了图计算的特点,重新考虑了逻辑单元和存储单元的集成方式。

    2024年02月21日
    浏览(44)
  • 内存计算研究进展-针对机器学习的近数据计算架构

        针对机器学习的近数据计算架构代表性工作有: Georgia Institute of Technology的BSSync (bounded staled sync) 和 Neurocube,Advanced Micro Devices 的 CoML,具体如下。 1 BSSync     BSSync指出,在并行实现的机器学习应用中,原子操作用来保障无锁状态下算法的收敛,但带来很大的同步开销,

    2024年02月21日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包