“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!

这篇具有很好参考价值的文章主要介绍了“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

 夕小瑶科技说 原创
 作者 | 付奶茶

大家之前是否想象过未来的技术进步会带来读脑器,计算界面是否有可能越过触摸屏、键盘进入我们思维内部读取我们脑袋中所想。尽管当前我们社会尚未达到这一阶段,但我们确实逐渐接近这一愿景!

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

不久前,Meta AI宣布了一项名为Image Decoder的深度学习应用,由FAIR-Paris与巴黎文理大学(PSL)巴黎高师(ENS)合作完成。该研究实现了一个重要的里程碑,即可以将人类大脑活动几乎实时地转化为高精度图像,展示观察者的视觉或思维内容。这一系统由图像编码器、大脑编码器、图像编码器组成,在Meta在4月份发布的自监督学习模型DINOv2[1]上训练,利用脑电信号(Magnetoencephalography, MEG)对人脑活动进行解码和可视化。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

这项工作是Meta长期研究计划的一部分,其最终目标是构建一个完全模拟人类学习和推理能力的AI系统。接下来让我们看看他们究竟是怎样做的吧!

论文题目:
《Brain decoding: Toward real-time reconstruction of visual perception》

论文链接:
https://ai.meta.com/static-resource/image-decoding

文章速览

在这里我们首先先介绍一下脑磁图(Magnetoencephalography,MEG)是什么~脑磁图被广泛用于脑功能检测技术,是对脑内神经电流发出的极其微弱的生物磁场信号的直接测量,并记录整个大脑的瞬态数据。通过计算机综合影象信息处理,将获得的信号转换成脑磁曲线图,等磁线图等。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

Image Decoder将机器学习和脑磁图(MEG)结合在一起。首先,分析标记过的数据,然后对新数据进行检查并尽量正确地标记。然后利用脑磁图在头部外侧测量记录大脑活动,使用仪器捕捉人类在思考时大脑磁场的微小变化。这样的做法可以在检索阶段从一组候选的图像中选择正确的图像,然后通过训练直接预测潜在的表示用来调整生成图像模型。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

▲MEG记录连续地与图像的深度表示对齐,然后可以在每个瞬间调节图像的生成。

大脑编码器

作者ConvNet架构进行了调整,标记为fθ,以学习从MEG窗口Xi ∈ RC×T到潜在图像表示zi ∈ R F的投影,针对每个输入进行单一潜在值的回归,并添加了一个时间聚合层和两个MLP头部1,用于从F′投影到目标潜在维度F。

图像编码器

图像编码器学习将 MEG 信号与这些构建出来的图像进行嵌入对齐。作者使用卷积神经网络架构去提取特征,在此基础之上,添加了时序聚合层,以减少维度,节约计算开销。

生成解码器

作者从预训练的嵌入图像中生成图像,使用了基于三个嵌入条件的潜扩散模型:CLIP-Vision(257 tokens × 768), CLIP-Text(77 tokens × 768)和变分自编码器潜AutoKL(4 × 64 × 64),集合这些以及大脑表征生成可信的图像。

训练目标

作者提出的pipeline有多个部分,因此采用多目标优化策略,并在图像检索中采用CLIP Loss。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

为了评估生成图像的质量,使用MSE Loss:

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

最后采用凸组合方方式结合CLIP和MSE进行训练:

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

实验分析

数据集

作者选择在THINGS-MEG数据集上测试方法的有效性,对四位参与者包括两名女性和两名男性,平均年龄23岁)产生的63,000个历史MEG数据进行训练。这些数据来源自患者观看来自12次对话中记录的22,448张不同的图片以及原始图库中200张重复的图片。以这种方式,研究员通过图像解码器可以观察被试者的脑活动看到他们正在想象的内容。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

▲THINGS-MEG1

机器学习是大脑表征的有效模型

作者采用线性岭回归模型(Linear Ridge regression models)来验证检索图像的性能。在实验结果中,所有图像的解码效果都明显高于随机猜测的检索性能,在监督学习和文本/图像对齐模型(如VGG和CLIP)产生了最高的检索分数。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

机器学习是拟合大脑反应过程的有效工具

作者将这些线性基线与相同任务上训练的深度卷积神经网络架构进行比较,即在给定MEG窗口的情况下检索匹配的图像。使用深度模型相对于线性基线实现了7倍的改进。多种类型的图像嵌入产生良好的检索性能,其中VGG-19(监督学习)、CLIP-Vision(文本/图像对齐)和DINOv2(自监督学习)的前5准确率分别为70.33 ± 2.80%,68.66 ± 2.84%和68.00 ± 2.86%。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

时序级图像检索

作者尝试了时间分辨的图像检索实验,尝试拟合大脑中是处理和识别图像的过程。首先对时间进行了切割(250毫秒长的滑动窗口),每次只看大脑处理图像的一小段时间。拟合大脑研究每一帧的视频。在图像未呈现之前,所有的模型表现都很差,就像是随机猜测一样。首次明显的峰值可以在0到250毫秒的窗口上观察到,随后在图像结束后出现第二个峰值,在图像消失后,它们的性能又迅速恢复到了随机猜测的水平。而论文中指出,DINOv2在图像消失后表现仍然表现出了特别好的检索性能。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

为了更好理解解码指标,作者构建了一个由原有测试集与3659张参与者未见过的额外图像合并而成的附加集,结果上来看,检索到的图像往往来自正确的类别,比如“演讲者(Speaker)”或“西兰花(brocoli)”,主要出现在前几个子窗口(t≤1秒)。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

从MEG信号中生成图像

虽然检索任务展现了令人鼓舞的效果,但是他要求真实的样本必须存在于检索集中,这限制了实践中使用的可能性。为了缓解这样的限制,作者训练了三个不同的脑模块,用于预测使用的三个嵌入来生成图像(图5)。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

生成的图像从评估结果中看相对不错,其中多个生成的图像与正确的实际类别相匹配。但是,生成的图像似乎包含有关真实图像的低级视觉信息 虽在最佳的情况下,系统根据MEG数据准确地检索、重建图像的准确率达到了70%,这比过去的方法提高了7倍数。从结果中可以看出,图像解码器虽然可以顺利地从潜在图像库中获取一些简单的图片,例如西兰花、毛毛虫等,但是对于更加复杂多样化的图像比如塔克斯、鳄梨酱料等成功率较低。

背后的伦理

然而,这种技术真的符合伦理标准吗?

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能

研究者们也意识到,这项技术突破的确带来了多个伦理问题。因为深入探查一个人的思维并将其可视化,是一种未被明确定义的新型侵入方式,这涉及到人类心理隐私的保护。

作者在这项技术在伦理隐私上的问题没能给出明确的回复,但是提到目前技术在处理一个人所看到过的具体物体和现实图像时表现最出色。而当个体被要求想象一幅未曾见过的图像时,解码器的准确性就会显著降低。简而言之,获得受试者的同意不仅是法律上的要求,更是脑解码技术实现的基本前提。

此外,作者称如果一个人的脑活动图像是在未经同意的情况下被解码,那么他们可以采用抗干扰来抵抗这种情况,但是,这的的确地需要具备足够的意识和反应速度来反应他们正在处于这样的情况。

“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!,人工智能文章来源地址https://www.toymoban.com/news/detail-721899.html

到了这里,关于“我有一个大胆的想法”?Meta AI 新技术让你的思维图像一览无余!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 国家电网 计算机 《信息新技术》 整理

    分布式数据库、分布式文件系统、虚拟化、区块链等基本概念、主流框架 分布式数据库(DDB,Distributed Database)︰ 数据库 技术与 网络技术相结合 的产物。“ 集中计算\\\"概念向“分布计算\\\"概念发展 。数据按实际需要已在网络上分布存储。分布式数据库是这些大型企业用户(如电

    2023年04月22日
    浏览(45)
  • 云计算环境中需要用到的新技术

    云计算都会用到哪些技术 人工智能(AI)允许机器从处理经验中学习,适应新的数据输入和来源,并最终对AI进行类似人类的分析和调整。人工智能操作的主要方式是消耗大量的数据并识别和分析数据中的模式。人工智能主要有三种类型:分析型、人类启发型和人性化。 分析型

    2023年04月08日
    浏览(62)
  • JMUer-网络新技术课程期末考试复习整理

    ✏️write in front✏️ 📝个人主页:陈丹宇jmu 🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝​ 🙉联系作者🙈by QQ:813942269🐧 🌈致亲爱的读者:很高兴你能看到我的文章,希望我的文章可以帮助到你,祝万事顺意🏳️‍🌈 ✉️少年不惧岁月长,彼方尚有荣光在 🏆 题型 分值

    2024年02月04日
    浏览(30)
  • Java 新技术:虚拟线程使用指南(二)

    虚拟线程是在 Java 21 版本中实现的一种轻量级线程。它由 JVM 进行创建以及管理。虚拟线程和传统线程(我们称之为平台线程)之间的主要区别在于,我们可以轻松地在一个 Java 程序中运行大量、甚至数百万个虚拟线程。 由于虚拟线程的数量众多,也就赋予了 Java 程序强大的

    2024年02月03日
    浏览(28)
  • 引领创新的软件开发和新技术实践

    在快速发展的科技时代,软件开发领域不断涌现出新的技术和创新方法。通过引领创新的软件开发和积极应用新技术,团队可以更好地适应市场需求,提高产品竞争力。本文将介绍一些引领创新的软件开发和新技术实践。 采用敏捷开发方法和迭代模型,将软件开发过程划分为

    2024年01月22日
    浏览(40)
  • 新技术前沿-2023-ChatGPT基于人工智能技术的聊天机器人

    chatgpt镜像网站 一文带你了解爆火的Chat GPT ChatGPT系列文章 为什么ChatGPT这么强?—— 一文读懂ChatGPT原理! ChatGPT是一种基于人工智能技术的聊天机器人,它可以模拟人类对话,回答用户的问题和提供相关信息。ChatGPT使用 自然语言处理技术 ,可以与用户进行语音或文本交互,

    2023年04月15日
    浏览(62)
  • 替代堆叠的新技术M-lag

    M-lag:跨设备链路聚合组,是一种实现跨设备链路聚合的机制。将一台设备与另外两台设备进行跨设备链路聚合,从而把链路的可靠性从单板级提升到设备级,组成双活系统。 基本概念: peer-link链路:是一条聚合链路(可靠性),用于协商报文及传输部分流量。 keepalive链路

    2024年01月21日
    浏览(39)
  • 3D轻量化引擎推出新技术,模型渲染更逼真!

    HOOPS Communicator在2021版本中,推出了基于PBR(Physically Based Rendering)的渲染特性以提供更高质量的渲染技术。 PBR将材料表示为一系列方程,这些方程对光如何从表面反射进行建模,再通过GPU上运行的着色器代码进行有效地实现。 在过去的30年里,PC端的3D轻量化功能取得了令人

    2024年02月08日
    浏览(24)
  • 金融私有云IAAS领域、云平台领域、架构领域、新技术领域的技术展望

    【摘要】 本文展望了金融私有云IAAS领域、云平台领域、架构领域、新技术领域的技术发展,包括需求背景、优势、缺点、应用场景,供金融同行参考。 在新一轮科技革命和产业变革的背景下,从金融数字化角度来看,金融行业对于科技的要求越来越高,也日益聚焦于金融科

    2023年04月10日
    浏览(32)
  • Segment Anything:突破边界的图像分割新技术解析

    Segment Anything论文地址: https://arxiv.org/pdf/2304.02643.pdf 在自然语言处理中,基于大规模语言模型的零样本和少样本学习已经取得了重要进展。在计算机视觉领域,例如CLIP和ALIGN,通过工程化的文本提示可以实现对新视觉概念的零样本泛化。 本论文中,我们提出了可提示的分割任

    2024年02月12日
    浏览(24)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包