【AI绘画发展史】AI绘画从历史到技术突破,何以突飞猛进?

这篇具有很好参考价值的文章主要介绍了【AI绘画发展史】AI绘画从历史到技术突破,何以突飞猛进?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

AI绘画的进展

感到吃惊是完全正常的, 因为从去年到今年, AI绘画的技术确实出现了连续的突破性的进展, 从CLIP模型基于无需标注的海量互联网图片训练大成, 到CLIP开源引发的AI绘画模型嫁接热潮, 然后找到了Diffusion扩散化模型作为更好的图像生成模块, 最后使用潜空间降维的改进方法解决了Diffusion模型时间和内存资源消耗巨大的问题

开源贡献

一、CLIP+VQGAN

  1. 计算机数据科学家 Katherine Crowson
  2. 利用CLIP计算出文字和图像特征值相匹配, 把这个匹配验证过程链接到负责生成图像的AI模型 (比如VQ-GAN) , 负责生成图像的模型反过来推导一个产生合适图像特征值, 能通过匹配验证的图像, 就得到一幅符合文字描述的作品了
  3. CLIP+VQGAN 引领了全新一代 AI图像生成技术的风潮,现在所有的开源 TTI(Text to Image, 文本文本生成图像)模型的简介里都会对 Katherine Crowson 致谢,她是当之无愧的全新一代AI绘画模型的奠基者。
  4. 没火起来的原因:GAN类模型的生成结果始终不尽如人意,由Disco Diffusion这个线上服务所引爆
  5. 另外一种图像生成方式:Diffusion扩散模型,基本原理其实就是"去噪点"。就是我们熟悉的手机拍照(特别是夜景拍照)的自动降噪功能。如果把这个去噪点的计算过程反复进行,在极端的情况下,可能把一个完全是噪声的图片还原为一个清晰的图片

二、CLIP

  1. 2021年初,OpenAI团队开源发布CLIP
  2. 图像生成引擎DALL-E。DALL-E内部用了CLIP,但DALL-E并不开源

三、LAION-5B和LAION-Aesthetics

  1. LAION 是一个跨全球的非营利机器学习研究机构。
  2. 2022年3月开放了当前最大规模的开源[跨模态数据库]LAION-5B,包含接近60亿(5.85 Billion)个图片-文本对。
  3. 提供的海量训练素材库,可以被用来训练所有从文字到图像的的生成模型,也可以用于训练 CLIP这种用于给文本和图像的匹配程度打分的模型,而这两者都是现在 AI 图像生成模型的核心。
  4. LAION 还训练 AI 根据艺术感和视觉美感,给LAION-5B 里图片打分,高分的图片形成LAION-Aesthetics 数据集。
  5. 最新的AI绘画模型都是利用LAION-Aesthetics这个高质量数据集训练出来的。

AI绘画模型/产品

一、Disco Diffusion

  1. 第一个基于CLIP + Diffusion 模型的实用化AI绘画产品。
  2. 缺点:并没有取代人工创作的能力的核心原因:无法刻画具体细节、渲染时间特别长

二、MidJourney

  1. 在线AI作画神器优点:零门槛的交互和非常好的输出结果
  2. 利用基于Discord的MidJourney bot进行对话式绘画创作
  3. 付费服务,迭代更新快

三、Stable Diffusion

  1. 开源研发团队 EleutherAI 作为技术核心团队支持了Stability.AI,推出了AI绘画模型 Stable Diffusion,并承诺完全开源。
  2. Stable Diffusion和之前的Diffusion扩散化模型相比,把模型的计算空间,从像素空间经过数学变换,在尽可能保留细节信息的情况下降维到一个称之为潜空间(Latent Space)的低维空间里,然后再进行繁重的模型训练和图像生成计算。

MidJourney (VS) Stable Diffusion

从输出风格上看

  • MidJourney针对人像做了一些优化,细腻讨巧、油腻一点点。出人像图或者糖水风格美图
  • Stable Diffusion的作品,更淡雅一些,更艺术化一些,风格变化多样性。

AI绘画的突破对人类意味着什么

2022年的AI领域,基于文本生成图像的AI绘画模型是风头无两的主角。

  • 2月份 Disco Diffusion上线
  • 4月 DALL-E 2和MidJourney邀请内测
  • 5月和6月 Google发布两大模型Imagen 和Parti (不开放内测只有论文)
  • 7月底 Stable Diffusion横空出世并开源

数学真是世界至高法则

类似Stable Diffusion这种AI生成模型和很多深度学习AI模型的一个核心思路文章来源地址https://www.toymoban.com/news/detail-487080.html

  • 把人类创作的内容,表示为某个高维或者低维数学空间里的一个向量(更简单的理解,一串数字)
  • 如果这个"内容->向量"的转化设计足够合理,那么人类所有的创作内容都可以表示为某个数学空间里的部分向量而已。
  • 而存在于这个无限的数学空间里的其他向量,正是那些理论上人类可能创造,但尚未被创造出来的内容。
  • 通过逆向的"向量->内容"的转换,这些还没被创造的内容就被AI挖掘出来了。

文章本天成,妙手偶得之

  • AI可以说是在创作新的内容,也可以说是新绘画作品的搬运工。
  • AI产生的新绘画作品在数学意义上一直客观存在,只是被AI通过很聪明的方式,从数学空间里还原出来而已。
  • 这句话放在这里非常合适。这"天",是那个无限的数学空间。而这"手",从人类换成了AI。

到了这里,关于【AI绘画发展史】AI绘画从历史到技术突破,何以突飞猛进?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop 发展史及其关键技术 TechExplorist

    作者:禅与计算机程序设计艺术 Hadoop(

    2024年02月05日
    浏览(33)
  • 【Docker】Docker使用之容器技术发展史

    🎬 博客主页:博主链接 🎥 本文由 M malloc 原创,首发于 CSDN🙉 🎄 学习专栏推荐:LeetCode刷题集 🏅 欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! 📆 未来很长,值得我们全力奔赴更美好的生活✨ 🐤本篇文章将讲述Docker容器的技术发展史 😁容器不是一个新概念或者新

    2024年02月12日
    浏览(22)
  • 【AI绘图】一、stable diffusion的发展史

    本文目标:学习交流 对于熟悉SD的同学,一起学习和交流使用过程中的技巧和心得。 帮助新手 帮助没有尝试过SD但又对它感兴趣的同学快速入门,并且能够独立生成以上效果图。 1.发展史介绍: 2015年的时候,有几位大佬基于非平衡热力学提出了一个纯数学的生成模型 (Sohl

    2024年02月09日
    浏览(34)
  • AIGC的发展史:从模仿到创造,AI的创造性探索

    在 AI时代,人工智能不再是简单的机器,而是一个具有无限创造力的创造者。AIGC的诞生是人工智能从模仿到创造的一种进步,也是对人类创造力的一种新探索。 而这种由AI生成的内容究竟是如何发展而来的呢?在本文中,我们将探讨AIGC的发展史,从其初期的模仿到逐渐实现

    2024年02月11日
    浏览(26)
  • Docker从认识到实践再到底层原理(二-1)|容器技术发展史+虚拟化容器概念和简介

    那么这里博主先安利一些干货满满的专栏了! 首先是博主的高质量博客的汇总,这个专栏里面的博客,都是博主最最用心写的一部分,干货满满,希望对大家有帮助。 高质量博客汇总 然后就是博主最近最花时间的一个专栏《Docker从认识到实践再到底层原理》希望大家多多关

    2024年02月09日
    浏览(27)
  • 【发展史】鼠标的发展史

    最早可以追溯到1952年,皇家加拿大海军将5针保龄球放在能够侦测球面转动的硬件上,这个硬件再将信息转化成光标在屏幕上移动,用作军事计算机输入。这是我们能够追溯到的最早的依靠手部运动进行光标移动的输入设备。但当时这个东西不叫鼠标,而且看上去也不像mous

    2024年02月08日
    浏览(29)
  • C++发展史

    目录 什么是C++ C++的发展史 C++的重要性 C++在实际工作中的应用 “21天教你学会C++” 先看看祖师爷,记得多拜拜🤭 C语言是结构化和模块化的语言,适合处理较小规模的程序。对于复杂的问题,规模较大的 程序,需要高度的抽象和建模时,C语言则不合适。为了解决软件危机,

    2024年01月18日
    浏览(37)
  • 细说元宇宙发展史

    元宇宙作为时下一个热门的产业,凭借着强大的潜力,吸引了全球范围内大量企业的参与。但事实上,元宇宙这一概念,并非是一个全新的名词,它早在数十年前就已经出现在我们的视野当中,那么,就让我们来探索元宇宙的这一段发展时吧,进一步深度了解什么是元宇宙。

    2023年04月10日
    浏览(30)
  • 大语言模型发展史

    2023年可谓是生成式AI元年,大语言模型从崭露头角到锋芒毕露,已然成为人工智能领域的关键推动力。这一创新性的技术不仅在自然语言处理领域崭露头角,更深刻地改变了我们对人机交互、智能助手和信息处理的认知。那么大语言模型的发展历程如何呢?由我来剖析其演进

    2024年02月03日
    浏览(40)
  • Unity发展史

    Unity历史 2004年诞生于丹麦阿莫斯特 2005年06月:Unity 1.0发布 2006年06月:Unity 1.5发布 2007年10月:Unity 2.0发布,增加地形引擎、实时动态阴影,支持DirectX 9,并具有内置的网络多人联机功能。 2008年06月:Unity 支持Will 2008年10月:Unity 支持iphone 2009年03月:Unity 2.5发布,增加对w、

    2024年02月16日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包