从文本创建艺术,AI图像生成器的数据集是如何构建的

这篇具有很好参考价值的文章主要介绍了从文本创建艺术,AI图像生成器的数据集是如何构建的。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

AIGC系列分享是整数智能推出的一个全新分享系列,在这个系列中,我们将介绍与AIGC概念相关的有趣内容。AIGC系列主要分为以下几篇文章:

  • 被称为下一代风口的AIGC到底是什么?

  • AIGC的数据集构建方案分享系列

  • 从文本创建艺术,AI图像生成器的数据集是如何构建的

  • ChatGPT的数据集构建方案(敬请期待)

  • 未完待续......


最近,“AI绘画”吸引了很多人的目光,而“AI绘画”在近期取得如此巨大进展的原因之一得益于Stable Diffusion的开源。

从文本创建艺术,AI图像生成器的数据集是如何构建的

引自Imagen官网

什么是文图生成技术

从文本创建艺术,AI图像生成器的数据集是如何构建的

文本描述:A small cabin on top of a snowy mountain in the style of Disney, artstation

文图生成技术的研究开始于2010年中期,伴随着深度学习技术的发展而进步。截至2023年2月,目前已知的最先进的文生图模型有:OpenAI的DALL-E2、Google的ImageGen和StableilityAI的Stable Diffusion。这些模型生成的图片已经开始接近真实照片以及人类所绘艺术作品的质量。

在深度学习兴起之前,搭建文本到图像模型的尝试仅限于通过排列现有的组件图像进行拼贴,例如从剪切画数据库中选择图像形成类似于拼贴画的图像。随着深度学习的发展,越来越多的机构提出基于深度学习的文生图模型。

2015年,由多伦多大学研究人员提出第一个现代化文生图模型:alignDRAW。它使用带有注意力机制的循环变分自动编码器来扩展之前的DRAW架构,使其能以文本序列作为输入。尽管alignDRAW生成的图片是模糊,不逼真的,但是该模型能够归纳出训练数据中没有的物体。并且可以适当地处理新的文本描述,例如:“停车标识在蓝天上飞”。这表明该模型在一定程度上可以理解语言描述,并生成新的东西,而不是仅仅在“回放”训练集中的数据。

从文本创建艺术,AI图像生成器的数据集是如何构建的

文本描述:停车标识在蓝天上飞,引自aligenDRAW论文

2016年,Reed、Akata、Yan等人首先试图将生成对抗网络(GAN)用于文生图任务。他们通过在特定领域的数据集上训练生成器以及判别器。训练完成的模型能够从文本描述中生成“视觉上可信的”物体。但是,基于GANs生成的图片在视觉上只可“远观”,在细节上缺乏一致性。此外,基于GANs生成的图片多样性不够好,生成的图片都差不多,原创性不佳。常见的基于GANs的文图生成模型有:AttnGAN、DM-GAN、DF-GAN、XMC-GAN、VQGAN+CLIP、GauGANs、StyleGAN、Make-A-Scen等。

2021年1月,OpenAI发布了DALL-E,这是最早引起公众广泛关注的文生图模型之一。DALL-E模型是GPT-3的多模态实现,它基于Transformer架构,拥有120亿个参数。该模型在一个从网上收集的包含2.5亿个图像文本对的数据集上进行训练得到。DALL-E会根据文本描述生成多个图像,之后由CLIP模型对这些图像进行排序,以呈现最高质量的图像。除了生成各种风格的图像(相机写实主义图像、绘画、表情符号等)之外,它还可以“操作和重新排列”图像中的对象。其创作者指出DALL-E的一项能力是在没有明确指示的情况下将设计元素正确放置在新颖的作品中。例如,输入文本:“穿着圣诞衣服的企鹅”。DALL-E不仅生成企鹅穿着毛衣的图像,还会生成与主题相关的圣诞老人的帽子。如下所示:

从文本创建艺术,AI图像生成器的数据集是如何构建的

文本描述:穿着圣诞衣的企鹅

同年4月份,OpenAI宣布了新版本的DALL-E2,宣称它可以从文本描述中生成照片般逼真的图像。与DALL-E相比,DALL-E2在速度、图像质量、训练数据集以及语言理解能力都有了显著改进。不过有时候模型也会出现错误。比如DALL-E2就无法区分:“黄色的书和红色的花瓶”。

从文本创建艺术,AI图像生成器的数据集是如何构建的

文本描述:黄色的书和红色的花瓶,左边图片由Imagen生成,右边图片由DALL-E2生成,引自Imagen论文

2022年5月,Google推出Imagen。它是一种文本到图像(text-to-image)扩散模型(diffusion model),具有前所未有的逼真度和深度的语言理解。Imagen建立在大型Transformer语言模型理解文本语义的能力之上,依赖于扩散模型生成高保真的图像。Imagen表明了以下四点结论:

  1. 冻结大型预训练模型的文本编码器对于文本到图像任务非常有效

  1. 缩放预训练文本编码器的大小比缩放扩散模型的大小更重要

  1. 提出一种新的阈值扩散采样器,可以使用非常大的无分类器指导权重

  1. 引入了一种新的高效的U-Net架构,其计算效率更高,内存效率更高,收敛速度更快文章来源地址https://www.toymoban.com/news/detail-508058.html

到了这里,关于从文本创建艺术,AI图像生成器的数据集是如何构建的的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AIGC系列文章目录 第三章 AIGC 简单易用免费的AI图像生成器: Stable Diffusion

    目前亲测体验的AI图像生成器有NovelAI、MJ和Stable Diffusion。其中, 支持免费、无限生成、超高专业级画质 的只有 Stable Diffusion 。 Stable Diffusion 由 Stable Diffusion XL 提供支持,是一款最先进的工具,可以将您的想象力变为现实。 只需点击几下和简单的文本输入,您就可以创建令人

    2024年02月03日
    浏览(67)
  • ai论文生成器哪家好用?ai写作生成器免费

    AI论文生成器的好坏取决于具体的需求和场景,因此很难一概而论。以下是一些常见的AI论文生成器,供您参考: AIPaperPass:这是一款全智能自动写作平台,拥有自主模型并对外开放API接口。它可以根据用户提供的和要求,自动生成高质量的文章内容,并且支持批量写作

    2024年01月19日
    浏览(92)
  • AI绘画生成器推荐AI绘画自动生成器有哪些?

    1、DALL-E2 DALL-E2 是由 OpenAI 开发的 AI 图像生成器。只需几分钟,你就可以使用 AI 创建高度逼真的图像。 2、Deep Dream Generator Deep Dream是一个经过数百万张图像训练的神经网络。使用方便,只需要上传一张图片,工具即可根据原图生成新图片。 3、Artbreeder Artbreeder一款图像质量增

    2024年02月06日
    浏览(92)
  • 周星驰 Web3 团队将上线独立 App;Gemini 刚发就惹质疑:效果视频疑似剪辑;Meta 推独立AI图像生成器|极客头条...

    「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点! 小米澎湃 OS 首批正式版开始陆续推送 周星驰 Web3 团队下月上线独立

    2024年02月04日
    浏览(50)
  • ai绘画生成器有哪些?分享3款好用的ai自动绘画生成器

    文字和绘画是两种看似不同的艺术形式,但它们之间却有着一种神奇的联系。你或许曾经在一些创意绘画作品中发现过使用文字进行表达的元素,那么,文本究竟如何生成这些令人惊叹的艺术作品呢?今天,我们就来探索一下文字怎样可以生成创意绘画。 方法一:使用AI图片

    2024年02月10日
    浏览(79)
  • ai绘画生成器app是什么?安利三款ai绘画生成器app

    你是否曾经因为缺乏艺术细胞而自卑,或者看到别人画风清奇而嫉妒不已?现在,你可以放心大胆地发挥创造力了,因为有了ai绘画生成器,想要成为艺术大师已经不再是梦想!这些app让你在不会画画的情况下也可以轻松创造出艺术作品! 它们就像是一个魔法盒子,里面充满

    2024年02月11日
    浏览(63)
  • ai绘画生成器男生可以用吗?你知道ai绘画生成器有哪些吗?

    ai绘画是借助人工智能技术和机器学习算法所开发出来的一种新型数字绘画方式,通过使用ai绘画生成器,我们能够轻松快速地创作出许多效果不错的艺术作品。那么你知道ai绘画生成器有哪些吗?另外ai绘画生成器男生能学吗?下面我会给大家推荐三款比较好用的ai绘画生成器

    2024年02月11日
    浏览(57)
  • 函数图像生成器 (吉林大学 孙立鑫)

    目录 函数图像生成器 1.直角坐标系 2.极坐标系 3.参数方程 a.角度(圆锥曲线) b.距离(直线)   在学习编程过程中,我们可能会遇见十分复杂的函数,因此我们需要强大的工具来辅助分析。这篇文章我们来深入讨论如何生成各种函数以及曲线方程的图像。   为了清晰简洁,

    2024年02月06日
    浏览(46)
  • ai写作生成器(论文ai写作网站)

    论文大纲作为论文的纲要和导航,其重要性不言而喻。幸运的是,借助AI PaperPass这一工具,我们可以轻松获得免费的论文大纲,为我们的论文写作提供有力的指导和支持。 ▼输入【学科】+【论文题目】+【字数】 AI论文,免费大纲,10分钟3万字 ,查重高于15%退费,支持数据图

    2024年04月16日
    浏览(82)
  • 怎么把文字生成图片?三款ai绘画生成器分享

    如果你对ai绘画工具有一定了解的话,你就会知道:市面上大部分ai绘画工具都是收费。再退一步讲,我们暂且不论收费价格的高低,大多数收费的ai绘画工具也不一定能准确匹配我们的需求。 仅仅在学生党和工作党之间,对ai绘画工作的使用需求的差别就如此明显,更何况几

    2024年02月12日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包