实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成

这篇具有很好参考价值的文章主要介绍了实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

社区分享了不少文本生成图像的AIGC(AI生成内容)应用的突破,图像类的生成已经是“红海”了。

我们需要寻找“蓝海”,近期出现了其他内容的突破吗?

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

Mixlab

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

小杜

社区五月份介绍了 Pollinations.ai ,平台集成了文本、图像、音频、视频等多种模态的模型,近期平台功能也进行了迭代升级,但在模型内容质量上还是参差不齐。

最近热度最高的开源模型是  Stable Diffusion,其极为优秀的开源生态也催生了许多模型的整合创新。Stable Diffusion + Mubert 就实现了高质量的图像到音乐的生成。尤其是图片转音乐,不是那种抽象电子风,而是真正具备了应用级配乐的水准!(请看下文)

speech-to-image

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

img-to-music 

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

小杜

speech-to-image demo 使用预先训练的 OpenAI whisper-small 与 Stable Diffusion 从音频样本生成图像。img-to-music 则是发送图像到剪辑询问器 CLIP Interrogator 生成文本提示,然后通过 Mubert 识别文本输出音乐,实现输入图像到生成音乐的过程。

带我们看看测试效果?

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

Mixlab

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

小杜

speech-to-image ,我测试了三类声音到图像的生成

# 人声哼唱(小编的瞎哼)

# 流行音乐 (Golden Hour 前奏+一丢丢人声)

# 环境自然音(小编嘈杂的居住环境)

#01 人声哼唱

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

#02 流行音乐

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

#03 环境音

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python
......

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

小杜

出乎意料的惊喜!对于我们人类,与为文字配插画相比,为音乐配

图似乎是件更为困难的事。音乐的抽象特征与AI生成的特质意外的契合。

AI给第一个哼唱生成了一幅略显俏皮的圣诞老人形象,似乎有点在嘲讽我哼唱得五音不全hh。第二个流行歌曲,AI应该是识别出了歌曲的关键词 “Love” ,虽说没太拼对,但有种为爱情冲昏了头脑的感觉。第三个环境音嘈杂而没有感情色彩,AI也生成了一幅比较契合的黑白色调的拼贴画。

反过来,图像生成音乐是啥效果?

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

Mixlab

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

小杜

那可更惊喜了!我找的音频素材可没AI生成的惊艳~同样也测试了三类图片生成的音乐-# 音频生成的图像

# Stable Diffusion 文本生成的图像

# 艺术画作


#01
 音频生成的图像

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python


#02 文本生成的图像

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python


#03
 名画千里江山图局部

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

......

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

小杜

真是一个比一个惊喜!第一张图是测试 Golden Hour 音频转图像生成的图,反过来生成了有点迷幻电子风的音乐。第二张是用SD生成的概念汽车场景,AI较为精准地 “理解了” 画面内容,生成了科幻枪战的配乐。第三个则是震惊到我了,AI尽然为我挑选的千里江山图生成了有乐章结构的中国风音乐!

Stable Diffusion 的开源生态已经不局限于图像了。在文本-音乐生成模型 Mubert 实现图像-音乐的工作流中,文本是在哪一步生成的呢?

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

Mixlab

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

小杜

img-to-music 使用了 CLIP Interrogator 来生成图像的文字,再通过 Mubert 实现文本转音乐。

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

图像转文本模型demo

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

文本转音频demo

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

小杜

img-to-music 作者 @fffiloni 也展示了他产出的一些输出探索,非常奇妙~

图像转音频 demo

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

小杜

以 img-to-music 为线索,我找出了 Stable Diffusion 较完善的扩展应用模型集成,大家感兴趣也可以自主尝试基于SD模型的应用扩展创新哦~

speech-to-image demo:huggingface.co/spaces/fffiloni/speech-to-image

Image to Music demo:huggingface.co/spaces/fffiloni/img-to-music

CLIP Interrogator:huggingface.co/spaces/pharma/CLIP-InterrogatorMubert demo:

huggingface.co/spaces/Mubert/Text-to-Music

Mubert 项目地址:github.com/MubertAI/Mubert-Text-to-Music

SD 扩展模型应用集成:
github.com/huggingface/diffusers/tree/main/examples/community#speech-to-image

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

小杜

更多有关AIGC最新突破的知识信息,欢迎查阅社群知识库哦~

【双11优惠】元宇宙知识库只需139元

下一期我们再卷卷视频?来点动态内容,AIGC 啥都玩一遍hhh

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

Mixlab

实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成,人工智能,机器学习,计算机视觉,深度学习,python

opus

欢迎留言讨论,参与 AIGC  话题的共创共建~

添加请备注AIGC & 元宇宙

💡文章来源地址https://www.toymoban.com/news/detail-521233.html

到了这里,关于实测AIGC工作流,Stable Diffusion + Mubert 实现图片与音乐的转换生成的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【工作流】Activiti工作流简介以及Spring Boot 集成 Activiti7

    什么是工作流? 工作流指通过计算机对业务流程进行自动化管理,实现多个参与者按照预定义的流程去自动执行业务流程。 文章源码托管:https://github.com/OUYANGSIHAI/Activiti-learninig Activiti5是由Alfresco软件在2010年5月17日发布的业务流程管理(BPM)框架,它是覆盖了业务流程管理、

    2024年02月08日
    浏览(38)
  • Camunda 7工作流引擎 API 以及与Springboot集成实现工作流配置全纪录

    项目中需要用到工作流引擎来设计部分业务流程,框架选型最终选择了 Camunda7,关于 Camunda以及 Activity 等其他工作流 引擎的介绍及对比不再介绍,这里只介绍与现有Springboot项目的集成以及具体使用及配置 流程(PROCESS): 通过工具建模最终生成的BPMN文件,里面有整个流程的定

    2024年02月10日
    浏览(40)
  • GitFlow工作流

    基于 Git 这一版本控制系统,通过定义不同的分支,探索合适的工作流程来完成开发、测试、修改等方面的需求。 例如:在开发阶段,创建 feature 分支,完成需求后,将此分支合并到 develop 分支上;在发布阶段,创建 release 分支,完成阶段开发任务后,将分支合并到 develop 和

    2024年02月22日
    浏览(27)
  • Activity工作流引擎

    目录 一、了解工作流 1、什么是工作流 2、工作流引擎 3、常见工作流引擎 4、Activiti7概述 4.1、Activiti介绍 4.2、建模语言BPMN 4.3、Activiti使用流程 二、Activiti7 1、Activiti使用 1.1、数据库支持 1.2、Activiti环境 1.3、Activiti常用Service服务接口 1.4、流程设计工具 2、Activiti流程操作 2.1、

    2024年02月13日
    浏览(29)
  • Activiti 工作流简介

    1、什么是工作流         工作流(Workflow),就是通过计算机对业务流程自动化执行管理。它主要解决的是“使在多个参与者之间按照某种预定义的规则自动进行传递文档、信息或任务的过程,从而实现某个预期的业务目标,或者促使此目标的实现”。 1.2、工作流系统   

    2024年02月04日
    浏览(38)
  • Git工作流

    main:生产环境,也就是你们在网上可以下载到的版本,是经过了很多轮测试得到的稳定版本。 release: 开发内部发版,也就是测试环境。 dev:所有的feature都要从dev上checkout。 feature:每个需求新创建的分支。 下面介绍一下一个新需求过来的git操作流程: 1.从dev分支上checkou

    2024年02月10日
    浏览(30)
  • 工作流引擎Flowable

    官方手册 一、依赖 二、demo 三、日志文件 在resources中添加日志文件log4j.properties Flowable流程图 Eclipse Designer, 一款Eclipse插件, 用于图形化建模, 测试与部署BPMN2.0流程 FlowableUI Flowable BPMN visualizer, 一款idea插件 从官网下载flowable-6.7.2.zip解压后, 可以看到如下两个文件 将这两个文件

    2024年02月09日
    浏览(38)
  • Git工作流(随笔)

    目录 前言 一、工作流概述 1、概念 2、分类 二、集中式工作流 1、概述 2、介绍 3、操作过程 三、功能分支工作流 1、概述 2、介绍 3、操作过程 1)创建远程分支 2)删除远程分支 四、GitFlow工作流 1、概述 2、介绍   3、操作过程 五、Forking工作流 1、概述 2、介绍 3、操作过程

    2024年02月09日
    浏览(38)
  • Docker工作流

    开发应用 编写Dockerfile 构建Docker镜像 运行Docker容器 测试应用 发布镜像到Hub 迭代更新镜像 首先你需要创建一个应用,这个应用可以是后端应用或者前端应用,任何语言都可以。 比如:我使用IDEA 创建一个Java后端应用,基于Maven构建,工程结构如下: 基于自己的工程来编写

    2024年04月29日
    浏览(25)
  • 云计算工作流调度

    阅读笔记 首先,我们提出了一个更实用的混合云服务流程成本驱动调度模型,该模型在不降低VM部署弹性的情况下更精确地定义资源约束,并考虑了基于间隔的综合收费,包括计费周期和持续使用折扣。 其次,提出了一种改进的基于FWA(烟花算法)的方法来解决这一问题。在

    2024年02月02日
    浏览(52)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包