人工智能AI库Spleeter免费人声和背景音乐分离实践(Python3.10)

这篇具有很好参考价值的文章主要介绍了人工智能AI库Spleeter免费人声和背景音乐分离实践(Python3.10)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在视频剪辑工作中,假设我们拿到了一段电影或者电视剧素材,如果直接在剪辑的视频中播放可能会遭遇版权问题,大部分情况需要分离其中的人声和背景音乐,随后替换背景音乐进行二次创作,人工智能AI库Spleeter可以帮我们完成大部分素材的人声和背景音乐的分离流程。

Spleeter的模型源来自最大的音乐网站Deezer,底层基于深度学习框架Tensorflow,它可以通过模型识别出素材中的背景音乐素材,从而判断出哪些是背景音乐,哪些是外部人声。

Spleeter安装

在终端执行运行pip命令:

pip3 install spleeter --user

安装成功之后,输入命令,检查Spleeter安装路径:

pip show spleeter

程序返回:

PS C:\Users\liuyue\www\videosite> pip show spleeter                                        WARNING: Ignoring invalid distribution -umpy (c:\python39\lib\site-packages)               Name: spleeter                                                                             Version: 2.3.2  
Summary: The Deezer source separation library with pretrained models based on tensorflow.  
Home-page: https://github.com/deezer/spleeter  
Author: Deezer Research  
Author-email: spleeter@deezer.com  
License: MIT  
Location: c:\users\liuyue\appdata\roaming\python\python39\site-packages                    Requires: ffmpeg-python, httpx, librosa, llvmlite, norbert, numpy, pandas, protobuf, tensorflow, typer

说明安装成功。

如果不想在本地搭建深度学习环境,也可以通过Docker镜像安装。关于Docker,请移步:一寸宕机一寸血,十万容器十万兵|Win10/Mac系统下基于Kubernetes(k8s)搭建Gunicorn+Flask高可用Web集群,这里不在赘述。

运行Docker命令:

docker pull deezer/spleeter:3.8-5stems

这里程序加上预训练模型大概需要1.73GB的硬盘空间。

Spleeter分离人声和背景音乐

Spleeter同时支持视频和音频文件的人声和背景音乐分离,Spleeter自带三种预训练模型:

1、人声&伴奏声分离模型 2 stems,分离出两个音轨

2、鼓声、贝斯声及其它声分离模型 4 stems,分离出4个音轨)

3、鼓声、贝斯声、钢琴声及其它声分离模型 5 stems,分离出5个音轨)

后面两种模型相对比较精细,它可以把人声、鼓声、贝斯声、钢琴声各自分离成多个音轨,一般适合音乐行业的专业人士进行使用。

大多数情况下,我们只需要使用第一种模型 2 stems 即可,它将音频分离成两个音轨,人声和背景音乐的声音:

spleeter separate -o /output/ -p spleeter:2stems /test.mp3

这里-o代表输出目录,-p代表选择的分离模型,最后是要分离的素材。

首次运行会比较慢,因为spleeter会下载预训练模型,体积在1.73g左右,运行完毕后,会在输出目录生成分离后的音轨文件:

accompaniment.wav  
vocals.wav

accompaniment.wav代表人声,vocals.wav是背景音乐。

如果是基于Docker安装的,则需要运行对应的Docker命令:

docker run -v $(pwd)/output:/output deezer/spleeter:3.8-5stems separate test.mp3 -o /output

结语

Spleeter可以算是免费的人声和背景音乐分离功能的最佳本地方案了,除了影视剧素材的人声和背景音乐分离的二次创作,如果是在外部环境录制的Vlog,环境音非常嘈杂,而又不得不现场录音,那么使用Spleeter也可以将人声从环境音中分离出来,节省了二次录制画外音的环节。文章来源地址https://www.toymoban.com/news/detail-416105.html

到了这里,关于人工智能AI库Spleeter免费人声和背景音乐分离实践(Python3.10)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【AI人工智能】Phind:免费面向开发者的生成式 AI 搜索引擎 | FREE Generative AI search engine for developers

    Phind 通过简单的解释和来自网络的相关代码片段来回答技术问题。  与ChatGPT和new Bing一样,Phind由大语言模型(Large Language Model (LLM))驱动。体验后,个人感觉在技术方面的检索能力和质量上Phind 比 new Bing 和 ChatGPT 的体验要好得多。 Phind也支持非开发人员相关问题回答,响应

    2023年04月19日
    浏览(47)
  • 【IT资讯速递】ChatGPT自定义功能扩展至免费用户;阿里达摩院宣布免费开放100件AI专利许可;元宇宙平台Decentraland与人工智能公司Inworld合作

    2023年8月12日 星期六 癸卯年六月廿六 第000002号 本文收录于 IT资讯速递 专栏, 本专栏 主要用于发布各种IT资讯,为大家可以省时省力的就能阅读和了解到行业的一些新资讯 8月11日,在浙江省专利公开实施政策公布会上, 阿里达摩院(湖畔实验室)宣布向社会免费开放100件AI专

    2024年02月05日
    浏览(59)
  • 音乐人声分离工具:极简的人声和背景音乐分离工具

    这是一个极简的人声和背景音乐分离工具,本地化网页操作,无需连接外网,使用 2stems/4stems/5stems 模型。 将一首歌曲或者含有背景音乐的音视频文件,拖拽到本地网页中,即可将其中的人声和音乐声分离为单独的音频wav文件,可选单独分离“钢琴声”、“贝斯声”、“鼓声

    2024年01月20日
    浏览(31)
  • 最新人工智能GPT-4免费简单使用教程

    GPT-4比Chatgpt升级了不少,现在还无法使用OpenAI官网或百度文心一言的小伙伴可以尝试以下方法。 打开 nat.dev 登录(sign-in注册时不用填手机号码) 选择GPT-4模型 然后直接空白处用英语或者中文输入问题 想尝试AI作图的方法如下。 打开网页 https://discord.com/ 点击“Open Discord” 发

    2023年04月25日
    浏览(49)
  • 免费的chartGPT 人工智能机器人问答展示

      无意中发现一个特别好用的AI工具,试着问了几个最近一直困扰我的小孩子的幼小衔接的问题,发现比度娘好用。给出的答案更加智能,还可以免费试用。 对于日常的一些问题,回答更具针对性    日常写代码也能轻松搞定  人工智能是一种让计算机系统具备智能的技术和

    2024年02月07日
    浏览(56)
  • 谷歌发布一个免费的生成式人工智能课程

    在过去几周,我们看到的都是AI将如何改变生活,无论是ChatGPT的文本生成,还是SD,Midjourney 的图像生成,这些AI的特点就是都是生成式的AI。而几天前,谷歌推出了一个生成式人工智能学习课程,课程涵盖了生成式人工智能入门、大型语言模型、图像生成等主题。 除了课程外

    2024年02月08日
    浏览(42)
  • 音频分离:分离人声和背景音乐的方法及代码实现

    音频分离是一项重要的音频处理任务,它可以将音频信号中的人声和背景音乐分开,使得我们能够对它们进行独立的处理和分析。本文将介绍一些常用的音频分离方法,并提供相应的代码实现。 基于混合模型的音频分离方法 基于混合模型的音频分离方法利用统计模型对混合

    2024年04月23日
    浏览(28)
  • chat ai人工智能写作(ai人工智能写作神器)

    ChatAI智能写作是一款基于人工智能技术的写作助手,可以帮助用户快速生成高质量的文本内容。它具有以下特点: AI论文,免费大纲,10分钟3万字 👉https://www.aipaperpass.com?pic=mLnw 快速生成文章 :ChatAI智能写作可以根据用户输入的和主题,快速生成符合要求的文章,大大

    2024年03月15日
    浏览(50)
  • 如何将音视频中的伴奏背景音乐和人声分离?

    有时候我们要将某个视频或者音频文件中的人声或者背景音乐提取出来,用来创作视频或者用来做配乐。这时候,我们就要用到一个功能——“人声分离”,这个功能可以轻松地将人声和背景音乐分离成两条音轨。 伴奏的背景音乐对于一首完整的音乐来说,是很重要的,它能

    2024年02月11日
    浏览(39)
  • 【分享】免费并集多个人工智能于一体的在线使用网站

    哈喽,大家好,我是木易巷~ 今天来给大家分享一个集ChatGPT、GPT4、Claude等人工智能于一体的在线使用网站——Poe。 以下是一个汇集了目前热门人工智能工具的网站,只需使用一个神奇的工具,通过邮箱注册账户,即可免费使用。 主要包含 这个网站收录了许多当下流行的人工

    2024年02月11日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包