一、环境
ubuntu 20.04
python 3.8
cuda 11.8
二、部署
1、docker方式部署
1.1、安装docker
如何安装docker,可以参考这篇文章
1.2、拉取镜像
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest
2、完整安装
安装python
依赖
conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
pip install torch torchaudio
pip install numpy numba scipy transformers==4.26.1 soundfile yacs g2p_en jieba pypinyin
安装git lfs
和下载模型
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
git lfs install
git lfs clone https://huggingface.co/WangZeJun/simbert-base-chinese WangZeJun/simbert-base-chinese
下载预训练模型
https://drive.google.com/drive/folders/1y6Xwj_GG9ulsAonca_unSGbJ4lxbNymM
将预训练模型放在源码中的位置
WangZeJun/simbert-base-chinese
下载源码
git clone https://github.com/lukeewin/EmotiVoice.git
在源码路径中创建目录保存预训练模型
mkdir -p outputs/style_encoder/ckpt
mkdir -p outputs/prompt_tts_open_source_joint/ckpt
将g_*
, do_*
文件放到outputs/prompt_tts_open_source_joint/ckpt
,将checkpoint_*
放到outputs/style_encoder/ckpt
中
推理输入文本格式是:<speaker>|<style_prompt/emotion_prompt/content>|<phoneme>|<content>
- 例如:
8051|非常开心|<sos/eos> uo3 sp1 l ai2 sp0 d ao4 sp1 b ei3 sp0 j ing1 sp3 q ing1 sp0 h ua2 sp0 d a4 sp0 x ve2 <sos/eos>|我来到北京,清华大学
- 其中的音素(phonemes)可以这样得到:
python frontend.py data/my_text.txt > data/my_text_for_tts.txt
.
TEXT=data/inference/text
python inference_am_vocoder_joint.py \
--logdir prompt_tts_open_source_joint \
--config_folder config/joint \
--checkpoint g_00140000 \
--test_file $TEXT
合成的语音结果在:outputs/prompt_tts_open_source_joint/test_audio
文章来源:https://www.toymoban.com/news/detail-757259.html
pip install streamlit
streamlit run demo_page.py
更多内容文章来源地址https://www.toymoban.com/news/detail-757259.html
到了这里,关于服务器部署网易开源TTS | EmotiVoice部署教程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!