NATSpeech:通过HuggingFace演示实现高质量的文本到语音

2022-02-17 16:51:31

##我们在Linux/Ubuntu 18.04上进行了测试首先安装Python 3.6+(建议使用Anaconda)。导出PYTHONPATH=。#构建虚拟环境(推荐)。python-m venv-venv-source-venv/bin/activate#安装要求。pip安装-U pip安装Cython numpy==1.19.1pip安装火炬==1.9.0#火炬>;=1.9.0建议的PIP安装-r要求。txtsudo apt安装-y sox libsox-fmt-mp3bash mfa_usr/install_mfa。sh#安装强制对准工具

@文章{ren2021portaspeech,标题={PortaSpeech:可移植和高质量生成文本到语音},作者{Ren,Yi和Liu,Jinglin和Zhao,Zhou},期刊={神经信息处理系统的进展},卷={34},年份={2021}

@文章{liu2021diffsinger,title={Diffsinger:通过浅层扩散机制进行声音合成},作者{Liu,Jinglin and Li,Chengxi and Ren,Yi and Chen,Feiyang and Liu,Peng and Zhao,Zhou},期刊{arXiv预印本arXiv:2105.02446},卷{2},年份{2021}