NATSpeech：通过HuggingFace演示实现高质量的文本到语音

2022-02-17 16:51:31

##我们在Linux/Ubuntu 18.04上进行了测试首先安装Python 3.6+（建议使用Anaconda）。导出PYTHONPATH=。#构建虚拟环境（推荐）。python-m venv-venv-source-venv/bin/activate#安装要求。pip安装-U pip安装Cython numpy==1.19.1pip安装火炬==1.9.0#火炬>；=1.9.0建议的PIP安装-r要求。txtsudo apt安装-y sox libsox-fmt-mp3bash mfa_usr/install_mfa。sh#安装强制对准工具

@文章{ren2021portaspeech，标题={PortaSpeech:可移植和高质量生成文本到语音}，作者{Ren，Yi和Liu，Jinglin和Zhao，Zhou}，期刊={神经信息处理系统的进展}，卷={34}，年份={2021}

@文章{liu2021diffsinger，title={Diffsinger:通过浅层扩散机制进行声音合成}，作者{Liu，Jinglin and Li，Chengxi and Ren，Yi and Chen，Feiyang and Liu，Peng and Zhao，Zhou}，期刊{arXiv预印本arXiv:2105.02446}，卷{2}，年份{2021}

https://github.com/NATSpeech/NATSpeech