链接登录后可见
ChatTTS-ui 是一个与文本到语音(TTS)相关的项目,它是 ChatTTS 的一个分支。ChatTTS 是一个开源的文本到语音合成项目,让您可以将文本转换为自然流畅的语音。这里有一些关于 ChatTTS-ui 的重要信息:
项目简介:ChatTTS-ui 整理和汇总了 ChatTTS 项目的常见问题和相关资源,是 ChatTTS 的最佳入门指南。
亮点:ChatTTS-ui 提供了不同版本的体验,包括 Web 版、Colab 版、Forge 版、OpenVoice 版等,适合不同用户需求。
参数控制:ChatTTS-ui 增加了更多控制参数,方便用户进行更细致的测试,例如音频速度、情感波动性、情感相关性等。
固定音色:您可以根据音色种子值选择不同的音色,或者使用 ChatTTS_Speaker 项目中的打标音色。
如果您对文本到语音合成感兴趣,ChatTTS-ui 是一个值得尝试的项目!
GitHub 地址: [链接登录后可见]
Text Seed : 配置情感种子值,不同种子对应不同情感,不同种子间差异性较小
Prompt:口语化 :[oral] 笑声:[laugh] 停顿:
[break] oral : 控制文本口语化程度,范围为 0-9,数字越大,添加的 “就是”、“那么” 之类的连接词越多
laugh : 控制文本是否添加笑声,范围为 0-9,数字越大,笑声越多
break : 控制文本是否添加停顿,范围为 0-9,数字越大,停顿越多
数字转文本:文档中有数字的勾选
Refine text : 控制是否对文本进行口语化处理,取消勾选则后面三个选项无效
infer token:推理最大 token 默认 2048
refine token:refine text 最大 token,默认 384,未跳辽 refine text 时有效
语速:控制音频速度,范围为 0-9,数字越大,速度越快
temperature:控制音频情感波动性,范围为 0-1,数字越大,波动性越大
top_p:控制音频的情感相关性,范围为 0.1-0.9,数字越大,相关性越高
top_k:控制音频的情感相似性,范围为 1-20,数字越小,相似性越高
云盘下载
[链接登录后可见]