一个基于模型训练的文本转语音项目ChatTTS,使用它,可以把传统死板的机械式文转语音改变成有声有色的阅读
,ChatTTS生成的语音非常自然,是窝长使用过所有TTS模型中最惊叹的。分享给大家体验一下。
官方自我介绍:ChatTTS是专为对话场景设计的语音生成模型,特别适用于大型语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。它支持中文和英文,通过使用大约100,000小时的中文和英文数据进行训练,ChatTTS在语音合成中表现出高质量和自然度。
我们先来感受一下 ChatTTS!
接下来介绍一下基础玩法:
咱可访问ChatTTS中文官网进行网页在线使用
官方在线体验地址:https://chattts.com/zh#Demo
只需输入生成文本->配置音色信息->最终生成
如果你觉得官方在线演示DIV能力不够
也可以康康基于ChatTTS进阶开发的 ChatTTS-Forge
项目地址:https://github.com/lenML/ChatTTS-Forge?tab=readme-ov-file
演示地址:https://huggingface.co/spaces/lenML/ChatTTS-Forge
拥有更丰富的内容风格编辑,更多可实例化的操作空间。
本地部署 ChatTTS
上面的操作是提交参数到各作者的服务器进行处理输出。
我们也可以通过拉取项目仓库到本地,让本地硬件帮我们渲染音频。
系统需求环境:Python3.7以上,pip包管理工具。
项目仓库:https://github.com/2noise/ChatTTS
根据项目仓库教程步骤进行部署。
大部分同学都是Windows系统
比较推荐ChatTTS UI 预打包版 windows 一键安装(比较傻瓜式)
下载地址:https://www.uy5.net/chattts-ui/
备用地址 : https://www.123pan.com/s/03Sxjv-oYyB3.html
下载压缩包->解压->运行app.exe ->弹出界面即可操作
当然 ChatTTS UI项目也包含了Linux源码(包含Docker容器),MacOs源码,Windows源码部署,详细可在项目地址:https://github.com/jianchang512/ChatTTS-ui?tab=readme-ov-file 中学习
ChatTTS UI 支持Post 提交参数执行获取文转语言
https://github.com/jianchang512/ChatTTS-ui?tab=readme-ov-file#%E4%BD%BF%E7%94%A8api%E8%AF%B7%E6%B1%82-v05
可供API与其他文本项目做对接,有很不错的扩展性。
比如和ChatGPT结合,让ChatGPT回复内容已音频方式输出,更像是和人在做交流。
既然项目可以音色配置,就有大佬整理了编号1-10000的音色库
音色库:http://www.ttslist.com/10000cn/
你可以在此便捷找到合适自己的音色编号,快速配音。
音色匹配参值:custom_voice
因为时间关系也不深度介绍太多啦,还有克隆音色,角色分文等等玩法,有兴趣同学直达项目仓库体验体验,字转语音还是有市场需求的,比如像窝长这类社恐人做视频可以做配音,时下流行的动态短视频漫画也可以角色配音(甚至可以配合AI绘画达到单人独自制作漫画短视频).......这两年AI发展让窝长感觉到恐怖如斯,虽然目前音色还不如以匹敌专业播音真人,但足以达到以假乱真的程度,照这个势头下去多少专业基层饭碗受到威胁。建议各位同学提前了解和掌握这些工具,即便目前不需要使用,也要知道它们的存在,以备不时之需。
评论 (0)