哇塞,中国开源 TTS 又整了个大活:VoxCPM 2 直接冲上 GitHub Trending 前排。
2B 参数统一模型,直接做到: 30+语言 + 48kHz 录音棚级音质 + 情绪细节全拉满。
几个亮点:
- 纯文本就能设计声音 想男想女、想老想年轻、温柔还是兴奋,全靠描述
- 短音频克隆 + 风格随便切
- 极致模式甚至能复刻呼吸、口癖这种细节
最关键:Apache 2.0 开源可商用
开发者直接 GitHub / HF 拉下来就能用。
demo 里那个卡通角色跑酷配音,全部是它生成的,丝滑得有点离谱。
做 indie app / 多语言产品 / 内容创作的,可以重点看看,这波是真把语音 AI 门槛又拉低了一截。
互联网充电站
2B 参数统一模型,直接做到: 30+语言 + 48kHz 录音棚级音质 + 情绪细节全拉满。
几个亮点:
- 纯文本就能设计声音 想男想女、想老想年轻、温柔还是兴奋,全靠描述
- 短音频克隆 + 风格随便切
- 极致模式甚至能复刻呼吸、口癖这种细节
最关键:Apache 2.0 开源可商用
开发者直接 GitHub / HF 拉下来就能用。
demo 里那个卡通角色跑酷配音,全部是它生成的,丝滑得有点离谱。
做 indie app / 多语言产品 / 内容创作的,可以重点看看,这波是真把语音 AI 门槛又拉低了一截。
互联网充电站