专题：sts

多模态语音AI模型探索：Seedance 2.0能否整合TTS、STS与声音分离？

社区Reddit r/LocalLLaMA2026/02/23 23:315420

本文探讨了AI语音处理领域一个关键问题：是否存在能同时执行文本转语音（TTS）、语音转文本（STS）及声音分离的集成模型。文章提及Seedance 2.0可能具备部分此类能力，支持文本/音频输入进行语音合成（说话、唱歌），并可训练自定义声音。尽管其具体实现为闭源，但该模型的多功能集成潜力引发了对AI语音模型未来发展方向的讨论，对开发者和研究人员具有参考价值。

文本转语音语音转文本声音分离多模态AI Seedance