6月27日消息,科大讯飞宣布其语音合成技术实现关键升级,“一句话声音复刻”与“超拟人语音合成”两项能力取得突破。
6月27日消息,科大讯飞宣布其语音合成技术实现关键升级,“一句话声音复刻”与“超拟人语音合成”两项能力取得突破。

讯飞星火APP的“一句话声音复刻”功能自2024年4月上线以来,备受用户和行业认可。此次升级后,AI可在仅一句录音基础上,复刻用户完整音色、语气与情绪起伏,效果接近真人。
讯飞的超拟人合成技术此次进阶的重点则是赋予AI声音以“上下文情商”。面对多轮对话的复杂度,科大讯飞开发了上下文感知的语音生成系统。该系统融合历史文本及对应音频特征,通过跨模态编码器分析上下文,让AI声音能像真人一般敏锐响应情绪转变和话题转换。
据悉,此次讯飞技术突破的关键,除了星火语音大模型底座的基础和持续迭代,还构建了一套三阶段层次化语音建模框架。