PChome 4月9日消息,今日,字节跳动宣布推出原生全双工语音大模型Seeduplex。相比于上一代半双工豆包端到端语音模型,Seeduplex 基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升。
PChome 4月9日消息,今日,字节跳动宣布推出原生全双工语音大模型Seeduplex。相比于上一代半双工豆包端到端语音模型,Seeduplex 基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升。

据介绍,该模型采用“边听边说”的全新架构,突破传统半双工模式下“一问一答”、需等待话轮结束的局限,实现更自然流畅的实时对话体验。AI可在用户说话过程中实时倾听,并在合适时机插入“嗯”“对”等反馈,支持自然打断与重叠交流,节奏更接近真人对话。使用户有更自然沉浸的功能体验。

PChome据官方信息了解到,Seeduplex可准确忽略背景噪音和无关对话,从而能更好地理解用户所处的声学环境。具备持续的“倾听”能力,其误回复率和误打断率减少了一半;与用户对话时,可综合判断用户意图,并联合语音和语义特征,把握自然的对话节奏。同时,面对用户的思考犹豫,模型能耐心倾听,在用户说完后,也能快速响应。相比半双工模型,其抢话比例相对下降了40%。

新模型基于字节自研LLM底座,通过轻量化与推理优化,实现通话场景下毫秒级响应。多维度评测显示,对话流畅度MOS评分提升12%,整体通话满意度提升8.34%。
其作为全球首个亿级用户可用的全双工语音模型,Seeduplex标志着该技术从实验室走向大众市场。其中工程架构已支持高并发场景,豆包日活超1.45亿的流量也验证了系统稳定性。

目前,Seeduplex已在豆包App全量上线,用户可将豆包App更新至最新版本,在对话框内选择“打电话”,进入语音通话界面体验即可。