今日,小米通过官方平台宣布正式开源其最新声音理解大模型MiDashengLM-7B,该模型在实际应用中反应速度快,处理数据效率高,推理延迟只有业内同类技术的四分之一,且同样硬件条件下的数据处理能力提高了20倍。
今日,小米通过官方平台宣布正式开源其最新声音理解大模型MiDashengLM-7B,进一步推动“人车家全生态”战略中声音技术的落地与开放合作。

MiDashengLM-7B是在小米此前的声音基础模型Xiaomi Dasheng基础上研发的升级版本,结合了先进的语言处理技术(Qwen2.5-Omni-7B模型),可以同时理解语音、人类活动产生的环境声以及音乐内容,具备更强的综合“听懂”能力。
该模型在22项公开评测中均取得了目前业内最好的成绩。实际应用中,MiDashengLM-7B反应速度快,处理数据效率高,推理延迟只有业内同类技术的四分之一,且同样硬件条件下的数据处理能力提高了20倍。这意味着它更适合用于需要快速反应的场景,例如智能家居的语音控制、汽车语音助手等。
值得注意的是,小米这次完全开源了模型的全部内容,使用的是宽松的Apache 2.0开源协议,意味着学术研究和企业开发都可以免费使用,甚至参与模型的优化和更新,推动整个行业共同进步。

据小米介绍,之前发布的Xiaomi Dasheng模型已在智能家居和智能汽车中实现超过30项功能应用,如声音监测、语音唤醒和指令识别等。该模型还在2025年法国南特举办的国际多媒体竞赛中助力夺得冠亚军,显示出其技术实力。