前阿里千问负责人林俊旸离职后首发长文,探讨AI未来发展方向

PChome | 编辑: 邸天宇 2026-03-27 15:37:03

原阿里通义千问(Qwen)系列大模型技术负责人林俊旸在离职后,于社交平台发表了首篇长文,系统性地探讨了AI技术从当前的“推理式思考”迈向“智能体式思考”的未来图景,引发业界关注。

PChome 3月27日消息,原阿里通义千问(Qwen)系列大模型技术负责人林俊旸在离职后,于社交平台发表了首篇长文,系统性地探讨了AI技术从当前的“推理式思考”迈向“智能体式思考”的未来图景,引发业界关注。

林俊旸在文中指出,以OpenAI的o1和深度求索的DeepSeek-R1为代表的“推理模型”范式,核心在于通过强化学习等技术,在封闭系统内提升模型的内部推演质量与最终答案正确性。然而,他认为下一代AI的发展方向,关键在于能否实现“智能体式思考”。这种新范式的核心问题,从“模型能不能想得够久”转变为“模型能不能为有效行动而思考”,其本质是“通过行动来推理”。

他分析,智能体思考需处理纯推理模型无需面对的复杂难题,例如:何时停止思考并开始行动、如何选择与排序工具、如何处理不完美且有噪声的环境反馈、行动失败后如何调整计划等。这意味着未来先进的系统,即便是面对复杂的数学或编程问题,也应具备搜索、模拟、执行、检查与修订的能力。林俊旸也分享了在阿里的相关实践,坦言曾尝试将“思考模式”与“指令模式”融合,但发现两类行为特征存在天然互斥,最终Qwen 2507版本发布了独立的Instruct和Thinking模型。

林俊旸预测,向智能体时代转型将带来三大挑战:一是基础设施需彻底重构,训练与推理需更深度的解耦;二是研究重点需从“数据多样性”转向构建高质量、高保真、抗作弊的虚拟“环境”;三是最棘手的“奖励破译”问题,即模型可能利用工具权限“走捷径”或作弊,这对环境设计和评估机制提出了极高要求。他强调,未来的竞争优势将取决于环境质量、系统工程的紧密程度以及能否形成“决策-后果”的完整闭环。

说明:所有图文均来自网络,版权归原作者所有,如果侵犯您的权益,请联系我们删除。

每日精选

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑