PChome 3月10日消息,腾讯混元团队今日正式开源了全球首个面向世界模型的强化学习后训练框架WorldCompass,显著提升了AI在虚拟世界中长时序交互的准确性和稳定性。
PChome 3月10日消息,腾讯混元团队今日正式开源了全球首个面向世界模型的强化学习后训练框架WorldCompass,显著提升了AI在虚拟世界中长时序交互的准确性和稳定性。

据PChome了解,WorldCompass专为突破长时程交互式世界模型的局限而设计。传统视频生成模型在执行短指令时表现尚可,但在复杂、长时序动作控制中,存在动作执行偏差、场景穿模或画面失真等问题。该框架通过强化学习机制,使模型能更精准遵循用户指令探索虚拟环境,并保持视觉一致性。

与此同时,WorldCompass具有良好的通用性,可适配HunyuanVideo及Wan2.2等多种开源模型,它的发布标志着世界模型技术从单纯的“预训练时代”迈向了“RL精细化调优时代”。