近日,微博自主研发的VibeThinker开源模型,在国际顶级数学竞赛基准测试上变现优异,成绩超过了参数规模更加庞大的DeepSeek R1模型。
近日,微博自主研发的Vibe Thinker开源模型,在国际顶级数学竞赛基准测试上变现优异,成绩超过了参数规模更加庞大的DeepSeek R1模型。

Vibe Thinker是一个仅拥有15亿参数的“轻量级选手”,DeepSeek R1则是拥有6710亿参数的“重量级选手”,结果很是出人意料。
成本方面的差距也很是显著,Vibe Thinker的单次“后训练”成本仅7800美元,折合人民币约55477.5元,相较于DeepSeek R1这样的大型模型来说,成本要低的多。背后的关键在于微博对Vibe Thinker的研发重点是强化小模型复杂数学与竞赛编程等方面的能力,可谓“术业有专攻”。而DeepSeek R1则注重在数学,代码,自然语言推理等任务多方面发展。

不过,Vibe Thinker目前发布的版本仍处于实验性版本,其日常聊天方面并没有做过针对性训练,因此不太适合用来进行互动。