微博自研VibeThinker开源模型,训练成本仅7800美元

PChome | 编辑: 田想 2025-11-18 17:58:13

近日,微博自主研发的VibeThinker开源模型,在国际顶级数学竞赛基准测试上变现优异,成绩超过了参数规模更加庞大的DeepSeek R1模型。

近日,微博自主研发的Vibe Thinker开源模型,在国际顶级数学竞赛基准测试上变现优异,成绩超过了参数规模更加庞大的DeepSeek R1模型。

Vibe Thinker是一个仅拥有15亿参数的“轻量级选手”,DeepSeek R1则是拥有6710亿参数的“重量级选手”,结果很是出人意料。

成本方面的差距也很是显著,Vibe Thinker的单次“后训练”成本仅7800美元,折合人民币约55477.5元,相较于DeepSeek R1这样的大型模型来说,成本要低的多。背后的关键在于微博对Vibe Thinker的研发重点是强化小模型复杂数学与竞赛编程等方面的能力,可谓“术业有专攻”。而DeepSeek R1则注重在数学,代码,自然语言推理等任务多方面发展。

不过,Vibe Thinker目前发布的版本仍处于实验性版本,其日常聊天方面并没有做过针对性训练,因此不太适合用来进行互动。

说明:所有图文均来自网络,版权归原作者所有,如果侵犯您的权益,请联系我们删除。

每日精选

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑