可调"思考预算" 谷歌Gemini 2.5 Flash成本直降600%

PChome | 编辑: 丁新瑀 2025-04-18 15:38:09

近日,谷歌发布了突破性混合推理模型Gemini 2.5 Flash,在闭源思考模式下,其成本仅为0.6美元/百万tokens,相比全功能思考模式下的3.5美元/百万tokens大幅降低60%,该模型引入可调节“思考预算”功能,能保持高性能的同时显著降低使用成本,即使是在基础模式下运行,其性能依然超过前代Gemini 2.0 Flash。

4月18日消息,近日,谷歌发布了突破性混合推理模型Gemini 2.5 Flash,在闭源思考模式下,其成本仅为0.6美元/百万tokens,相比全功能思考模式下的3.5美元/百万tokens大幅降低600%,该模型引入可调节“思考预算”功能,能保持高性能的同时显著降低使用成本,即使是在基础模式下运行,其性能依然超过前代Gemini 2.0 Flash。

在性能表现方面,Gemini 2.5 Flash在大模型排行榜中以1392分ELO评分高居第二,仅次于GPT-4.5-preview,与Grok-3表现相当。在GPQA知识问答中,24K思考预算可带来6%的性能提升;在LiveCodeBench代码基准测试中,16K思考预算时达到最佳表现。Gemini 2.5 Flash在多模态推理和数学任务上明显优于Claude 3.7 Sonnet,综合性能与OpenAI最新o4-mini模型不相上下。在模拟人类综合能力的"人类最后一次考试"基准测试中,该模型以12.1%的高分位列第二,再次印证其强大实力。

此次发布的Gemini 2.5 Flash通过创新的"思考预算"机制,在性能与成本之间实现了突破性平衡,为AI应用开发提供了更灵活、更经济的选择。

说明:所有图文均来自网络,版权归原作者所有,如果侵犯您的权益,请联系我们删除。

每日精选

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑