可调"思考预算" 谷歌Gemini 2.5 Flash成本直降600%

PChome | 编辑: 丁新瑀 2025-04-18 15:38:09

近日，谷歌发布了突破性混合推理模型Gemini 2.5 Flash，在闭源思考模式下，其成本仅为0.6美元/百万tokens，相比全功能思考模式下的3.5美元/百万tokens大幅降低60%，该模型引入可调节“思考预算”功能，能保持高性能的同时显著降低使用成本，即使是在基础模式下运行，其性能依然超过前代Gemini 2.0 Flash。

4月18日消息，近日，谷歌发布了突破性混合推理模型Gemini 2.5 Flash，在闭源思考模式下，其成本仅为0.6美元/百万tokens，相比全功能思考模式下的3.5美元/百万tokens大幅降低600%，该模型引入可调节“思考预算”功能，能保持高性能的同时显著降低使用成本，即使是在基础模式下运行，其性能依然超过前代Gemini 2.0 Flash。

在性能表现方面，Gemini 2.5 Flash在大模型排行榜中以1392分ELO评分高居第二，仅次于GPT-4.5-preview，与Grok-3表现相当。在GPQA知识问答中，24K思考预算可带来6%的性能提升；在LiveCodeBench代码基准测试中，16K思考预算时达到最佳表现。Gemini 2.5 Flash在多模态推理和数学任务上明显优于Claude 3.7 Sonnet，综合性能与OpenAI最新o4-mini模型不相上下。在模拟人类综合能力的"人类最后一次考试"基准测试中，该模型以12.1%的高分位列第二，再次印证其强大实力。

此次发布的Gemini 2.5 Flash通过创新的"思考预算"机制，在性能与成本之间实现了突破性平衡，为AI应用开发提供了更灵活、更经济的选择。

说明：所有图文均来自网络，版权归原作者所有,如果侵犯您的权益，请联系我们删除。

每日精选

中国品牌价值500强榜单出炉，抖音连续三年位居榜首

PChome 5月9日消息，英国品牌价值评估机构“品牌金融（Brand Finance）”发布《Brand Finance 2026中国品牌价值500强》报告，抖音以1535亿美元的品牌价值排名第一，抖音已经连续三年位居中国品牌价值榜首。

关键词：抖音,问界,品牌价值 2026-05-09 14:38:24
百度AI误将律师判为罪犯，法院判其名誉侵权需道歉

PChome 5月9日消息，据澎湃新闻报道，近期江苏省南京市一名律师李小亮起诉百度，因百度“AI智能回答”误将其显示为“李小亮律师被判三年有期徒刑”的内容，构成名誉侵权，并判决百度公司向李小亮书面道歉，该案例被称为“中国人工智能大模型侵权第一案”。

关键词：百度,AI,AI侵权第一案 2026-05-09 12:21:12
昆仑万维方汉：豆包手机必然失败，张一鸣后悔没做锤子手机

PChome 5月8日消息，据凤凰网财经报道，昆仑万维董事长兼总经理方汉在接受节目采访时称，“，豆包手机从出生第一天就注定了它必然会失败，豆包手机没有渠道，手机厂商掌握了操作系统，就可以封杀它”。

关键词：字节跳动,豆包手机,昆仑万维 2026-05-08 12:28:03