谷歌发布新一代推理模型反击OpenAI，单次可处理百万token

3月26日凌晨，谷歌正式推出新一代人工智能推理模型Gemini 2.5，该模型基于多模态大语言框架升级，显著增强了推理能力、多语言支持及长文本处理能力。

据官方介绍，Gemini 2.5通过优化算法架构，将响应速度提升40%，能耗降低25%。在关键指标测试中，其复杂逻辑任务完成度较前代提升65%，尤其在医疗诊断辅助、法律文书生成等垂直领域展现出更高精度。

谷歌去年12月份曾发布过具备思考能力的Gemini，但Gemini 2.5系列模型则是谷歌挑战OpenAI“o”系列模型迄今最重磅尝试。其旗舰版本Gemini 2.5 Pro Experimental在多项基准测试中超越OpenAI、Anthropic等竞争对手。

Gemini 2.5 Pro支持文本、图像、音频、视频及代码的多模态输入，上下文窗口达100万token（约75万单词），可解析完整《指环王》系列文本，未来将升级至200万token。

谷歌表示，“推理”能力不仅仅指分类和预测，而是指系统分析信息、得出逻辑结论、融入上下文和细微差别，以及做出明智决策的能力。

Gemini 2.5发布会后一小时，市场反应迅速显现。集成Gemini 2.5的谷歌办公套件测试版访问量激增，教育类初创公司LumenAI宣布将基于新模型开发自适应教学工具。不过，隐私倡导组织已对数据处理权限提出质询，要求谷歌公开更多透明度报告。

Gemini 2.5 Pro即日起通过Google AI Studio和Gemini应用向订阅“Gemini Advanced”（月费20美元）的用户开放，未来将登陆Vertex AI平台。谷歌暂未公布API定价，但表示将在几周内披露企业级应用方案。

研究机构Gartner预测，到2026年，多模态生成模型的商业价值将占AI市场的45%。随着谷歌与微软等巨头持续加码，生成式AI正从通用工具向产业基础设施演变，但其社会伦理、监管框架的完善也有待各方共同探索。

还没有评论，来说两句吧...