3月26日凌晨,谷歌正式推出新一代人工智能推理模型Gemini 2.5,该模型基于多模态大语言框架升级,显著增强了推理能力、多语言支持及长文本处理能力。
据官方介绍,Gemini 2.5通过优化算法架构,将响应速度提升40%,能耗降低25%。在关键指标测试中,其复杂逻辑任务完成度较前代提升65%,尤其在医疗诊断辅助、法律文书生成等垂直领域展现出更高精度。
谷歌去年12月份曾发布过具备思考能力的Gemini,但Gemini 2.5系列模型则是谷歌挑战OpenAI“o”系列模型迄今最重磅尝试。其旗舰版本Gemini 2.5 Pro Experimental在多项基准测试中超越OpenAI、Anthropic等竞争对手。
Gemini 2.5 Pro支持文本、图像、音频、视频及代码的多模态输入,上下文窗口达100万token(约75万单词),可解析完整《指环王》系列文本,未来将升级至200万token。
谷歌表示,“推理”能力不仅仅指分类和预测,而是指系统分析信息、得出逻辑结论、融入上下文和细微差别,以及做出明智决策的能力。
Gemini 2.5发布会后一小时,市场反应迅速显现。集成Gemini 2.5的谷歌办公套件测试版访问量激增,教育类初创公司LumenAI宣布将基于新模型开发自适应教学工具。不过,隐私倡导组织已对数据处理权限提出质询,要求谷歌公开更多透明度报告。
Gemini 2.5 Pro即日起通过Google AI Studio和Gemini应用向订阅“Gemini Advanced”(月费20美元)的用户开放,未来将登陆Vertex AI平台。谷歌暂未公布API定价,但表示将在几周内披露企业级应用方案。
研究机构Gartner预测,到2026年,多模态生成模型的商业价值将占AI市场的45%。随着谷歌与微软等巨头持续加码,生成式AI正从通用工具向产业基础设施演变,但其社会伦理、监管框架的完善也有待各方共同探索。
还没有评论,来说两句吧...