谷歌发布Gemini 3 Pro版本,功能强劲

      美国当地时间 2025 年 11 月 18 日,谷歌正式推出了 Gemini 3 系列 AI 模型,其中 Gemini 3 Pro 同步上线预览版,谷歌称其是迄今为止 “最智能” 和 “最具事实准确性的” AI 系统。这款模型在多项核心能力上实现突破,且发布当日就开启多渠道开放使用,引发行业广泛关注,相关详细新闻内容如下:


一、核心性能实现多维度碾压式突破

       1、推理与数学能力登顶多项榜单:该模型在 LMSys Elo Arena 排行榜上以 1501 分的成绩登顶,比前代 Gemini 2.5 Pro 高出 50 个等级分。在考验多步逻辑与专家级推理的 Humanity’s Last Exam 测试中,无工具状态下得分达 37.5%;研究生水平推理测试 GPQA Diamond 中准确率更是高达 91.9%。数学能力尤为亮眼,在 MathArena 这一 “地狱难度” 测试中以 23.4% 的得分率远超竞品,而 GPT - 5.1 等对手得分仅在 1% 左右,甚至在 AIME2025 高难度数学竞赛的有代码执行场景下斩获满分。
2、多模态理解能力达到行业顶尖:它延续原生多模态优势,在多学科多模态理解测试 MMMU - Pro 上取得 81% 的成绩,视频理解能力测试 Video - MMMU 中分数达 87.6%。其屏幕截图理解准确率高达 72.7%,是现有最先进水平的两倍;识别 18 世纪手写文稿的字符错误率仅 0.56%,达到专家级人类水平。官方演示中,它能把一叠字迹潦草、带多种符号的菜谱照片,自动整理成含食材分类、烹饪步骤的结构化电子菜谱。
3、编程与开发能力适配专业场景:在 WebDev Arena 编码竞赛中以 1487 分位居榜首,SWE - Bench Verified 测试中修复并通过验证的代码占比达 76.2%,Terminal - Bench 2.0 终端操作测试也取得 54.2% 的高分。同时它支持多文件重构、调试等复杂开发流程,开发者仅需一句自然语言指令,就能借助它完成应用程序的结构规划、代码编写、输出验证及文档生成全流程。

       二、配套技术与架构提供强力支撑
1、硬件层面:该模型基于谷歌自研张量处理单元(TPU)训练,相比 CPU,TPU 处理大规模计算速度更快,搭配的大容量高带宽内存可高效运行超大模型与批量数据。
2、架构与平台:采用稀疏混合专家 SMoE 架构,通过动态路由分配输入 token,实现总容量与计算成本的解耦,还支持 100 万 tokens 的超长上下文长度,约等于 700 页英文书籍,可处理超长复杂的多模态输入。同期推出的 Google Antigravity 编程平台,集成了 Gemini 3 Pro 以及 Gemini 2.5 Computer Use 等模型,能助力开发者快速搭建 AI 智能体。

    三、发布当日同步推进多渠道开放
1、普通用户可通过 Gemini 应用程序使用该模型,Google AI Pro 与 Ultra 订阅用户还能在搜索的 AI 模式中体验;
2、开发者可通过 Gemini API、Google AI Studio、Antigravity 平台等访问,且在 Google AI Studio 中可免费使用(有调用限制),其 API 针对企业的定价为输入令牌每百万 2 美元,输出令牌每百万 12 美元(20 万令牌及以下提示);
企业用户则可通过 Vertex AI 与 Gemini Enterprise 获取相关服务。

      四、行业反响热烈且战略意义重大
OpenAI 联合创始人 Sam Altman、xAI 创始人 Elon Musk 均第一时间发来祝贺。此次 Gemini 3 Pro 发布被视作谷歌在 AI 领域重回第一阵营的关键举措,谷歌还在发布首日就将其纳入搜索产品生态。谷歌 CEO 桑达尔・皮查伊表示,这一模型标志着 AI 从单纯阅读文本图像发展到能读懂场景,而谷歌也凭借全栈式策略,将该模型逐步融入搜索、安卓等旗下核心产品生态,推动 AI 从 “回答问题” 向 “完成工作” 转变。