
Google 已经提出 双子座3其新一代人工智能模型旨在融合高级推理、上下文理解和多模态能力。该公司将其定位为迄今为止功能最强大的系统,旨在解读细微差别并以更少的反复交互解决复杂任务。
在初始部署中, 双子座应用程序 开发者工具已经集成了这个版本,而 搜索中的 AI 模式 该服务首先在美国推出。在西班牙和欧洲其他地区,谷歌优先通过应用程序、API 和云服务提供访问权限,同时还将扩展语言支持,包括加泰罗尼亚语、巴斯克语和加利西亚语。
双子座3号星带来了什么?它为何如此重要?
Gemini 3 将前几代产品积累的经验和飞跃性进步融合在一个系统中 对语境的推理和理解该公司坚称,该模型能够“捕捉创意中的微妙线索”,并将复杂的问题分解成多个层次,从而提供更准确的答案,并减少重新表述问题的需要。
这种方法可以得出更简洁的答案,并优先考虑以下方面: 实用信息与陈词滥调谷歌一直在测试这种行为,旨在减少奉承行为并提高事实准确性。此外,该模型的多模态特性允许在同一交互中处理文本、图像、音频和视频。
独立测试和比较测试中的表现
根据谷歌公布的指标和公开排名, 双子座3专业版 他在LMArena中以1.501分的ELO积分领先,超越了他的前任。在学术评估方面,他在“人类最后的考试”(Humanity's Last Exam)中未使用任何工具的情况下获得了37,5%的分数,在GPQA Diamond中获得了91,9%的分数;在数学方面,他在MathArena Apex中获得了23,4%的分数。
强化推理模式 深度思考 这项测试结果更进一步,在“人类最后的考试”中取得了 41,0% 的成绩,在 GPQA 钻石测试中取得了 93,8% 的成绩。 ARC-AGI-2代码执行率达到 45,1%,表明抽象推理和视觉理解能力有所提高。
Gemini 3 的多模态和巨大的上下文窗口
其中一项重大变化是上下文窗口 1万个代币这有助于分析大量的代码库、论文或长视频。例如,该模型可以翻译和统一手写食谱,创建家庭食谱,或者将复杂的材料转换为可视化图表和交互式卡片。
多模态阅读体现在诸如此类的测试中。 MMMU-Pro(81%) 在 Video-MMMU(87,6%)和 SimpleQA Verified(72,1%)中,用户对事实的准确性要求更高。在集成到搜索中的 AI 模式下,Google 会训练交互式元素(例如小部件和模拟)来即时解释概念。
编程与代理:反重力的动力
在开发任务中,Gemini 3 领先 WebDev Arena 的 ELO 得分为 1.487。它在 Terminal-Bench 2.0 中取得了 54,2% 的成绩,在 SWE-bench Verified 中取得了 76,2% 的成绩,这意味着它在生成代码、使用工具和操作终端环境方面具有更高的能力。
对于楼宇代理商而言,最值得关注的新功能是 Google Antigravity该平台使代理能够访问编辑器、终端和浏览器。借助该平台,系统可以规划和执行端到端的软件工作流程,验证自身代码,并将最终的审查和审计工作留给开发人员。
安全、外部测试和负责任的部署
谷歌声称这是它的 迄今为止最安全的型号它能有效抵御奉承,更能抵御快速注入和滥用(例如网络攻击)。该评估是其前沿安全框架的一部分,并已由包括以下机构在内的外部专家进行审查: 英国钢铁协会 以及 Apollo、Vaultis 和 Dreadnode 等公司。
模式 深度思考 由于其规划能力和工具使用范围广泛,该功能在面向 Google AI Ultra 订阅用户推出之前,需要经过额外的验证。该公司强调将在各个产品和地区采取循序渐进、稳步推进的方式进行推广。
双子座3号的可用性
El Gemini 3 Pro 预览 可通过 Gemini 应用以及 AI Studio 和 Vertex AI 的开发者 API 访问。该界面新增了 30 种语言,包括 加泰罗尼亚语、巴斯克语和加利西亚语这有助于它在当地环境中得到应用。
El 搜索中的 AI 模式 它首先在美国推出,然后逐步扩展;与此同时,企业和技术团队可以将 Gemini 3 集成到他们的工作流程中。 Vertex AI 和 Gemini Enterprise此外,还有新的 CLI 和 Antigravity 代理平台。
应用案例:从更好地学习到自动化任务
除了聊天之外,该模型还可以将复杂的内容转化为 互动体验 它利用图表、计算器或模拟工具,可用于学习技术概念、分析体育比赛、制定训练计划,或分解论文并生成易于理解的指南。
在日常工作中,经纪人可以 对 Gmail 电子邮件进行分类通过结合推理、工具调用和浏览器控制来规划行程或执行多步骤任务,始终在人工监督下保持控制。
谷歌坚称 Gemini 的影响力正在不断扩大:“AI 驱动的视图”即将推出 每月2.000亿用户Gemini 的应用程序每月下载量超过 650 亿次,70% 的云客户使用其人工智能功能,13 万开发者利用其模型构建解决方案。这些数据为 Gemini 3 在产品生态系统中的部署奠定了基础。
它专注于推理、多模态和智能体, 双子座3 它正在成为谷歌人工智能战略的共同基础:一个更直接、更少妥协、更具上下文的平台,在西班牙,您可以从 Gemini 应用开始使用它,如果您是开发者,还可以从 AI Studio 和 Vertex AI 开始使用它;AI 模式搜索将根据市场情况激活。
