租房买房买生意上iU91
蒙城华人网 首页 新闻 综合新闻 查看内容

谷歌最强Gemini2.5Pro免费了! 数学碾压人类研究生

发布时间: 2025-3-31 15:40| 查看: 1019| 评论: 0|来自: 新智元

如今,有越来越多的网友发现,Gemini 2.5 Pro已经成为全球大模型中名副其实的冠军,刷爆各类基准测试和智商测试!它的智商达到130,其中数学方面已经强于大多数研究生,甚至几句提示,就能模拟宇宙规律。虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强!在试用过程中,网友们逐渐发现,这个模型真的强到发指。

在门萨Norway的IQ测试中,它已经突破了130。


随后,更硬核的证据来了——在MathArena测试中,它直接获得了第一名!

注意,这里用的基本都是LLM从未见过的题。

在哈佛-麻省理工大学数学竞赛(HMMT)中,领先第二名15%

AIME 2025 I和AIME 2025 II是今年美国全国数学奥林匹克竞赛的选拔赛

它在数学方面已经比大多数研究生要强,这已经是一个可以公开验证的事实。

在这位网友统计的AI模型能力表上,Gemini的领先趋势已经非常明显。

Gemini 2.5 Pro (exp),免费用户也能用

好消息是,现在所有用户都能用上Gemini 2.5 Pro了。

就在今天,谷歌官宣:向所有Gemini用户,推出Gemini 2.5 Pro实验版!

而且,还是全免费。

唯一美中不足的是,Gemini 2.5 Pro目前还会有速率限制。

但Gemini Advanced用户,就可以享有更高级的访问权限,和更大的上下文窗口。

在上周三刚刚发布时,Gemini 2.5 Pro,还仅仅面向Gemini Advanced订阅者开放,订阅价格为每月19.99美元。

而随后,模型还会被推广到安卓和iOS应用上。

目前尚不清楚,谷歌是否会将2.5 Pro的稳定版本免费提供给所有Gemini用户,还是说今天的举措仅针对测试阶段。

在此之前,似乎2.0 Flash Thinking和2.0 Flash都将是免费提供的版本。

社区网友公认:大模型赛,谷歌已经领先了

AI社区Reddit上的网友们公认:在客观上,谷歌的模型已经领先了。

或许是有史以来第一次,OpenAI明确处于落后地位,Anthropic也是如此。

虽然凭吉卜力表情包抢了风头,但这种廉价的伎俩只会在短期内有用。在大模型赛中,局面已经从根本上改变了。

细数LiveBench、LMSYS、人类最后的考试、智商测试,几乎一切投票都表明,Gemini是无可争议的领军者。

有媒体表示谷歌Gemini 2.5 Pro是最聪明的模型

根据Artificial Analysis的评估,Gemini 2.5在大部分测试中都遥遥领先,成绩排名第一。

同时,输出速度仅次于 Gemini 2.0 Flash,位列第二。

当然,如果从原理上看,LLM的确没有在做数学,因为它们的本质仍然是概率性的,是做从训练数据中预测最可能的答案。

最强编程模型:模拟宇宙都可以

谷歌的技术主管Addy Osmani,表示Gemini 2.5 Pro是谷歌最好的编程模型,而且免费!

他给出了一段Gemini制作的3D飞行小游戏。

只需提示一次,Gemini 2.5 Pro可以在Three.js中的物理模拟!

多次提示,还可以改进编程效果。

开源链接:https://github.com/gemsjohn/physics-sims

网友Gadgetify直接复刻了自己“宇宙模拟器”,只需几次提示。

建立AI智能体DAIR.AI的elvis,则认为Gemini 2.5 Pro是Claude 3.7 Sonnet的最强对手。

Gemini 2.5 Pro是一款优质代码模型:

· 代码质量真的很好

· 1M个token的上下文

· 原生多模态

· 长代码生成

· 理解大型代码库

利用Gemini和Windsurf,他生成了AI搜索代理应用。

不少网友体验Gemini 2.5 Pro编程之后,表示Claude的确危险了!

初步的编码测试中的结果显示,Gemini 2.5 Pro把行业水平提升了一个档次。

对此,“AI智能体先驱”的创始人Silas Alberti,表示编程助手Devin正在引入Gemini 2.5 Pro。

而从事SEO行业的Julian Goldies放出Gemini 2.5 Pro MCP Servers教程,让智能体自动化一切。

甚至,有人用Gemini 2.5 Pro测试了一个项目,使用A*算法为高速列车寻找最优解,这个过程中涉及了优化坡度、转弯半径、多目标优化等难题。

令人惊喜的是,虽然它经常搞乱语法,比如试图把所有代码压缩到一行,但它完成了不少高质量的工作。

标签: 科技

最新评论

免责声明:本文仅代表作者个人观点,与蒙城华人网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如发现稿件侵权,或作者不愿在蒙城华人网发布文章,请版权拥有者通知蒙城华人网处理。
加拿大新型诈骗升级:一通电话可能背上巨额账单
加拿大新型诈骗升级:一通电话可能背上巨额
加拿大近期出现一种新型电信诈骗,多名消费者在毫无察觉的情况下,被诱导签署设备分期
越来越多加拿大华人没有公司养老金!如何实现“工资式退休”? ...
越来越多加拿大华人没有公司养老金!如何实
不少加拿大华人在即将退休时并没有公司提供的固定养老金,如何在退休后依然每月有稳定
加拿大退休后去哪儿住最舒坦?帮你算清这笔账
加拿大退休后去哪儿住最舒坦?帮你算清这笔
如果你最近在认真考虑退休后搬去哪座城市,这道题的难度可能比你预想的要高得多。很多
魁省公共交通联盟建议上调燃油税
魁省公共交通联盟建议上调燃油税
虽然蒙特利尔的油价已飙升至每升 2 元以上,但一个公共交通倡导联盟表示,魁北克省实
魁省Santé Québec项目即将启动 医护人员被禁止说这些
魁省Santé Québec项目即将启动 医护人员
在魁北克省 Santé Québec 备受争议的数字健康档案项目启动前夕,一份发给魁省医护人
摩根大通女上司性侵案 传100万和解遭拒
摩根大通女上司性侵案 传100万和解遭拒
摩根大通(JPMorgan Chase,简称小摩)爆出女主管涉嫌职场性骚扰与性侵男同事的丑闻,情
新加坡校园霸凌者将面临鞭打,最小9岁
新加坡校园霸凌者将面临鞭打,最小9岁
新加坡近期推出新版反校园霸凌治理举措,教育部长李智陞5月5日明确新规允许教师在特定
两个首富,一起迎来“至暗时刻”
两个首富,一起迎来“至暗时刻”
曾几何时,HPV疫苗还是个很赚钱的生意。最火热时,许多人不惜长途往返香港,花费数万
两儿自杀,华人作家写下至痛回忆拿下普立兹奖
两儿自杀,华人作家写下至痛回忆拿下普立兹
华人作家李翊云凭借回忆录 Things in Nature Merely Grow(《自然万物只是生长》)获
Cineplex家庭影院开播 电影票只要3.99元
Cineplex家庭影院开播 电影
蒙特利尔Cineplex每周六早上11点的家庭影院又开始了,
魁省五百元优惠机票可以去哪儿玩?
魁省五百元优惠机票可以去哪
2022年6月1日起,魁省政府推出了“空中准入地区计划”
蒙特利尔郊外新开一家北美最大的蹦床公园
蒙特利尔郊外新开一家北美最
魁北克省 Mont-Saint-Grégoire 山脚下新开了一家北美
魁省迎来北美第一家全包型滑雪度假村 现在只要160元
魁省迎来北美第一家全包型滑
近日,全球知名的法国度假连锁集团Club Med宣布位于魁
刺激!飞跃安魁两省边界!400米长滑索开放!
刺激!飞跃安魁两省边界!40
安省和相邻省的边界已正式开放!肯定会有很多小伙伴驾

Copyright © 1999 - 2026 by Sinoquebec Media Inc. All Rights Reserved 未经许可不得摘抄  |  GMT-4, 2026-5-7 21:58 , Processed in 0.135993 second(s), 23 queries .