租房买房买生意上iU91
蒙城华人网 首页 新闻 综合新闻 查看内容

谷歌最强Gemini2.5Pro免费了! 数学碾压人类研究生

发布时间: 2025-3-31 14:40| 查看: 876| 评论: 0|来自: 新智元

如今,有越来越多的网友发现,Gemini 2.5 Pro已经成为全球大模型中名副其实的冠军,刷爆各类基准测试和智商测试!它的智商达到130,其中数学方面已经强于大多数研究生,甚至几句提示,就能模拟宇宙规律。虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强!在试用过程中,网友们逐渐发现,这个模型真的强到发指。

在门萨Norway的IQ测试中,它已经突破了130。


随后,更硬核的证据来了——在MathArena测试中,它直接获得了第一名!

注意,这里用的基本都是LLM从未见过的题。

在哈佛-麻省理工大学数学竞赛(HMMT)中,领先第二名15%

AIME 2025 I和AIME 2025 II是今年美国全国数学奥林匹克竞赛的选拔赛

它在数学方面已经比大多数研究生要强,这已经是一个可以公开验证的事实。

在这位网友统计的AI模型能力表上,Gemini的领先趋势已经非常明显。

Gemini 2.5 Pro (exp),免费用户也能用

好消息是,现在所有用户都能用上Gemini 2.5 Pro了。

就在今天,谷歌官宣:向所有Gemini用户,推出Gemini 2.5 Pro实验版!

而且,还是全免费。

唯一美中不足的是,Gemini 2.5 Pro目前还会有速率限制。

但Gemini Advanced用户,就可以享有更高级的访问权限,和更大的上下文窗口。

在上周三刚刚发布时,Gemini 2.5 Pro,还仅仅面向Gemini Advanced订阅者开放,订阅价格为每月19.99美元。

而随后,模型还会被推广到安卓和iOS应用上。

目前尚不清楚,谷歌是否会将2.5 Pro的稳定版本免费提供给所有Gemini用户,还是说今天的举措仅针对测试阶段。

在此之前,似乎2.0 Flash Thinking和2.0 Flash都将是免费提供的版本。

社区网友公认:大模型赛,谷歌已经领先了

AI社区Reddit上的网友们公认:在客观上,谷歌的模型已经领先了。

或许是有史以来第一次,OpenAI明确处于落后地位,Anthropic也是如此。

虽然凭吉卜力表情包抢了风头,但这种廉价的伎俩只会在短期内有用。在大模型赛中,局面已经从根本上改变了。

细数LiveBench、LMSYS、人类最后的考试、智商测试,几乎一切投票都表明,Gemini是无可争议的领军者。

有媒体表示谷歌Gemini 2.5 Pro是最聪明的模型

根据Artificial Analysis的评估,Gemini 2.5在大部分测试中都遥遥领先,成绩排名第一。

同时,输出速度仅次于 Gemini 2.0 Flash,位列第二。

当然,如果从原理上看,LLM的确没有在做数学,因为它们的本质仍然是概率性的,是做从训练数据中预测最可能的答案。

最强编程模型:模拟宇宙都可以

谷歌的技术主管Addy Osmani,表示Gemini 2.5 Pro是谷歌最好的编程模型,而且免费!

他给出了一段Gemini制作的3D飞行小游戏。

只需提示一次,Gemini 2.5 Pro可以在Three.js中的物理模拟!

多次提示,还可以改进编程效果。

开源链接:https://github.com/gemsjohn/physics-sims

网友Gadgetify直接复刻了自己“宇宙模拟器”,只需几次提示。

建立AI智能体DAIR.AI的elvis,则认为Gemini 2.5 Pro是Claude 3.7 Sonnet的最强对手。

Gemini 2.5 Pro是一款优质代码模型:

· 代码质量真的很好

· 1M个token的上下文

· 原生多模态

· 长代码生成

· 理解大型代码库

利用Gemini和Windsurf,他生成了AI搜索代理应用。

不少网友体验Gemini 2.5 Pro编程之后,表示Claude的确危险了!

初步的编码测试中的结果显示,Gemini 2.5 Pro把行业水平提升了一个档次。

对此,“AI智能体先驱”的创始人Silas Alberti,表示编程助手Devin正在引入Gemini 2.5 Pro。

而从事SEO行业的Julian Goldies放出Gemini 2.5 Pro MCP Servers教程,让智能体自动化一切。

甚至,有人用Gemini 2.5 Pro测试了一个项目,使用A*算法为高速列车寻找最优解,这个过程中涉及了优化坡度、转弯半径、多目标优化等难题。

令人惊喜的是,虽然它经常搞乱语法,比如试图把所有代码压缩到一行,但它完成了不少高质量的工作。

标签: 科技

最新评论

免责声明:本文仅代表作者个人观点,与蒙城华人网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如发现稿件侵权,或作者不愿在蒙城华人网发布文章,请版权拥有者通知蒙城华人网处理。
加拿大代孕母亲赴美接受生育治疗遭美方拒绝入境
加拿大代孕母亲赴美接受生育治疗遭美方拒绝
一名加拿大女性近日试图前往美国加州的一家生育诊所进行治疗,却被美国海关和边境保护
苹果高管离职潮震荡,芯片主管或将离职
苹果高管离职潮震荡,芯片主管或将离职
12月7日消息,据彭博社记者马克·古尔曼报道称,苹果公司硬件技术高级副总裁约翰尼·
张柏芝遭前经纪人索赔上千万,憔悴暴瘦现身法庭
张柏芝遭前经纪人索赔上千万,憔悴暴瘦现身
12月5日,有关于违反合约案第三次开庭,张柏芝现身在了香港法庭。据说当时张柏芝的状
马斯克回应"SpaceX冲击8000亿美元估值"传闻
马斯克回应"SpaceX冲击8000亿美元估值"传闻
针对商业航天龙头SpaceX“冲击8000亿美元估值,并瞄准明年IPO”的最新传闻,世界首富
华裔女子起诉WestJet索赔7.5万美元:指控机组人员骚扰她
华裔女子起诉WestJet索赔7.5万美元:指控机
洛杉矶华裔女演员Charlet Chung指控WestJet机组在去年的一趟航班上“欺辱、羞辱、恐吓
工会警告:公务员裁员开始了 数百名公共部门员工职位不保
工会警告:公务员裁员开始了 数百名公共部
随着政府着手缩减公共服务规模,数百名工人已被警告他们可能会失去工作。加拿大公共服
加拿大一栋刚过户4天房屋发生离奇爆炸:没有任何起火迹象
加拿大一栋刚过户4天房屋发生离奇爆炸:没
周五上午大约10点36分,急救人员接到电话,前往安省Bayham市的Sandytown Line,一栋房
蒙特利尔这家甜品店否认是犯罪集团的据点
蒙特利尔这家甜品店否认是犯罪集团的据点
魁北克省Laval警方正在调查过去两天内发生在多家当地咖啡馆和餐厅的一系列枪击事件,
蒙特利尔南岸一女子死在公寓中 一人被捕
蒙特利尔南岸一女子死在公寓中 一人被捕
蒙特利尔警方正在调查一宗可疑死亡事件,一名女子被发现在南岸一间公寓内身亡。警方在
Cineplex家庭影院开播 电影票只要3.99元
Cineplex家庭影院开播 电影
蒙特利尔Cineplex每周六早上11点的家庭影院又开始了,
魁省五百元优惠机票可以去哪儿玩?
魁省五百元优惠机票可以去哪
2022年6月1日起,魁省政府推出了“空中准入地区计划”
蒙特利尔郊外新开一家北美最大的蹦床公园
蒙特利尔郊外新开一家北美最
魁北克省 Mont-Saint-Grégoire 山脚下新开了一家北美
魁省迎来北美第一家全包型滑雪度假村 现在只要160元
魁省迎来北美第一家全包型滑
近日,全球知名的法国度假连锁集团Club Med宣布位于魁
刺激!飞跃安魁两省边界!400米长滑索开放!
刺激!飞跃安魁两省边界!40
安省和相邻省的边界已正式开放!肯定会有很多小伙伴驾

Copyright © 1999 - 2025 by Sinoquebec Media Inc. All Rights Reserved 未经许可不得摘抄  |  GMT-5, 2025-12-7 14:22 , Processed in 0.129051 second(s), 23 queries .