太阳成tyc7111cc·(中国)集团官方网站-Macau Bellwether

首页 >新闻 >社会新闻

AI编程王者易主：谷歌Gemini 2.5 Pro I_O版力压Claude 3.7 Sonnet

2025-05-08 03:00:47

来源：

猫眼电影

作者：

宋志平

手机查看

　　猫眼电影记者邓继敢报道w3u7903ejky2ywls

5月7日消息，AI编程领域迎来了新的王者：谷歌DeepMind人工智能研究部门周二发布了全新升级的Gemini 2.5 Pro “I/O”版，这是其今年3月推出、大受欢迎的多模态大语言模型Gemini 2.5 Pro的最新版本。DeepMind首席执行官德米斯·哈萨比斯（Demis Hassabis）在社交媒体上表示，这是“我们构建过的最佳编程模型！”

谷歌公布的初步基准测试结果印证了这一说法。数据显示，自2022年底ChatGPT正式掀起生成式人工智能热潮以来，谷歌首次在关键编程基准测试中超越所有其他模型，跃居榜首。

此次更新的模型版本编号为“gemini-2.5-pro-preview-05-06”，已取代之前的03-25版本，并已面向Google AI Studio的独立开发者、Vertex AI云平台的企业用户，以及Gemini移动应用的个人用户全面开放。谷歌在官方博文中表示，该模型还驱动Gemini移动应用中的Canvas等多项功能。

新版本为Gemini 95等应用的功能开发提供支持，其模型可自动匹配跨组件的视觉风格。该版本还支持将YouTube视频转化为全功能学习应用等复杂工作流，并能创建高度样式化的组件——如响应式视频播放器或动画听写界面——几乎无需手动编写CSS代码。

作为专有模型，企业需付费并通过谷歌的网络服务访问。不过本次更新未调整价格与调用限制：当前Gemini 2.5 Pro用户将自动升级至新版本，定价仍为每百万tokens输入/输出分别1.25/10美元（支持20万tokens的上下文长度），相较Claude 3.7 Sonnet的3/15美元定价具有优势。

谷歌选择在年度I/O开发者大会（5月20-21日于山景城及线上举行）前夕推出更新，官方表示这是对开发者社区关于Gemini在实际代码生成和界面设计中实用性的强烈反馈的回应。Gemini API与Google AI Studio高级产品经理洛根·基尔帕特里克（Logan Kilpatrick）在开发者博客中确认，本次更新有效回应了开发者关于函数调用的关键反馈，在减少错误和提升触发可靠性方面取得显著改进。

在人类评分员的网页应用生成任务中排名第一

在第三方评估标准WebDev Arena排行榜中，Gemini 2.5 Pro Preview（05-06）在生成美观且实用的网页应用方面获得了最高人类评分，成功超越Anthropic的Claude 3.7 Sonnet，跃居第一。

新版本模型得分为1499.95，显著高于Sonnet 3.7的1377.10。前代Gemini 2.5 Pro（03-25）以1278.96分位列第三，I/O版相比之下提升了221分。

正如AI领域资深用户“Lisan al Gaib”在X上指出的，即使是OpenAI新发布的GPT-4o（“o3”）都未能动摇Sonnet 3.7的地位，足见Gemini此次跃升的突破性。

这一性能跃升体现在生成内容的可靠性、美观性与实用性等方面的全面提升。

获得开发者广泛好评

Gemini 2.5 Pro Preview（05-06）迅速获得开发者社群广泛好评，多位行业领袖称其可靠性和生产场景应用表现远超以往：

人工智能初创公司Cognition联合创始人塞拉斯·阿尔贝蒂（Silas Alberti）指出，Gemini 2.5 Pro是首个成功完成复杂后端路由系统重构的AI模型，展现出类似资深开发者的判断与决策能力。

AI编程平台Cursor首席执行官迈克尔·特鲁尔（Michael Truell）称，内部测试显示工具调用失败率明显下降，过去这一问题饱受诟病。他认为用户将在真实开发环境中明显感受到新版本效能提升。Cursor已将Gemini 2.5 Pro集成进其编程智能体中，显示出开发者已将其视为智能开发工作流中的组件。

云端协同开发平台Replit总裁米歇尔·卡塔斯塔（Michele Catasta）认为，Gemini 2.5 Pro是在模型性能与响应速度之间实现最佳平衡的前沿模型。他的评价暗示，Replit正在考虑将该模型纳入自身工具体系中，特别是在需要响应速度与稳定性的任务场景中。

AI教育者兼BlueShell私有AI聊天机器人创始人保罗·库弗特（Paul Couvert）表示：“Gemini 2.5 Pro的代码与用户界面生成能力令人惊艳。”

AI艺术工具EverArt首席执行官彼得罗·斯基拉诺（Pietro Schirano）称，Gemini 2.5 Pro I/O版能够根据单个提示词生成互动模拟，如近期社交媒体流行的“1只大猩猩对战100名人类”迷因。

X用户“RameshR”（@rezmeram）还展示了该模型在不到一分钟内生成的一款互动式俄罗斯方块风格游戏，并配有音效，他在帖文中写道：“休闲游戏行业已经完了！！”

这些正面的行业认可增强了DeepMind关于模型实际性能提升的说法，也可能进一步推动其在开发者平台中的广泛应用。

单个提示即可生成完整应用程序

此次更新的亮点之一是：用户可通过简单提示生成完整的互动网页应用或模拟程序，这完美契合DeepMind简化原型设计与开发流程的愿景。

Gemini应用内的演示显示，用户可以将视觉模式或主题提示直接转化为可用代码，大幅降低设计导向开发团队的技术门槛，为尝试新想法的团队提供高效工具。

尽管谷歌尚未公开Gemini 2.5 Pro的底层架构与内部改动，但其重点显然是提供更快、更直观的开发体验。

通过强化代码生成能力与多模态输入整合，Gemini 2.5 Pro不再是实验型产品，而成为应对实际开发挑战的强大工具。此次提前发布也表明，谷歌DeepMind有意在I/O大会前积极响应开发者需求，并持续保持发展势头。（小小）

时事1：asmr专区成人网站

05月08日,外媒：伊拉克宣布召回驻伊朗大使,

　　狂风呼啸，转眼间，他们就消失在天际，冲向远方那片死气沉沉的大地。

,雌堕的肛门训练计划2全流程攻略。

05月08日,1元包装费缘何触动消费者神经？,

　　“子陵，暂且放下这一切，十年后你将接掌我们石府。”一位老祖开口。

,女性向av免费入口观看,大奉打更人1-40集电视连续剧,杨钰莹性XXXⅩ交XXXX。

时事2：久久久夜色精品亚洲AV图片西施

05月08日,标准引领，推动产品升级绿色转型（深入开展“两新”工作着力扩大国内需求）,

　　雨族众人快哭了，这神液根本不是用来喝的，可以做药引子，也能用来炼宝具。退一万步来说，你说你喝就喝吧，怎么能这样砸下来？！

第一百三十一章鸟毛一地,阿米娅污文,欧美性XXXXXXX,免费无遮挡🔞禁。

05月08日,中国驻美大使谢锋：中美三个联合公报是最重要“护栏”，遏制“台独”这个祸根乱源是最紧迫任务,

　　站在教室门口的走廊上，可以看清楚楼下的一草一木，它们是多么的翠绿，看着舒服。它们见证了我们的成长：操场上，有我们跑步的身影;小道旁，常常有我们的欢声笑语。走进教室里，呆呆的望着黑板，仿佛前面有一位老师，正在讲课，而座位上，是我们积极对我同学。走出校园，回过头，那石碑上清晰刻着：安阳实验小学。六个大字，作为安阳实小人，我为此感到自豪……母校给了我无限的回忆，她给了我太多太多的东西。

,美女露出㊙️胸奶头,叶山小百合最美丈母娘完整版在线观看,日本漏尿失禁丨∨K视频。

时事3：女被❌c🐻黄变态玩具视频

05月08日,（乡村行·看振兴）山西石楼托管农田27万亩零散“巴掌田”变整片“增收田”,

　　十五爷的强大在皇都是出了名的，两箭射死一头太古遗种——鸾鸟，谁能做到？一身修为惊天动地！

,兔朱迪大屁股喷水在线观看,性裸交直播,911在线无码精品㊙️入口偶像。

05月08日,把岁月过成书的模样 “年货”日历书焕新升级,

　　月光柔和，朦胧而皎洁，湖畔充满笑语，两年多未见，小不点与清风在这里开心无比，无比的活跃。

,小🍌🍌里面🍑🍑,无羞挡无删减歪歪漫画sss,男女啪啪高清无遮挡免费直播软件。

时事4：女的被❌到爽的片色韩国

05月08日,湖北宜昌交警启用恶劣天气预警系统保障春运,

　　“你们不许乱说！”脸色苍白的孩子，身子很虚弱，大眼中满是泪水，有一种伤心更有一种绝望。

,烈火雄心成版,91人妻精品国产一区二,精品人妻一区二区三区奶水。

05月08日,第十二届全球视频媒体论坛在泉州举行李书磊以视频方式出席并致辞,

　　光华一闪，赤剑向城中飞去。

,维妮娜被扒开腿做❌同人网站,天涯黄网,美女私密㊙️无遮挡网站视频。

【台青在桂探索咖啡新业态盼呈现更多在地文化】

【“3820”战略如何有力实施？答案就是，坚持改革开放！】

责编：谢华兵

审核：李麦成

责编：柯受访