5月7日消息,AI编程领域迎来了新的王者:谷歌DeepMind人工智能研究部门周二发布了全新升级的Gemini 2.5 Pro “I/O”版,这是其今年3月推出、大受欢迎的多模态大语言模型Gemini 2.5 Pro的最新版本。DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)在社交媒体上表示,这是“我们构建过的最佳编程模型!”
谷歌公布的初步基准测试结果印证了这一说法。数据显示,自2022年底ChatGPT正式掀起生成式人工智能热潮以来,谷歌首次在关键编程基准测试中超越所有其他模型,跃居榜首。
此次更新的模型版本编号为“gemini-2.5-pro-preview-05-06”,已取代之前的03-25版本,并已面向Google AI Studio的独立开发者、Vertex AI云平台的企业用户,以及Gemini移动应用的个人用户全面开放。谷歌在官方博文中表示,该模型还驱动Gemini移动应用中的Canvas等多项功能。
新版本为Gemini 95等应用的功能开发提供支持,其模型可自动匹配跨组件的视觉风格。该版本还支持将YouTube视频转化为全功能学习应用等复杂工作流,并能创建高度样式化的组件——如响应式视频播放器或动画听写界面——几乎无需手动编写CSS代码。
作为专有模型,企业需付费并通过谷歌的网络服务访问。不过本次更新未调整价格与调用限制:当前Gemini 2.5 Pro用户将自动升级至新版本,定价仍为每百万tokens输入/输出分别1.25/10美元(支持20万tokens的上下文长度),相较Claude 3.7 Sonnet的3/15美元定价具有优势。
谷歌选择在年度I/O开发者大会(5月20-21日于山景城及线上举行)前夕推出更新,官方表示这是对开发者社区关于Gemini在实际代码生成和界面设计中实用性的强烈反馈的回应。Gemini API与Google AI Studio高级产品经理洛根·基尔帕特里克(Logan Kilpatrick)在开发者博客中确认,本次更新有效回应了开发者关于函数调用的关键反馈,在减少错误和提升触发可靠性方面取得显著改进。
在人类评分员的网页应用生成任务中排名第一
在第三方评估标准WebDev Arena排行榜中,Gemini 2.5 Pro Preview(05-06)在生成美观且实用的网页应用方面获得了最高人类评分,成功超越Anthropic的Claude 3.7 Sonnet,跃居第一。
新版本模型得分为1499.95,显著高于Sonnet 3.7的1377.10。前代Gemini 2.5 Pro(03-25)以1278.96分位列第三,I/O版相比之下提升了221分。
正如AI领域资深用户“Lisan al Gaib”在X上指出的,即使是OpenAI新发布的GPT-4o(“o3”)都未能动摇Sonnet 3.7的地位,足见Gemini此次跃升的突破性。
这一性能跃升体现在生成内容的可靠性、美观性与实用性等方面的全面提升。
获得开发者广泛好评
Gemini 2.5 Pro Preview(05-06)迅速获得开发者社群广泛好评,多位行业领袖称其可靠性和生产场景应用表现远超以往:
人工智能初创公司Cognition联合创始人塞拉斯·阿尔贝蒂(Silas Alberti)指出,Gemini 2.5 Pro是首个成功完成复杂后端路由系统重构的AI模型,展现出类似资深开发者的判断与决策能力。
AI编程平台Cursor首席执行官迈克尔·特鲁尔(Michael Truell)称,内部测试显示工具调用失败率明显下降,过去这一问题饱受诟病。他认为用户将在真实开发环境中明显感受到新版本效能提升。Cursor已将Gemini 2.5 Pro集成进其编程智能体中,显示出开发者已将其视为智能开发工作流中的组件。
云端协同开发平台Replit总裁米歇尔·卡塔斯塔(Michele Catasta)认为,Gemini 2.5 Pro是在模型性能与响应速度之间实现最佳平衡的前沿模型。他的评价暗示,Replit正在考虑将该模型纳入自身工具体系中,特别是在需要响应速度与稳定性的任务场景中。
AI教育者兼BlueShell私有AI聊天机器人创始人保罗·库弗特(Paul Couvert)表示:“Gemini 2.5 Pro的代码与用户界面生成能力令人惊艳。”
AI艺术工具EverArt首席执行官彼得罗·斯基拉诺(Pietro Schirano)称,Gemini 2.5 Pro I/O版能够根据单个提示词生成互动模拟,如近期社交媒体流行的“1只大猩猩对战100名人类”迷因。
X用户“RameshR”(@rezmeram)还展示了该模型在不到一分钟内生成的一款互动式俄罗斯方块风格游戏,并配有音效,他在帖文中写道:“休闲游戏行业已经完了!!”
这些正面的行业认可增强了DeepMind关于模型实际性能提升的说法,也可能进一步推动其在开发者平台中的广泛应用。
单个提示即可生成完整应用程序
此次更新的亮点之一是:用户可通过简单提示生成完整的互动网页应用或模拟程序,这完美契合DeepMind简化原型设计与开发流程的愿景。
Gemini应用内的演示显示,用户可以将视觉模式或主题提示直接转化为可用代码,大幅降低设计导向开发团队的技术门槛,为尝试新想法的团队提供高效工具。
尽管谷歌尚未公开Gemini 2.5 Pro的底层架构与内部改动,但其重点显然是提供更快、更直观的开发体验。
通过强化代码生成能力与多模态输入整合,Gemini 2.5 Pro不再是实验型产品,而成为应对实际开发挑战的强大工具。此次提前发布也表明,谷歌DeepMind有意在I/O大会前积极响应开发者需求,并持续保持发展势头。(小小)
《女帝❌路飞18禁同人图片》,《w3u7903ejky2ywls》流萤被❌黄漫视频
“少司缘18🈲️被爆乳”
动漫❌c🐻黄扒衣服动漫
……
05月15日
“原神仆人裸身被❌羞羞照片”罪犯吴谢宇被执行死刑
↓↓↓
05月15日,原创北京曲剧《运河之端有片海》在京首演,鱼哥星野,冢本一冢本夫人家庭背景和成就,千鹤开发日记番剧动漫免费观看,雪帝被肉干高H潮文不断的APP
05月15日,福建建瓯:中华秋沙鸭归来 生态向好展新颜,教官把我带到卧室揉我奶头视频,肉丝祙做爰XXXⅩ性视频,brazzersx24💋欧美,维妮娜被扒开腿做❌同人网站
05月15日,“鲁派”纪录片成为“好客山东 好品山东”国际传播新名片,男生女生一起愁愁愁免费观看,老头玩弄少妇BBBBBBBBB,FreeHD18❌❌❌3D漫画,《初尝禁果》2:做爰电影
05月15日|国开行发放8.08亿元贷款支持青岛首批配售型保障性住房建设|浴室里强摁做开腿呻吟动态图|钉崎野蔷薇裸体❌开腿图片|免费精品视频一区二区三区学生|主人罚我把腿张开臊烂你动态图
05月15日|江苏特种设备焊接技能高手在扬州同台竞技|国产⭕⭕⭕⭕XXXX孕妇|妓女❌❌奶头❌❌裸体视频|亚洲AV无码㊙️石川澪|不知火舞私㊙️奶头大屁股小说
05月15日|(新春走基层)“龙”重登场 新春“祥瑞”已送达重庆|美女撒尿无遮挡㊙️照片|赵露思裸被❌网站|男男doi攻🌿的巨猛受受文|星野和光头鱼视频……
05月15日,“鲁派”纪录片成为“好客山东 好品山东”国际传播新名片,原神涩涩同人❌18禁本子,furry自慰爽到抽搐喷水,ass中国艳妇裸体pics,中国体育生白袜自慰出精🔞
05月15日,冷空气影响江南及以北地区 华北南部等地霾天气减弱消散,国产GaysexChina男video,女初高中生打屁股❤️网站,把女仆🌸吊起来揉搓双乳电影,小心🐤入🍑🍑视频免费
05月15日|俄伊领导人通话讨论叙利亚局势|天天干天天射大姑娘视频|公猪钻入女人子宫会怎么样|女仆绑住㊙️让人爽桶|女班长乖乖掀起裙子打屁股图片
05月15日,中国香港成为2024年巴黎奥运三人篮球资格赛主办城市,frGesPanKiing打板子视频,花火裸体❌开腿图片,变态把女性扒开👙看个够挠痒,无尽触手怪物讨厌可爱
05月15日,重庆连续三天发布高温红色预警信号,女同被调教黄秘B站,3dm动漫人情债偿还系统严选动画,大香萑,赵丽颖裸被❌高清视频
05月15日,第135届广交会“新”意不断,内衣摘下什么样图片,白丝校🌸脱白丝娇喘,女扑扒开🍑让客人添小说,火影忍者花火被❌爆乳图片
05月15日|新疆—广元铝锭首发班列满载2500余吨铝锭抵达四川广元|XXWWXX18日本🇯🇵|FC2PPV【完全顔出し】在线|裸男胖太私㊙️无遮挡|江楠楠大⋯好爽⋯裙子湿透了小说
05月15日|上百只天鹅飞抵柴达木盆地可鲁克湖越冬|白丝玉足娇喘抽搐喷潮av网站|汤姆维|喜多川被五条❌黄漫|安娜艾莎被肉干高H潮文不断
05月15日|湘粤非铁海联运邵阳接续班列首发|YY91狼理论片在线观看|无码人妻精品一区二区三区99仓|甘雨裸身被羞羞软件|祖英裸体双乳呻吟
专家称寡妇年不宜结婚说法荒唐,沪深两市今日成交额7030亿|改革为人民|助力“通道经济” 总书记关注“数智”港口建设|芙宁娜被到爽高潮|爱人体亚洲人休沟沟|动漫❌巨乳❌3d❌视频|浪货今天就把你🌿到舒服
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺