太阳成tyc7111cc·(中国)集团官方网站-Macau Bellwether
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

DeepSeek R1悄悄更新!用「小版本」干翻大模型

2025-06-04 09:38:48
来源:

猫眼电影

作者:

黄小希

手机查看

  猫眼电影记者 李子琦 报道w3u7903ejky2ywls

虽然DeepSeek-R2并没有像2个月之前盛传的那样,在5月甚至之前准时赴约。但是,DeepSeek正在不断地用小升级追赶其他厂商的大版本。

昨天DeepSeek官方的一则「R1已完成小版本试升级」的消息,在各个AI讨论群里炸开了花。这回的DeepSeek-R1-0528版本在各个社区引发震动的最主要原因是:它真的不是一次小更新!

目前该升级版的DeepSeek-R1-0528已经全量上线官方网页、APP、小程序等等,API也已经可以接入。

关于DeepSeek官方多么有诚意,我们已经在V3版本的升级上看到了——模型性能大幅提升只是开胃小菜,成本价格比更是再度优化。这回的更新也是一样,新版本的DeepSeek-R1主要在编程能力上大幅提升。据一家LLM API接入网站OpenRouter,这回的新版本R1的输入输出价格几乎与先前版本毫无变化!

在智能水平上,新版本DeepSeek-R1-0528在 Extended NYT Connections 基准测试上相比原始 DeepSeek R1有了大幅提升:38.6 → 49.8。

01

它真的很难说是「小升级」

现在,全网都在疯狂拿它跟全面替代AI coding真神的Claude 4对比,发现:这俩模型竟然不相上下?甚至有一张在Livecodebench上DeepSeek-R1-0528与o3-high旗鼓相当的基准测试对比图,在网上疯传。许多网友认为这回更新后的DeepSeek-R1-0528在代码生成等编程领域的实力已经进入第一梯队了。

我们搜集了全网最有趣的实测体验,看看这回的DeepSeek-R1-0528到底将AI coding的能力拓展了多少:

有X网友@karminski3设置了一个「DeepSeek-R1-0528 VS Claude-4-sonnet」挑战赛,用弹球撞击墙面的效果作对比。

实测下来发现:DeepSeek方的弹球看起来甚至还有光泽,撞碎墙面后的粒子效果几乎能与Claude-4-sonnet一较高下,控制面板的美观度也都非常在线。

值得一提的是,在这次的测试中,两个大模型使用了同一个Prompt,DeepSeek-R1-0528 生成了728行,而Claude-4-sonnet生成了542行。

更新后的R1-0528在粒子效果的表现上尤其好。粒子效果通常会涉及复杂的动态动画和物理模拟,像是物体运动、碰撞、光影变化等等。这足以说明R1-0528在生成复杂动态动画能力上有了很大的突破。

X网友MILO,就做了个可交互的粒子动态动画平台,我们也进去体验了下。我们注意到除了画面中央的炫酷粒子爆炸外,右上角的粒子数计算也以一种很匹配的方式同步进行着。

在全栈网页开发上,「小升级」之后的DeepSeek-R1-0528所表现出来的能力也有了很明显的提升。

比如,X上有网友@DomLiu给 DeepSeek-R1-0528 一个全栈网页开发Prompt,就能在几秒钟内从零开始构建了一个完整的应用程序。

这段提示词还非常的简单:构建一个 three.js 应用程序,用于加载具有实时颜色/材质/配件控制的 3D 模型。直观的用户界面。流畅的相机视角。

更为惊艳的是下面这个Case,同样是这位网友,他几乎将DeepSeek-R1玩出了花,这也证明小升级后的DeepSeek-R1-0528到底在编程能力上有多强。

简单来说,他使用升级后的DeepSeek-R1做了一个3D画廊,有这些功能:

程序化几何生成,动态场景生成系统,多彩动态光影效果,相机动画与过渡,虚拟画廊导航体验。

有实际用过Trae、Cursor、Windsurf等一众AI coding的朋友肯定都懂一个具有强大自主编程能力的基座大模型到底意味着什么?——编程效率的指数级提升。

3D艺术画廊非常直观地显示了DeepSeek-R1-0528在面对复杂任务时的自主编程能力。

我们也实际上手测试了下,发现升级后的DeepSeek-R1-0528在面对非常简单的提示词时也能做出很快的反应,并自主地丰富功能。

比如,我只给了它一句:

生成一个苹果官网风格的前端网页。

它只经过14秒的思考,就轻松理清了苹果官网风格设计页面的设计思路:

· 使用苹果标志性的深空灰/银色调

· 大字体标题和简洁文案

· 高清产品图像与渐变背景

· 悬浮动画效果

· 响应式布局

最主要的是,很短时间内它就已经生成了462行代码,做出来的效果也与我所设想的非常相近:

除了纯代码能力之外,DeepSeek-R1-0528在前端审美上也有了很大的提升。

比如下面这个原生iOS风格界面设计,采用了抹茶绿色主题,融合现代美学,看起来搭配很流畅。

除了产品应用UI风格之外,DeepSeek-R1-0528在HTML网页的前端网格上也有了很大的提升。

下面两组新版本的介绍网页中,深色是DeepSeek-R1-0528生成,在美观度上更具科技感和视觉冲击力,也非常符合AI大模型本来的调性;白色则是由Claude4生成:

02

思维链似乎改变了,出现了一些「副作用」

这回DeepSeek-R1-0528的强势开源,甚至让各国网友都重温了下今年年初R1发布时的情景。现在的DeepSeek-R1-0528已经拥有了Claude系列的强自主编程能力,同时网友们在实际测试中也注意到它的思维链模式似乎发生了改变。

很多实测后的网友都发现这回的升级版DeepSeek-R1-0528的思考过程实在是太长了,很容易出现过度思考的现象。

比如,网友们发现了一个有趣的测试题:「估算一下π/7」,发现DeepSeek-R1-0528的思考推理过程有些太漫长了。

我们也实际测试了下,面对这样的一个小问题,DeepSeek-R1-0528的深度思考时间达到了148秒。并且,其推理过程显得冗余性很大。

DeepSeek-R1-0528在面对「估算一下π/7」这个问题时的思维链到底有多长,你可以直观感受下:

虽然各国网友都直观感受到了升级后的DeepSeek-R1-0528在推理能力上消耗的时间变得长了,但推理结果精度的提升也是显而易见的。经过优化的DeepSeek-R1-0528在处理复杂问题时,已经展现出了更强的逻辑分析能力和更细致的推理过程,这使得输出的答案不仅更加准确,还在深度和广度上都有了显著改进。

比如,X网友@baalatejakataru在实际编程过程中发现新的 DeepSeek-R1-0528想得太多,但是出错时能够快速地自我纠正,还能够很好地写新兴系统编程语言——Zig,表现很不错。

DeepSeek官方这回同样延续了之前发布即开源的策略,R1-0528已经正式开源。除了开源动作之外,更新后的R1仍然采用宽松的MIT许可证,意味着它可用于商业用途。

这次DeepSeek-R1-0528的升级,进一步印证了当下大模型行业的趋势:大版本固然令人期待,但持续稳定的小步迭代同样无法让人装作看不见。

虽然DeepSeek-R2尚未如期而至,也引发了全网对于这一版本的疑惑。但是通过强化编程能力、优化前端审美,DeepSeek团队持续的小步快跑,无疑让业界重新审视小版本升级的巨大价值。尽管思维链的冗长带来了一些「副作用」,但其带来的精度提升和自我纠错能力依然让人无法忽视这次的版本升级。

在未来,DeepSeek-R1-0528的这种不改变大架构,而是通过「小升级、小迭代」就能达成明显效果的方式可能将会成为主流,「大版本号盲目崇拜」已经被破除。

下一次「小升级」,或许就是另一场风暴的开始。

 时事1:赵露思裸被高清网站

  06月04日,特朗普宣布:马斯克与拉马斯瓦米将领导“政府效率部”,

  2、扩大技能型人才的规模。加工制作和维修设备等工作需要大量技术熟练的人员配置,今年新分职工较多,女工较多,个人技能水平参差不齐,导致了维修和加工任务不能及时完成,所以培养一批技术好,技能高的职工是当务之急。机修厂已经根据个人情况进行分工,并组织签订了师徒,近期组织去培训学习特殊工种证,尽快让新分职工可以单独工作。

,小草神调教喷水沦为肉奴小说。

  06月04日,广西漓江画派将举办二十周年系列活动,

  小婴儿很好奇,不知道他们要做什么,扑闪着大眼,开心地张开小手臂,想让他抱。

,小yoyo萝li交精品导航,边添小泬边狠狠躁18禁,金晨被c到高潮下不了床网站。

 时事2:91亚洲码

  06月04日,铸牢中华民族共同体意识文物古籍展接待观众突破20万人次,

  第五,希望同学们坚持开拓创新,充分发挥创新潜能。我们面对的是日新月异的世界,同学们一定要大力发扬以改革创新为核心的时代精神,以勇立潮头的浩气、超越前人的勇气、与时俱进的朝气,立足岗位、立足实际,讲求科学、讲求方法,把创新潜能充分发挥出来;要勤于学习,善于思考,勇于探索,敏于创新,激发求知欲和好奇心,在打好知识根基的前提下,提高创新思维能力,不断认识和掌握真理,为推动理论创新、制度创新、科技创新、文化创新以及其他各方面创新贡献聪明才智。

,速播成人网站黄黄美女裸色软件,老女人老荫户看A片,国产⭐浪潮AV果冻传媒视频老牛。

  06月04日,“五一”假期带火浙江“蓝色”旅游,

  一口黑色的大鼎散发着古朴的气息,上面有日月山河,鸟兽鱼虫,还有上古先民祭祀的场景,看起来神秘莫测。此时鼎中已经加了不少水,底下黑蛟木燃烧,水迅速沸腾,这是要用最烈的火熬煮最霸道的宝药。

,柳智敏疯狂❌喷水自慰,风间阿姨主演的社长叫什么,欧美zZZ❌❌㐅B片。

 时事3:国产精品传媒㊙️入口麻豆

  06月04日,“交行福利季”多措并举惠民生、促消费,

  罗浮大泽的强者蛟苍有一种不甘,更有一种恐惧,站在村头,开口道:“强大的祭灵,请原谅我的无知与冒犯……”

,无尽❌裸体❌触手❌,原神胡桃裸体❌开腿自慰应用,国产又爽❌又黄❌免费鸣人樱桃。

  06月04日,香江观澜:香港旅游业优势独特 可“应变、求变” 乘势而上,

  在其每一寸血肉中,都有一个光点,如同神祇般,那是神性符文的体现,会源源不断的萃取天地造化,引入体中。

,茶啊二中刘若琳裸体网站,少妇与子亂伦在线看,张柏芝性做爰A片免费看。

 时事4:星穹铁道❌禁18同人漫画

  06月04日,2024年内蒙古自治区蒙古马超级联赛开赛,

  化灵境,这真的是一个很奇妙的境界,石昊沉浸当中,这已经不是一种枯燥的修行,而是一种精神上的享受。

,男女动漫黄,小🐥🐥伸女生🍑🍑里姿势,大胸女被c黄秘应用。

  06月04日,推动党纪学习教育走深走实(党纪学习教育),  晴热高温为何还雷雨频频?中国天气网气象分析师石妍解释,持续高温和频繁雷雨天气并不矛盾。由于初夏时节常出现高空冷涡,它一般活跃在东北地区。不过,在冷涡的南侧和东侧,高空有冷气团,低空还有西南风配合的暖湿气流,因而华北、东北南部等地会成为雷雨最频繁、剧烈的区域。,HDHDHD❌❌╳❌XXXX,女仆隐私内裤㊙️无遮挡网站,九色成人🔞在线观看喷潮数学。

责编:嘎哈

审核:方可为

责编:柯某因

相关推荐 换一换