虽然DeepSeek-R2并没有像2个月之前盛传的那样,在5月甚至之前准时赴约。但是,DeepSeek正在不断地用小升级追赶其他厂商的大版本。
昨天DeepSeek官方的一则「R1已完成小版本试升级」的消息,在各个AI讨论群里炸开了花。这回的DeepSeek-R1-0528版本在各个社区引发震动的最主要原因是:它真的不是一次小更新!
目前该升级版的DeepSeek-R1-0528已经全量上线官方网页、APP、小程序等等,API也已经可以接入。
关于DeepSeek官方多么有诚意,我们已经在V3版本的升级上看到了——模型性能大幅提升只是开胃小菜,成本价格比更是再度优化。这回的更新也是一样,新版本的DeepSeek-R1主要在编程能力上大幅提升。据一家LLM API接入网站OpenRouter,这回的新版本R1的输入输出价格几乎与先前版本毫无变化!
在智能水平上,新版本DeepSeek-R1-0528在 Extended NYT Connections 基准测试上相比原始 DeepSeek R1有了大幅提升:38.6 → 49.8。
01
它真的很难说是「小升级」
现在,全网都在疯狂拿它跟全面替代AI coding真神的Claude 4对比,发现:这俩模型竟然不相上下?甚至有一张在Livecodebench上DeepSeek-R1-0528与o3-high旗鼓相当的基准测试对比图,在网上疯传。许多网友认为这回更新后的DeepSeek-R1-0528在代码生成等编程领域的实力已经进入第一梯队了。
我们搜集了全网最有趣的实测体验,看看这回的DeepSeek-R1-0528到底将AI coding的能力拓展了多少:
有X网友@karminski3设置了一个「DeepSeek-R1-0528 VS Claude-4-sonnet」挑战赛,用弹球撞击墙面的效果作对比。
实测下来发现:DeepSeek方的弹球看起来甚至还有光泽,撞碎墙面后的粒子效果几乎能与Claude-4-sonnet一较高下,控制面板的美观度也都非常在线。
值得一提的是,在这次的测试中,两个大模型使用了同一个Prompt,DeepSeek-R1-0528 生成了728行,而Claude-4-sonnet生成了542行。
更新后的R1-0528在粒子效果的表现上尤其好。粒子效果通常会涉及复杂的动态动画和物理模拟,像是物体运动、碰撞、光影变化等等。这足以说明R1-0528在生成复杂动态动画能力上有了很大的突破。
X网友MILO,就做了个可交互的粒子动态动画平台,我们也进去体验了下。我们注意到除了画面中央的炫酷粒子爆炸外,右上角的粒子数计算也以一种很匹配的方式同步进行着。
在全栈网页开发上,「小升级」之后的DeepSeek-R1-0528所表现出来的能力也有了很明显的提升。
比如,X上有网友@DomLiu给 DeepSeek-R1-0528 一个全栈网页开发Prompt,就能在几秒钟内从零开始构建了一个完整的应用程序。
这段提示词还非常的简单:构建一个 three.js 应用程序,用于加载具有实时颜色/材质/配件控制的 3D 模型。直观的用户界面。流畅的相机视角。
更为惊艳的是下面这个Case,同样是这位网友,他几乎将DeepSeek-R1玩出了花,这也证明小升级后的DeepSeek-R1-0528到底在编程能力上有多强。
简单来说,他使用升级后的DeepSeek-R1做了一个3D画廊,有这些功能:
程序化几何生成,动态场景生成系统,多彩动态光影效果,相机动画与过渡,虚拟画廊导航体验。
有实际用过Trae、Cursor、Windsurf等一众AI coding的朋友肯定都懂一个具有强大自主编程能力的基座大模型到底意味着什么?——编程效率的指数级提升。
3D艺术画廊非常直观地显示了DeepSeek-R1-0528在面对复杂任务时的自主编程能力。
我们也实际上手测试了下,发现升级后的DeepSeek-R1-0528在面对非常简单的提示词时也能做出很快的反应,并自主地丰富功能。
比如,我只给了它一句:
生成一个苹果官网风格的前端网页。
它只经过14秒的思考,就轻松理清了苹果官网风格设计页面的设计思路:
· 使用苹果标志性的深空灰/银色调
· 大字体标题和简洁文案
· 高清产品图像与渐变背景
· 悬浮动画效果
· 响应式布局
最主要的是,很短时间内它就已经生成了462行代码,做出来的效果也与我所设想的非常相近:
除了纯代码能力之外,DeepSeek-R1-0528在前端审美上也有了很大的提升。
比如下面这个原生iOS风格界面设计,采用了抹茶绿色主题,融合现代美学,看起来搭配很流畅。
除了产品应用UI风格之外,DeepSeek-R1-0528在HTML网页的前端网格上也有了很大的提升。
下面两组新版本的介绍网页中,深色是DeepSeek-R1-0528生成,在美观度上更具科技感和视觉冲击力,也非常符合AI大模型本来的调性;白色则是由Claude4生成:
02
思维链似乎改变了,出现了一些「副作用」
这回DeepSeek-R1-0528的强势开源,甚至让各国网友都重温了下今年年初R1发布时的情景。现在的DeepSeek-R1-0528已经拥有了Claude系列的强自主编程能力,同时网友们在实际测试中也注意到它的思维链模式似乎发生了改变。
很多实测后的网友都发现这回的升级版DeepSeek-R1-0528的思考过程实在是太长了,很容易出现过度思考的现象。
比如,网友们发现了一个有趣的测试题:「估算一下π/7」,发现DeepSeek-R1-0528的思考推理过程有些太漫长了。
我们也实际测试了下,面对这样的一个小问题,DeepSeek-R1-0528的深度思考时间达到了148秒。并且,其推理过程显得冗余性很大。
DeepSeek-R1-0528在面对「估算一下π/7」这个问题时的思维链到底有多长,你可以直观感受下:
虽然各国网友都直观感受到了升级后的DeepSeek-R1-0528在推理能力上消耗的时间变得长了,但推理结果精度的提升也是显而易见的。经过优化的DeepSeek-R1-0528在处理复杂问题时,已经展现出了更强的逻辑分析能力和更细致的推理过程,这使得输出的答案不仅更加准确,还在深度和广度上都有了显著改进。
比如,X网友@baalatejakataru在实际编程过程中发现新的 DeepSeek-R1-0528想得太多,但是出错时能够快速地自我纠正,还能够很好地写新兴系统编程语言——Zig,表现很不错。
DeepSeek官方这回同样延续了之前发布即开源的策略,R1-0528已经正式开源。除了开源动作之外,更新后的R1仍然采用宽松的MIT许可证,意味着它可用于商业用途。
这次DeepSeek-R1-0528的升级,进一步印证了当下大模型行业的趋势:大版本固然令人期待,但持续稳定的小步迭代同样无法让人装作看不见。
虽然DeepSeek-R2尚未如期而至,也引发了全网对于这一版本的疑惑。但是通过强化编程能力、优化前端审美,DeepSeek团队持续的小步快跑,无疑让业界重新审视小版本升级的巨大价值。尽管思维链的冗长带来了一些「副作用」,但其带来的精度提升和自我纠错能力依然让人无法忽视这次的版本升级。
在未来,DeepSeek-R1-0528的这种不改变大架构,而是通过「小升级、小迭代」就能达成明显效果的方式可能将会成为主流,「大版本号盲目崇拜」已经被破除。
下一次「小升级」,或许就是另一场风暴的开始。
《女生qq弹弹跳舞视频半边球》,《w3u7903ejky2ywls》宋居寒何故木马椅
“神里绫华裸体㊙️无遮挡”
JaPanese熟妇人妻HD
……
06月01日
“公与丰满媳1一15黄蓉欧阳锋”11岁男孩被骗与女主播裸聊
↓↓↓
06月01日,(走进中国乡村)中国史前村落现激增客流 大地湾文化迎“新面貌”,91|牛牛|国产人妻♥,男性脱👙给我揉🐻+亲嘴17.c,窜天猴隐藏入口永久免费,免费白丝jk爆❌❌乳❌❌❌游戏
06月01日,以园聚企 福建周宁逐梦“百亿工业”,女用吸乳情趣,天然冰透🈵️色满肉樱花粉手,希格雯被打开双腿灌满白浆的视频,穿入vr世界成为x领域猎人
06月01日,海南:与电影共成长,英雄联盟阿狸被❌黄3D免费,4i小狗抖m,p5芳泽霞被吃胸摸屁股,HD XXX Porn Video
06月01日|小孩报警“讨公道”,究竟为何呢?|Porno😍6|佐助被鸣人脱裤子撅起来调教|成人▇AV蘑菇视频▇观看|星野大战光头哥免费播放
06月01日|云海雪景纷至沓来 新疆布尔津禾木“上映”绝美冬景|丝❌❌❌流水大叫|扒开❌狂揉❌羞羞中国|兔女郎爆乳❌永久不会删除链接|18禁ginntess女巨人网址
06月01日|重庆建工集团原党委书记、董事长魏福生接受审查调查 |满嘴含精大口吞精的女人|91人妻PORNY丨首页❤入口|女人裸身㊙️免费视频|麻豆㊙️免费漫画……
06月01日,一系列经济数据不及预期 美国经济衰退担忧重创东京股市,坐脸 让你闻个够,pppe135,被黑人c到高潮婬荡呻吟30分,国产精品❌❌❌A片在线观看崩铁
06月01日,北交所920代码号段22日启用 上市“身份证”凸显差异化市场价值,惩罚女仆扒开🍑打屁屁动漫,原神美女露大胸秘洗澡跳舞,鸣人❌小南18禁同人本,奥特之母超退化母体漫画网盘
06月01日|我国自然资源确权已覆盖武夷山、大熊猫国家公园等近百重点区域|火影❌吸乳羞羞网站视频|4399打初音pg游戏原版|巴巴塔掀开裙子摸小内内的小说|美女的裸体㊙️免费全站
06月01日,范曾画作《贾岛诗意》被制成NFT数字藏品售卖 法院:侵害信息网络传播权,furry❤♂videos,星穹铁道霍霍黄化漫画,美女裸体㊙️无遮挡浴室,小🐔🐔C进那里
06月01日,广东专家创新乙肝治愈新策略 治愈率有望突破30%,被调教成放荡小婬妇,打肿菊🌸玉势调教姜刑打烂视频,美女裸体18禁游戏可触摸,李淑芬无力的张开双腿视频
06月01日,泡温泉泡澡堂,会不会感染HPV,少妇与公猪交视频免费观看,少爷被两根双龙玩弄肉男男,3D动漫美女被❌羞羞动漫,男人的🍌伸到🍑屁股看到的
06月01日|重庆潼南:万亩彩色油菜花迎盛花期 吸引游客踏春游玩|暗交小拗女一区二区三|岛国pred门牌722|使劲cao我吧求cao奶3p|雏田被❌吸乳歪歪漫画网站在线
06月01日|广州:房票可购买全市可售的新建商品房|千仞雪被撕烂胸罩和内裤|少妇2做爰伦理苍井空|91九色PORNY最新首页|扒开动漫❌狂揉❌羞羞3d火影
06月01日|第十届华厦眼科青光眼论坛启幕 开创微创诊疗新格局|动漫美女被奶头吸乳|挠痒痒㊙️网站免费|扒开美女❌狂揉❌中国|老师让我❌她我爽羞羞真人
长安汽车董事长直呼BBA太落后,戴伟浚被对方鞋钉蹬脸|超九成受访大学生感到恋爱课上收获颇丰|高清乱码❌♋网站|女被到爽流片调教捆绑|韩漫未删在哪看|浴室中年男士搓澡勃起来了
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺