5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平台开源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,用户可通过官方网页、App、小程序进行测试(打开深度思考),API接口和使用方式保持不变。
在此次更新中,模型代码能力的提升最为显著。知名代码测试平台LiveCodeBench显示,更新后的R1性能可以媲美OpenAI o3模型的高版本。
除代码能力外,R1新版本模型的文本理解与推理能力亦实现跨越式升级。其上下文长度拓展至128k,长文本提取的准确率也有显著提升。
《每日经济新闻》记者(以下简称“每经记者”)通过俄罗斯方块游戏开发、太阳系模拟与交互展示,以及设计英伟达最新财报网页这三项任务对R1新版本进行了实测,发现DeepSeek-R1-0528的编程能力确实强大,对物理世界的理解以及文本的提取都相当准确。
知名AI评论人Haider在社交媒体上评价称,这是开源的一大胜利。
瑞士IT咨询公司CTOL Digital Solutions首席执行官Max Zhang则表示,在这一“小”进步之后,我们确实可以期待更大突破(DeepSeek-R2)的到来。
图片来源:Hugging Face
“小升级”实现“大跨越”:升级后的R1性能媲美o3模型高版本
DeepSeek延续了其一贯的低调风格,此次升级率先在微信群进行官宣,并轻描淡写地将其定义为“小版本升级”。
然而,众多开发者实测后发现,此次的“小”升级,并不小。升级后的DeepSeek-R1,模型能力可以说实现了跨越式提升。
图片来源:DeepSeek官方微信群截图
编码能力方面,代码测试平台LiveCodeBench显示,更新后的DeepSeek-R1性能接近OpenAI在4月中旬发布的o4-mini和o3模型高版本。
据测试者反馈,DeepSeek-R1-0528能够一次性生成超千行无Bug代码,且在HTML/CSS/JS动态交互实现(如天气卡片动画、数据可视化)中更加精准。
图片来源:代码测试平台LiveCodeBench
除代码能力外,新版本模型的文本理解与推理能力亦实现跨越式升级。其上下文长度拓展至128k,长文本提取的准确率也有显著提升。
在Extended NYT Connections基准测试中,相比于前一代DeepSeek-R1,最新的0528版本的提升非常明显,得分从38.6%大幅升至49.8%。
图片来源:X
目前,ChatBot Arena也已经“上架”了最新版本的DeepSeek-R1,但还没有任何的测试结果。
图片来源:X
记者实测编程能力
为了更全面地测试DeepSeek-R1-0528的编程能力,每经记者设计了三项不同难度和类型的编程任务,包括网页游戏制作、物理世界模拟、财报可视化,来检验其在实际场景中的表现。
任务一:俄罗斯方块游戏开发
作为一款经典的休闲游戏,俄罗斯方块游戏的开发涉及图形绘制、游戏逻辑处理、用户交互等多个方面,能够很好地考察模型对于综合编程知识的掌握和运用能力。
每经记者首先向DeepSeek-R1提出需求:“请帮我开发一个网页端俄罗斯方块小游戏,要求包含游戏分数、彩色方块及多个关卡。”
DeepSeek仅思考了7秒,就开始输出代码。然而,初步生成的游戏无法正常运作,虽有预设的分数与关卡显示,但游戏区域内并没有俄罗斯方块。
图片来源:由DeepSeek生成
随后,记者调整提示词,仅提了最基础的要求,“请帮我写个俄罗斯方块游戏(网页端),直接可以上手玩。”
简洁的指令似乎对DeepSeek-R1-0528更加奏效。这次R1思考9秒,用时约3分30秒便生成了代码。
图片来源:由DeepSeek生成
从游戏页面来看,色彩搭配鲜明且协调,不同颜色的方块在深色背景下十分醒目,游戏区域布局合理,操作说明也清晰明了。
在游戏逻辑方面,方块的下落、移动和旋转都很流畅,没有出现延迟或卡顿现象。
可以说,已经具备了一个成熟俄罗斯方块游戏应有的功能和体验。
任务二:太阳系模拟与交互展示
接下来,难度升级。对于大模型而言,对物理世界进行准确模拟长期以来都是一项极具挑战性的任务。
此次,记者特意选取“行星轨道运动的物理模拟”这一任务,在考察其编码能力的同时,也考察DeepSeek-R1-0528对物理世界的理解能力。
记者向R1提出要求——写一个太阳系模拟网页,并且网页可交互展示。
因为任务更复杂,R1思考时间也相应变长,耗时54秒后开始输出代码。
图片来源:由DeepSeek生成
可以看出,R1的整体完成度极高,完全可以作为中小学科普动画的原型演示。
从界面呈现看,太阳居于中心,八大行星依照各自轨道有序排布,色彩搭配也符合人们对天体的认知。此外,行星的大小比例、相对位置都比较精准。
在交互功能方面,右侧控制面板设计简洁且功能丰富。
同时,页面“行星信息”板块还以简洁明了的文字介绍了太阳及各大行星的关键特征,如太阳的质量、直径,水星的公转周期、表面温度等,兼具科普性与趣味性。
任务三:设计英伟达最新财报网页
最后,每经记者上传了英伟达2026财年第一财季财报的文档,要求R1根据财报中的内容,制作一个可交互的网页。
财报中数据繁杂,文本较长,非常考察模型准确提取文本的能力。
图片来源:由DeepSeek生成
DeepSeek-R1生成的网页令人眼前一亮。在视觉呈现上,网页采用了标志性的“英伟达绿”,颜色搭配协调。
数据方面,基本做到了准确无误,很少出现“幻觉”情况。此外,模型还绘制了柱状图、饼图等图表,让复杂的数据变得一目了然。
尽管可能还存在一些细微的提升空间。比如,在涨跌幅的颜色上,我们通常用红色表示上涨,绿色表示下跌。但可能由于记者投喂的是美股公司财报(美股一般用绿色表示上涨,红色表示下跌),R1用了与之对应的颜色来展示涨跌幅。
整体来看,R1已充分彰显其在复杂任务处理上的卓越潜力。
“全球AI竞赛关键节点”!DeepSeek-R1新版获海外盛赞
DeepSeek最新发布的R1模型升级版在全球AI领域掀起热议,多位国际主流科技大佬及行业高管纷纷发声,盛赞其技术突破。
机器学习研究者kalomaze实测后赞叹道,“DeepSeek太出色了。”
Hyperbolic Labs联合创始人兼首席技术官Yuchen Jin表示,新版R1似乎是唯一能回答9.9减9.11等于几的模型。
知名AI评论人Haider直呼,这是开源的一大胜利。“DeepSeek王者归来了。新版本的DeepSeek-R1在编程方面简直令人难以置信,这是我测试过的最佳模型。”
AI撰稿人乔治·霍普金(George Hopkin)表示,DeepSeek的R1模型更新后,推理和输出能力大幅提升,标志着中国在全球AI竞赛中的影响力日益增强。
瑞士IT咨询公司CTOL Digital Solutions首席执行官Max Zhang指出,DeepSeek的最新版R1模型,正悄然成为谷歌Gemini 2.5 Pro的强劲竞争对手。“这一发展不仅仅是技术进步,更是全球AI竞赛中的一个关键节点。该模型凭借其双倍输出能力和增强的数学推理能力,展示了中国在AI领域的快速崛起。”
DeepSeek此次更新的亮眼表现,为DeepSeek的下一代模型R2注入更多想象空间。Max Zhang表示,在这一“小”进步之后,我们确实可以期待更大突破的到来。
《男女被啪羞羞全免费》,《w3u7903ejky2ywls》撑起蔡文姬双腿往里疯狂输入
“女人被躁到高潮C片裸体按摩”
小舞屈辱含精大口吞精
……
06月02日
“美女露出全胸被绑住”幻兽帕鲁销量突破200万
↓↓↓
06月02日,让“清新的蓝”“怡人的绿”成为厦门恒久骄傲,张柏芝性做爰A片免费看,国产做受18~20岁A片,JanpanHD❌❌❌女同,喜欢白胖胖的老太太
06月02日,吉林省推进老年助餐服务:让老人“暖胃”更“暖心”,在车里被高潮被c了八次,XXXmmm💋🍌🍆🍑女,莫妮卡在厨房被c高潮部分,在飞机上和空少做h
06月02日,中国团队最新研究:草原火灾位居全球碳排放贡献首位,香蕉视频一时一时爽www,雏田❌❌❌爆🈲🔞视频,一拳超人龙卷被❌十八禁视频,嫩草影院入口❤懂你的❤️
06月02日|财经观察:“硬防晒”渐成标配 撬动夏日消费“新蓝海”|欲涩漫APP❤网站下载|单k互k录音mp3视频|博人扒开雏田屁股桶爽小说|女同 脱裤子打屁股网站
06月02日|黄河三角洲最大跨度A字型斜拉桥合龙|男同被❌到爽🔞流国产|情侣之夜动漫第1季在哪看|户外美女撒尿㊙️|美女脱个精光露出奶让变态玩视频
06月02日|无声世界的“追梦人”:“95后”听障小伙用双手传承千年窑火|91成人无码看片在线观看网址|毛片日山羊|米塔瑟瑟官方网站入口|喷🔞🈲🍌流水高c动漫……
06月02日,【讲习所·中国与世界】“我们一直与中国并肩前进”,播放男人添女人下边视频,小茹和小白狗TXT,51XX嘿嘿午夜,男女一起努力做豆浆怎么画
06月02日,互指对方违反停火协议 以军同黎真主党再交火致多人死伤,局长在车里含着我奶头子,女fyee牲zozo交体内谢,淑芬好爽好紧宝贝别夹视频,男性GAY无套国产✅G片
06月02日|持续阴雨雪天气来袭 河南气象部门提醒防范不利影响|高清乱码🔞❌♋免费蘑菇动漫|动漫被❌到爽🔞流游戏|扒开纲手❌狂揉❌3d|朱竹清拨开胸罩露出奶头
06月02日,财政部:2023年中国一般公共预算收入超21万亿元,免费看裸体🔞🔞🔞网站果动,小伸进现看,中国美女尿囗㊙️免费看,三级小说肥水不流外人田性欲很强大的留守肥婆
06月02日,研究机构预测,“十五五”中国机器人产业规模达4000亿元左右,好爽⋯要高潮了⋯再深点男男视频,91久久人澡人人添人人爽乱,青苹果乐园影视免费观看最新,中国公厕偷拍网站
06月02日,两岸青少年棒球赛场内外的情缘与情谊,把女仆🌸吊起来揉搓双乳手游,XNXX.COM丰满少妇,美女露出🐻让男生揉真人,贼王路飞女帝汉库克
06月02日|会晤结束 马克龙和冯德莱恩将习近平主席送至上车处|同性男男黄Gary片|人獸交XXXⅩ欧美一区三区|FucK丰满老阿婆HD人与|jlzzjlzz全部老妇女高潮
06月02日|教育强国,高校何为?重庆大学以“四重身份”解题 | 我与教育强国共成长 |掀开奶罩边躁狠狠躁软学生软件|香蕉影视app❤成人网址|赵露思被弄到高潮下不了床|禁漫画我熟mu老师全集
06月02日|我国造船三大指标国际市场份额首次全部超过50%|美女裸体㊙️无遮挡胸妖精网站|腿打开c爽死你高H|XXXX69HD老师学生|裸体小舞被❌吸乳羞羞在线
前7个月地方借钱超4万亿,陈若琳说全红婵大了要哄着了|石河子大学启动农田残膜污染治理项目|蜜桃㊙️av一区二区三区|情趣店老板调教学生h|女女百合gl漫画18㊙️|❤老师张开腿让我爽了一夜
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺