太阳成tyc7111cc·(中国)集团官方网站-Macau Bellwether
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

DeepSeek R1幻觉率降低,用户喊话:想要R2

2025-06-04 12:33:46
来源:

猫眼电影

作者:

乐蒂

手机查看

  猫眼电影记者 蔡塘 报道w3u7903ejky2ywls

2025.05.29

本文字数:1440,阅读时长大约2分钟

导读:报告显示此前 R1模型幻觉率在21%左右。

作者 |第一财经 刘晓洁

在开源平台HuggingFace上发布R1模型的更新后,5月29日晚,DeepSeek终于发布了官方公告介绍这次版本的具体能力迭代细节,其中包括深度思考能力强化、幻觉改善和创意写作更好等。

在测评数据上,官方表示,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。

值得一提的是,DeepSeek提到,新版DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45%-50% 左右,能够提供更为准确可靠的结果。

所谓幻觉即大模型的“胡说八道”,此前DeepSeek的幻觉率并不低,也被不少用户和开发者所讨论。5月15日,SuperCLUE曾发布最新一轮中文大模型忠实性幻觉测评结果,显示此前的DeepSeek-R1模型幻觉率在21%左右,在测评的国内模型中排名第五。

据SuperCLUE,推理模型的幻觉比非推理模型更显著,在他们的测评中推理模型的平均幻觉率为22.95%,非推理模型的平均幻觉率为13.52%。

除了幻觉方面的改善,官方介绍,新R1模型在复杂推理任务中的表现有了显著提升。例如在 AIME 2025 测试(一个数学基准测试,用于模型在数学推理方面的能力)中,新版模型准确率由旧版的70%提升至87.5%。

此外,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

在官方发文之前,众多测试表明R1新模型的代码能力有显著提升,在代码测试平台Live CodeBench中,其性能几乎媲美OpenAI重量级的o3-high模型。官方此次公告也提到,在前端代码生成、角色扮演等领域,模型的能力确实均有更新和提升。

在迭代路径上,DeepSeek表示,DeepSeek-R1-0528 仍然使用 2024 年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。

本次R1新模型参数为 685B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。同时,与旧版本的R1保持一致,此次开源模型权重仍然统一采用 MIT License,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

有趣的是,在X平台DeepSeek的官方评论区中,讨论的话题全都关于R2模型,“We want R2(我们想要R2模型)”,有用户评论称。业界对DeepSeek下一代的模型期待已久。

基于DeepSeek刚刚发布了更新,有用户猜测,“是否意味着我们暂时不会听到有关R2的消息?”也有用户调侃称,这一模型或许在开发中应该是R2,但是当他们发现在基准测试中没有超越OpenAI的o3 时,DeepSeek将其重新命名为R1的更新。

一向低调的DeepSeek并未对外界的猜测进行任何回应,基于R1是在V3模型的基础上训练的,或许我们会先等到V4模型的更新。无论如何,海内外大模型领域的基座模型大战还在继续,DeepSeek之后,谁会是下一家?

海外网友制作的梗图,对当前大模型领域的密集更新进行调侃

微信编辑| 苏小

 时事1:周于希被摄影师捏奶头

  06月04日,时政快讯丨习近平将同法国总统和欧盟委员会主席举行中法欧领导人三方会晤,

  另一边,他的妻子带着忧容,抱着虚弱的小不点,美丽的面庞上很久不曾出现过笑容了。

,透明内裤被🐔巴捣出白浆小说。

  06月04日,画框中的二十四节气——大雪,

  这太震撼了,一条柳枝,截断天地,斩杀群雄,让人颤栗。

,免费涩涩18网站入口,男同❌裸乳❌动漫❌,浪货今天就把你🌿到服为止的。

 时事2:兽人免费cg解锁版下载

  06月04日,上海、呼和浩特免费送交通卡?河南的冬天会下暴雨?这些谣言请勿相信!,

  为了提高这次培训班实效,我们特别邀请了自治区有关专家、教授给大家授课,希望大家认真学习,深入思考,总结经验,形成共识,真正使这次学习培训学有所思,学有所获,学有所得。

,小心🐤入🍑🍑视频无广直看,女同性互慰一级A片,学生的下面隐私㊙️图片。

  06月04日,“绿化将军”张连印逝世 回乡20载种树200多万株,  陈政高于1970年担任辽宁省海城县革委会政工组办事员;1978年任大连海运学院团委书记;1982年任辽宁省大连团市委常委、学校部部长;1985年任辽宁省大连市长海县副县长;1988年任辽宁省大连市西岗区委常委、副区长(主持工作);1993年任辽宁省大连市副市长;1997年任辽宁省省长助理;1998年任辽宁省副省长;2003年任辽宁省沈阳市委副书记、市长;2008年任辽宁省委副书记、省长。,极品粉嫩小泬XXXXHD,女女蕾丝互慰吃奶高潮,多强被❌c到爽🔞H免费。

 时事3:www.教师被爆❌羞羞视视频动漫

  06月04日,(经济观察)2023年中国经济现五大亮点,

  玉羊辞岁,金猴报春。值此20xx年新春佳节即将来临之际,我谨代表六安农商银行党委、行领导班子,向一直以来关心、帮助、支持我行改革发展的各级领导、广大股东、客户和社会各界朋友表示衷心的感谢,向全行全体员工致以节日的问候!

,91㊙️片黄在线观看喷潮,男男顶撞喘男男做爰黄微博,老婆~才一根手指就受不了了作文。

  06月04日,新华社权威速览|推动落实全球安全倡议,习近平主席这样说,

  他们十分震惊,心中担忧。

,宁荣荣被挤奶羞羞动漫,莫妮卡贝鲁奇无删减版的导演是谁,国产又爽❌又黄❌免费鸣人樱桃。

 时事4:动漫美女被触手❌到爽

  06月04日,云南富源县黄泥河镇中心学校党总支书记、校长李飞被查,

  族人闻听,全都哈哈大笑。

,芙宁娜被爆❌自慰流水,闺蜜gm065最新版本更新内容分享,艾伦三笠同人本子211。

  06月04日,走进“土楼王国”——福建南靖,

  三只幼鸟挤进人群,鳞甲发光,扑棱着翅膀,大眼都很有神,仿佛要张口说话一般。它们的力气非常大,一群孩子都被挤到了一旁。

,免费➕无码➕国产49在线,仓井空,㊙️流水18狂🌿🈲视频。

责编:田承忠

审核:罗什福尔

责编:林佑春

相关推荐 换一换