作者 | summer邮箱 | huangxiaoyi@pingwest.com
在所有人都在猜测DeepSeek V4或者R2和Qwen3谁先到来时,Qwen3发布了。
4月29日凌晨,阿里巴巴开源了新一代通义千问Qwen3系列模型,涵盖8款不同尺寸。其中,旗舰模型Qwen3 235B采用混合专家(MoE)架构,总参数量235B(仅为DeepSeek-R1的1/3),激活参数仅需22B,预训练数据量达36万亿Tokens。
性能上,据官方介绍,Qwen3在多项测评中表现优异,超越DeepSeek-R1、OpenAI-o1等主流模型,成为当前性能领先的开源大语言模型。
具体来看,Qwen3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强:在奥数水平的AIME25测评中,Qwen3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,Qwen3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。
看惯了模型榜单表现上的反复超越,但这次的Qwen3还有些不同,比起单纯的模型边界突破,Qwen3更想突出的是以小博大的能力。而且它在和DeepSeek轮流推动开源模型进步的过程中,再次给开源社区提供了与R1不同的配方。
1
没完全用R1的方法,但完成了对R1的超越
和R1类似的是,Qwen3也走的是“用模型训模型”的思路。
在预训练阶段,Qwen3的性能优化很重要的一个来源是大量高质的合成数据。
数量上看,Qwen3的数据集相比Qwen2.5有了显著扩展。Qwen2.5是在 18 万亿个 token 上进行预训练的,而 Qwen3 使用的数据量几乎是其两倍,达到了约 36 万亿个 token,涵盖了 119 种语言和方言。其中一部分来自于PDF文档提取信息,另一部分就是Qwen2.5系列模型合成的数据。
技术报告中明确提到,“我们使用 Qwen2.5-VL 从这些文档中提取文本,并用 Qwen2.5 改进提取内容的质量。为了增加数学和代码数据的数量,我们利用 Qwen2.5-Math 和 Qwen2.5-Coder 这两个数学和代码领域的专家模型合成数据,合成了包括教科书、问答对以及代码片段等多种形式的数据。”
这也意味着,在预训练的过程中,Qwen3借助自身的生态优势,又构建了一个自我迭代提升的数据系统。
预训练奠定了Qwen3的基础能力,而在此基础上的后训练阶段则是Qwen3最为关键的技术创新,它通过多阶段训练方法实现了推理能力与直接回答能力的融合。
以上图为例,同一模型内实现了思考和非思考模式。在官方的应用界面来看,选择哪种模式的方法看起来还是让用户自己选择,不过在选择了深度思考模式后,用户多了一个设置思考预算的功能,让模型根据问题难度动态分配。
在后训练上,Qwen3用了和R1整体pipeline类似的的“回锅肉”式迭代:微调、RL、再微调,然后再更具体的RL。
它和DeepSeek一样用大模型蒸馏小模型,不过Qwen彻底是自己蒸馏自己了。
另一个特别值得注意的是,第二阶段RL,Qwen团队采用的是基于规则的奖励来增强模型的探索和钻研能力。
“第二阶段的重点是大规模强化学习,利用基于规则的奖励来增强模型的探索和钻研能力。”官方博客写到。这与当前被认为是DeepSeek R1等模型成功关键的GRPO(基于结果奖励的优化)形成鲜明对比。Qwen3没有完全依赖GRPO这样基于结果的奖励机制。
紧接着,在第三阶段的微调中,Qwen3采用了一份长思维链数据和常用的指令微调数据的组合数据上对模型进行微调,实现了将非思考模式整合到思考模型中,确保了推理和快速响应能力的无缝结合。
最后,在第四阶段,Qwen3在包括指令遵循、格式遵循和 Agent 能力等在内的 20 多个通用领域的任务上应用了强化学习。
Qwen3没有完全用R1的方法,但完成了对R1的超越。
1
模型全尺寸,但参数正在“变小”
和Qwen此前的生态路线一样,Qwen3一口气发布了8款不同的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斩获同尺寸开源模型SOTA(最佳性能)。
这次的全尺寸,果然没有让期待已久的社区失望,欢呼声一片。
MLX 是专为 Apple Silicon设计的高效机器学习框架。在模型发布前,MLX的团队就完成了对Qwen 3的支持工作。其中0.6B和4B可以应用于手机,8B、30B、30B MOE可用于电脑......
尺寸全是一方面。更重要的是Qwen在不断以更多、更小的尺寸,达到过去更大尺寸同样的性能效果。在很多场景下,模型都具备了在端侧运行的能力和水平。
据官方博客显示,Qwen3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,仅激活3B就能媲美上代Qwen2.5-32B模型性能;Qwen3的稠密模型性能继续突破,一半的参数量可实现同样的高性能,如32B版本的Qwen3模型可跨级超越Qwen2.5-72B性能。
Qwen3显然是个能让开源界好好把玩和拆解一段时间的最热门模型,接下来它更全面的技术报告发布后,估计会揭秘更多“独家配方”,继续推动开源模型的进步和创新。
点个 “爱心”,再走吧
《纲手裸乳被爆❌白浆AGG》,《w3u7903ejky2ywls》91丨PORNY丨蝌蚪熟
“AI虚拟女友色情版”
逍遥阁免费网页在线观看
……
05月05日
“丰满大肥奶肥婆BBBwww”传统文化引领文旅消费新潮
↓↓↓
05月05日,(经济观察)“中国蔬菜之乡”山东寿光“播绿”全球,小医仙⋯啊⋯嗯~出奶了,小舞脱👙给同学揉🐻,中国无码🍑老师好爽,国产九色91💃💃回来了
05月05日,中国多所高校刊文缅怀李政道,XXXxX性女HD性爽,兔朱迪大屁股喷水在线观看,女女❌互慰吃奶互揉视频,李映梅陈玉娟全部小说更新时间
05月05日,时政Vlog丨龙狮双舞 欢迎习近平主席到访巴黎,小乔被c黄秘动漫,汤姆维的莫妮卡,总裁的妖精小秘H顾,日本少妇一级婬片A片秀色
05月05日|国足、国奥、国青、国少各有各的忙 中国男足今年四线出击|含羞草是清清爽爽的|动漫㊙️黄二次元漫画|两男一女双龙3p吸乳|学生被❎免费网站
05月05日|蓝花楹绽放昆明 紫色浪漫如梦似幻|张婉莹手笔自愈视频大全观看|17c.14一起槽|脱👙让学生C🐻文|皮鞭调教校花翘臀抽打
05月05日|陕西:以检察履职支撑特殊群体权益保护|骑马羞意在线阅读小说全文|无尽裸体白丝拔萝卜|久久成人99一区二区黄漫软件|西施裸体被❌到爽……
05月05日,浙港青年企业家聚首甬城 凝聚力量共话合作新机遇,18🈲入口内裤湿透,男生把小困困进女生困里视频,快手困困全程58秒的视频,体育小鲜肉Gay自慰飞机杯蓝音
05月05日,中央财政创新方法支持部分城市开展城市更新示范工作,Naruto❌Sakura雏田爆乳,小舞的胸被❌出奶水视频,附近学生24小时服务内容,午夜国产精品秘入口竹菊
05月05日|台青在桂探索咖啡新业态 盼呈现更多在地文化|韩国19🈲色情综艺天体野营|不知火舞本子在线观看|触手怪❌进胡桃尿孔里小说|五星视频58星币入口网站
05月05日,锚定现代化 改革再深化丨浙江临海:一块豆腐,折射共富工坊建设新未来,欧美男男18🈲🌿出水,freebdsm柔奴bdsmtvpee手铐,男生㊙️jiji高清图片,男男GAY无套✅免费视频欧美
05月05日,2023年江西工业领域投资亿元以上项目完工投产千余个,美女裸体㊙️无遮走秀,亲嘴片段大全没有衣服,黑瞎子揉我下面啊嗯,男男被触手疯狂入侵♂
05月05日,飑线袭广州 全城暴雨持续,挠美女隐私㊙️部vk,朴彩英ins照片擦边,女性特级XXXⅩ裸体,av➕无码➕高潮➕网站
05月05日|国家铁路局:10月全国铁路旅客发送量同比增长6.0%|女同学被❌到爽自慰网站|蘑菇🍄福利视频一区播放|啊美女玩男人的奶头|鸣人❌小南18禁同人本
05月05日|全球粮食安全专家警告:加沙地带北部可能面临饥荒|赵露思AV婬乱一级A片|触手狂い女の乳を揉んで舐め|亚洲人做受高潮软件手机号|公车上拨开少妇内裤进入青少年号
05月05日|冀鲁豫皖苏等地雾气弥漫 弱冷空气将影响北方地区|188427路moom|雷电将军❌暴爽自慰喷水|男男做爱马眼棒网站视频|揉⋯啊⋯嗯~出水虞书欣
恋与深空登顶送十连,女子高速倒车加超速求民警留1分|韩国国会通过“解除戒严”决议 中新社记者现场直击|国产精品被熟女|帅男浴室自慰chinases|王强把刘若琳弄高潮了|麦晓雯被c到高潮
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺