太阳成tyc7111cc·(中国)集团官方网站-Macau Bellwether
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

阿里发布最强开源模型Qwen 3,参数量仅为DeepSeek-R1的1_3

2025-05-02 20:15:10
来源:

猫眼电影

作者:

刘晓庆

手机查看

  猫眼电影记者 章子怡 报道w3u7903ejky2ywls

蓝鲸新闻4月30日讯(记者 武静静)赶在了五一节前,阿里巴巴开源新一代通义千问模型 Qwen3。据介绍,其参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,但性能表现不错。

报告显示,Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,超过了与DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等全球顶尖模型。成为了全球最强的开源模型。

通过模型架构的改进、训练数据的增加以及更有效的训练方法,Qwen3实现了模型体积更小情况下,性能表现也比更大参数规模的Qwen2.5基础模型要好。特别是在 STEM、编码和推理等领域,Qwen3 Dense 基础模型的表现甚至超过了更大规模的 Qwen2.5 模型。

博客中,阿里称,Qwen3 Dense 基础模型的整体性能与参数更多的Qwen2.5基础模型相当。例如,Qwen3-1.7B/4B/8B/14B/32B-Base 分别与 Qwen2.5-3B/7B/14B/32B/72B-Base 表现相当。

有意思的是,除了拥有235B参数的MoE模型外,Qwen 3还配备了一个小型MoE模型,即Qwen3-30B-A3B。该模型的激活参数量为3B,不及QwQ-32B模型的10%,然而其性能却更为出色。

我们可以把MoE架构理解为一个大型的客服中心,其中有许多专门处理不同问题的专家——有的专家专门处理技术问题,有的专家处理账单查询,还有的专家负责解答产品使用问题。在大模型训练过程中,当数据进入模型中后,大模型会像"客服中心"一样,根据问题的性质被分配给最合适的专家来解决,可以提高查询的计算效率。

此次,阿里开的源模型有Dense模型,也有MoE模型。其中,开源了两个 MoE 模型的权重:Qwen3-235B-A22B,一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型,以及Qwen3-30B-A3B,一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。

六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和 Qwen3-0.6B,均在 Apache 2.0 许可下开源。可以直接商用。

Qwen 3系列的其中一个创新点在于其"混合型"模型设计,可以在深度思考这种慢思考模式(用于复杂的逻辑推理、数学和编码)和快思考模式(用于高效、通用的聊天) 之间的无缝切换 ,确保在各种场景下实现最佳性能。

这意味着,用户终于不需要手动操作开启并关闭"深度思考"功能,且担心模型过度思考的问题了,此前,很多大模型用户反馈称,大模型动不动就深度思考输出长篇大论,很多小问题也如此完全没必要。

关键在于,这种快慢思考灵活切换的模式能有效的降低成本,阿里在博客中称:这两种模式的结合大大增强了模型实现稳定且高效的"思考预算"控制能力。这样的设计让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

在部署方面,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。这意味着相比相比满血版deepseek R1,部署成本大降75%~65%。

阿里介绍称,Qwen3经过了四阶段的训练流程,相当于,先教基础→再练深度思考→混合快慢模式→最后全面优化。阿里表示,Qwen3在工具调用、指令执行和数据格式处理方面表现优秀。建议搭配Qwen-Agent使用,它能简化工具调用的代码实现。

此次,阿里还专门优化了Qwen3 模型的 Agent 和 代码能力,同时也加强了对 MCP 的支持。在示例中看到, Qwen3 可以丝滑的调用工具。

开源正在成为阿里核心的AI战略,从2023年起,阿里通义团队就陆续开发了覆盖0.5B、1.5B、3B、7B、14B、32B、72B、110B等参数的200多款「全尺寸」大模型。

在此前的一次采访中,通义相关负责人曾告诉蓝鲸新闻,"开源不是目的而是结果。只有做出真正有竞争力的产品,开源才有意义。这倒逼我们必须做到两点:一是模型性能要达到全球SOTA水平,二是要能媲美甚至超越闭源模型。"

 时事1:亚洲娇小wite黑人粗大

  05月02日,国家统计局:造假是统计领域最大腐败,

  很快,他来到了距离石村一里远的地方,与那祭灵站在一座山峰上,盯着石村。

,欧美❌❌❌18免费视频。

  05月02日,五部门:逐步建立农房安全定期体检制度,

  村人都一怔,显然柳神对小不点另眼相看,为了他竟说了这么多的话,比过去数十年加起来都要多。

,大雷擦狙狙视频免费,乖让我尿到里面h男女羞羞视频,妲己被❌到爽妲己羞羞av小说。

 时事2:火影忍者同人片子免费

  05月02日,黄河壶口瀑布:冰瀑与彩虹“同框” ,

  这场仪式持续了很久才结束。

,鞠婧祎mv造梦大全视频免费观看,同性Gay❌❌❌免费,单k互k录音mp3视频。

  05月02日,(财经天下)美联储生变,年内降息何时来?,

  “这次我不会放过你!”在这一天的时间里,小不点经历了很多的事情,眼神迫人,攥紧小拳头,语气坚决而果断。

,小兰被❌超污网站免费,裸体折磨丨vk,男女啪啪久久爽A片免费看网站。

 时事3:女同互慰AV网站

  05月02日,英雄从未远去,我们不曾忘记!王伟墓前有了歼-35A战斗机模型,

  市、县(市)区档案部门狠抓八项工程建设,推动档案事业规范、有序的正常开展。本着加强领导、统筹安排、突出重点、分类指导的原则,积极开展标准验收工作。全市共有324家单位,实现了转星和申星,家庭建档7000余户。

,天上人间裸体模特表演,免费高清🔞❌♋性巴克,性XXXXXZZZZZBBBBB。

  05月02日,李鸿忠出席中国-葡语国家经贸合作论坛(澳门)第六届部长级会议开幕式,

  “那孩子真是个人才,不,是天纵奇才,他在修行一途上更是潜力无尽。”海大叔感叹。

,小鲜肉无套✅免费网站,唐三喝朱竹清的乳液,mm131妲己被❌喷水视频。

 时事4:班长张开腿让我❌了一节课软件

  05月02日,南水北调进京水量达百亿立方米 北京地下水位连年回升,

  校安办

,雷神同人18❌AV污在线观看,男女被❌到爽🔞流尿免费视频,老师腿开大点我添添公视频。

  05月02日,加强保护,使文物焕发新生,

  我来同心的时间尽管还较短,在跑遍全县的村社后,感觉到我们同心农村自然条件尽管差,农村经济发展整体水平还很落后,但发展的空间还是比较大的,抢抓的机遇也比较多,特别是培育的一些致富典型很有特色,近几年,我县在遭受持续旱灾的情况下,农民生活稳定,社会安定,农村经济社会有了一定发展,我本人很受启发,这是包括在座的各位和全县干部群众共同努力的结果,借此机会我代表县委、政府对大家的辛勤工作表示衷心感谢!

,小鲜肉gary2023男的音乐表,八重神子被吸乳羞羞动漫,日本裸体全身㊙️无遮挡。

责编:武曲星

审核:徐国荣

责编:蓝莲花

相关推荐 换一换