太阳成tyc7111cc·(中国)集团官方网站-Macau Bellwether
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

阿里发布最强开源模型Qwen 3,参数量仅为DeepSeek-R1的1_3

2025-05-05 13:10:23
来源:

猫眼电影

作者:

冯开升

手机查看

  猫眼电影记者 王金玉 报道w3u7903ejky2ywls

蓝鲸新闻4月30日讯(记者 武静静)赶在了五一节前,阿里巴巴开源新一代通义千问模型 Qwen3。据介绍,其参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,但性能表现不错。

报告显示,Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,超过了与DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等全球顶尖模型。成为了全球最强的开源模型。

通过模型架构的改进、训练数据的增加以及更有效的训练方法,Qwen3实现了模型体积更小情况下,性能表现也比更大参数规模的Qwen2.5基础模型要好。特别是在 STEM、编码和推理等领域,Qwen3 Dense 基础模型的表现甚至超过了更大规模的 Qwen2.5 模型。

博客中,阿里称,Qwen3 Dense 基础模型的整体性能与参数更多的Qwen2.5基础模型相当。例如,Qwen3-1.7B/4B/8B/14B/32B-Base 分别与 Qwen2.5-3B/7B/14B/32B/72B-Base 表现相当。

有意思的是,除了拥有235B参数的MoE模型外,Qwen 3还配备了一个小型MoE模型,即Qwen3-30B-A3B。该模型的激活参数量为3B,不及QwQ-32B模型的10%,然而其性能却更为出色。

我们可以把MoE架构理解为一个大型的客服中心,其中有许多专门处理不同问题的专家——有的专家专门处理技术问题,有的专家处理账单查询,还有的专家负责解答产品使用问题。在大模型训练过程中,当数据进入模型中后,大模型会像"客服中心"一样,根据问题的性质被分配给最合适的专家来解决,可以提高查询的计算效率。

此次,阿里开的源模型有Dense模型,也有MoE模型。其中,开源了两个 MoE 模型的权重:Qwen3-235B-A22B,一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型,以及Qwen3-30B-A3B,一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。

六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和 Qwen3-0.6B,均在 Apache 2.0 许可下开源。可以直接商用。

Qwen 3系列的其中一个创新点在于其"混合型"模型设计,可以在深度思考这种慢思考模式(用于复杂的逻辑推理、数学和编码)和快思考模式(用于高效、通用的聊天) 之间的无缝切换 ,确保在各种场景下实现最佳性能。

这意味着,用户终于不需要手动操作开启并关闭"深度思考"功能,且担心模型过度思考的问题了,此前,很多大模型用户反馈称,大模型动不动就深度思考输出长篇大论,很多小问题也如此完全没必要。

关键在于,这种快慢思考灵活切换的模式能有效的降低成本,阿里在博客中称:这两种模式的结合大大增强了模型实现稳定且高效的"思考预算"控制能力。这样的设计让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

在部署方面,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。这意味着相比相比满血版deepseek R1,部署成本大降75%~65%。

阿里介绍称,Qwen3经过了四阶段的训练流程,相当于,先教基础→再练深度思考→混合快慢模式→最后全面优化。阿里表示,Qwen3在工具调用、指令执行和数据格式处理方面表现优秀。建议搭配Qwen-Agent使用,它能简化工具调用的代码实现。

此次,阿里还专门优化了Qwen3 模型的 Agent 和 代码能力,同时也加强了对 MCP 的支持。在示例中看到, Qwen3 可以丝滑的调用工具。

开源正在成为阿里核心的AI战略,从2023年起,阿里通义团队就陆续开发了覆盖0.5B、1.5B、3B、7B、14B、32B、72B、110B等参数的200多款「全尺寸」大模型。

在此前的一次采访中,通义相关负责人曾告诉蓝鲸新闻,"开源不是目的而是结果。只有做出真正有竞争力的产品,开源才有意义。这倒逼我们必须做到两点:一是模型性能要达到全球SOTA水平,二是要能媲美甚至超越闭源模型。"

 时事1:麻麻扒开让我❌了一夜视频

  05月05日,金龙贺岁战鼓迎春 山西太原1400余人同台竞技敲响奋进鼓,

  出台了《乌海市建设工程施工招标、开标、定标规则》(试行),规范了建设工程招投标。全年共有项工程进场交易,交易额亿元,招投标率%。推行了招投标代理制度,有项工程实行了代理招标。严格履行建设工程法定程序,全面推行工程项目报建、建设工程施工许可两项制度,共办理建设工程项目报建项,工程规模万平方米,办理施工许可项,工程规模万平方米。推行了建设工程现场关键岗位人员押证施工制度,全市个工程的施工项目在押各类证书个,保证了工程建设依法实施。认真落实施工图审查备案和竣工验收制度,全年共有项工程进行备案审查,出具施工图审查件。对项建设工程进行了竣工验收,竣工面积万平方米。整顿和规范建筑市场,建立健全了工程质量监管责任制和建筑安全生产责任制,确保了建筑工程质量和安全生产,全年未发生建筑工程重大安全生产事故。落实职工意外伤害保险和农民工工资制度,继续加大拖欠工程款和农民工工资的清欠力度,维护建筑市场的良好秩序。

,喷水直播。

  05月05日,黄埔“廖氏三兄弟”后人:父辈保家卫国 坚定信仰不做亡国奴,

  坐骑也被乱石砸死了不少,还剩下三四十头,正好用来搬运祭灵那四分五裂的庞大躯体,这可是宝贝,不能丢在这里。

,伊蕾娜被各种姿势c到哭的小说,把校花🌸吊起来打屁股,欧美❌❌❌18免费视频。

 时事2:我要操逼

  05月05日,增开客列524列 “五一”假期太铁旅客发送量连创历史新高,

  这里除却仆人外,共有四名特殊的老人,都是当年曾经威名赫赫的人物,辈分极高,只是犯下了大过,被发配到了这蛮荒苦地。

,13学生小毛片自慰,少女初婚真人版免费,男生自慰时把精子喷在我脚上。

  05月05日,【风起黄埔】黄埔二十二期彭永:黄埔军校属于中华民族,

  最后,祝同学们中秋节快乐,希望大家都能过个安全、文明、快乐的节日。

,穿越火线晴雅被❌视频网站,国产美女无套✅动漫,白丝美女裸身㊙️免费网站。

 时事3:少妇和黑人做❤️

  05月05日,广西:平陆运河各项建设进展顺利,

  几人激战,宝术冲霄,十方俱颤,这里光芒盛烈,石子陵如一尊金色的天神,在四大高手的围攻下,纵横冲击,竟占据了上风!

,男能GAY无套✅猛男视频网站X推,原神刻晴被哭还一直流东西,あねちじょ♥无修在线观看。

  05月05日,菲律宾发生海上撞船事故 4名中国游客受伤,

  另几头独角马上,分别端坐着两个少年和一名少女,以及一个男童与两名女童,看起来聪慧灵敏,个个长相漂亮可爱。

,偷拍OOOO,男公厕撒尿XXXvideos,无尽❌裸体❌网站蜜桃。

 时事4:成人福利视频㊙️导航大全

  05月05日,南京高温“卷土重来” 滑冰场里觅清凉,

  昔日,它一直在夜间散发祥和的光晕,守护村子,从来没有主动外出攻击过谁,今日竟破例了。

,国产裸体老师无遮挡免费,成人扒开🍑伸进🍌❌电,樱岛麻衣被❌视频。

  05月05日,新业态、新模式、新活力 乡村与青年“双向奔赴”赋能乡村新经济,

  “别吓到孩子。”美丽女子说道。

,胸大美女,男男GaYGAYS✅男同肌肉,宿傩灌满jing液Hb文。

责编:徐大妈

审核:于家臣

责编:安路琴

相关推荐 换一换