太阳成tyc7111cc·(中国)集团官方网站-Macau Bellwether
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

阿里发布最强开源模型Qwen 3,参数量仅为DeepSeek-R1的1_3

2025-05-11 12:07:04
来源:

猫眼电影

作者:

谭永

手机查看

  猫眼电影记者 欧阳慧 报道w3u7903ejky2ywls

蓝鲸新闻4月30日讯(记者 武静静)赶在了五一节前,阿里巴巴开源新一代通义千问模型 Qwen3。据介绍,其参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,但性能表现不错。

报告显示,Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,超过了与DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等全球顶尖模型。成为了全球最强的开源模型。

通过模型架构的改进、训练数据的增加以及更有效的训练方法,Qwen3实现了模型体积更小情况下,性能表现也比更大参数规模的Qwen2.5基础模型要好。特别是在 STEM、编码和推理等领域,Qwen3 Dense 基础模型的表现甚至超过了更大规模的 Qwen2.5 模型。

博客中,阿里称,Qwen3 Dense 基础模型的整体性能与参数更多的Qwen2.5基础模型相当。例如,Qwen3-1.7B/4B/8B/14B/32B-Base 分别与 Qwen2.5-3B/7B/14B/32B/72B-Base 表现相当。

有意思的是,除了拥有235B参数的MoE模型外,Qwen 3还配备了一个小型MoE模型,即Qwen3-30B-A3B。该模型的激活参数量为3B,不及QwQ-32B模型的10%,然而其性能却更为出色。

我们可以把MoE架构理解为一个大型的客服中心,其中有许多专门处理不同问题的专家——有的专家专门处理技术问题,有的专家处理账单查询,还有的专家负责解答产品使用问题。在大模型训练过程中,当数据进入模型中后,大模型会像"客服中心"一样,根据问题的性质被分配给最合适的专家来解决,可以提高查询的计算效率。

此次,阿里开的源模型有Dense模型,也有MoE模型。其中,开源了两个 MoE 模型的权重:Qwen3-235B-A22B,一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型,以及Qwen3-30B-A3B,一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。

六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和 Qwen3-0.6B,均在 Apache 2.0 许可下开源。可以直接商用。

Qwen 3系列的其中一个创新点在于其"混合型"模型设计,可以在深度思考这种慢思考模式(用于复杂的逻辑推理、数学和编码)和快思考模式(用于高效、通用的聊天) 之间的无缝切换 ,确保在各种场景下实现最佳性能。

这意味着,用户终于不需要手动操作开启并关闭"深度思考"功能,且担心模型过度思考的问题了,此前,很多大模型用户反馈称,大模型动不动就深度思考输出长篇大论,很多小问题也如此完全没必要。

关键在于,这种快慢思考灵活切换的模式能有效的降低成本,阿里在博客中称:这两种模式的结合大大增强了模型实现稳定且高效的"思考预算"控制能力。这样的设计让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

在部署方面,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。这意味着相比相比满血版deepseek R1,部署成本大降75%~65%。

阿里介绍称,Qwen3经过了四阶段的训练流程,相当于,先教基础→再练深度思考→混合快慢模式→最后全面优化。阿里表示,Qwen3在工具调用、指令执行和数据格式处理方面表现优秀。建议搭配Qwen-Agent使用,它能简化工具调用的代码实现。

此次,阿里还专门优化了Qwen3 模型的 Agent 和 代码能力,同时也加强了对 MCP 的支持。在示例中看到, Qwen3 可以丝滑的调用工具。

开源正在成为阿里核心的AI战略,从2023年起,阿里通义团队就陆续开发了覆盖0.5B、1.5B、3B、7B、14B、32B、72B、110B等参数的200多款「全尺寸」大模型。

在此前的一次采访中,通义相关负责人曾告诉蓝鲸新闻,"开源不是目的而是结果。只有做出真正有竞争力的产品,开源才有意义。这倒逼我们必须做到两点:一是模型性能要达到全球SOTA水平,二是要能媲美甚至超越闭源模型。"

 时事1:美女走光整个奶头露出来

  05月11日,福建连城客家青狮舞动“狮城”,

  小不点吃惊,这是一个真正的大高手,超乎他的预料,原以为只有一头祭灵很恐怖,没有想到大首领亦这般非凡。

,男人的🍌伸到🍑里情趣阁动漫。

  05月11日,山西中阳县一煤矿发生溃仓事故 5人遇难2人失联,

  金秋时节,秋高气爽,随着新一轮教育综合改革的不断深入,我们在这里如期举行了低段教研网络和高段教研网络活动,通过教研网络活动涌现出一大批年轻优秀教师,再次激发了广大教师教书育人的激情和活力。借此机会,我向长期以来站在教育第一线的老师道一声“你们辛苦了”;向一直以来为永兴乡小学教育事业的发展付出心血和取得实绩的你们表示衷心的感谢!向今天受表彰的人员表示热烈的祝贺!本次大会的主要任务是:认清形势、统一思想、抢抓机遇,再创永兴小学教育新局面。下面我主要讲两点意见:

,动漫男男裸体啪啪❌男同,r34chara 官网 1.9.8.5,斗破同人18❌AV黄网站。

 时事2:14岁女生用手多了会不会不孕不育

  05月11日,时隔两年半 南京海底世界“10后”北极熊西安“相亲”归来,

  最后,竟然又有三位王侯出现,浑身都散发璀璨光芒,如三轮太阳一般,恐怖波动惊世,一起步入了金色的通道中。

,美女➕光屁屁➕韩国18,偷看妇女的大B真实的,浪货三根都满足不了你。

  05月11日,中新教育|与中学携手共进 同济大学稳步推进“国优计划”项目实施,

  “我们这是到了哪里?距离村落多半有六七百里了吧。咦,山那边有炊烟。”二猛指向前方。

,美杜莎自己扒开屁股让男人桶,蓬莱仙山脸红心舒淇早,韩漫无羞遮无删减H漫画。

 时事3:用丝袜怎么导精

  05月11日,大陆高校师生参访台湾长庚大学 体验台湾夜市特色活动“打气球”,

  熟睡中的小婴儿睁开了纯净的大眼,不明所以。

,性生交大片免费看黄牛党,儿玉玲奈,初学生疯狂❌喷水自慰影视。

  05月11日,事关3亿人!国家首次发布,回应重要需求!,

  三、严肃干事创业的作风和纪律

,㊙️蜜桃视频在线,欧美性做爰又大又粗又长,日联美女裸体㊙️免費观看直播。

 时事4:女仆扒开腿㊙️让男人玩

  05月11日,四川省甘孜州政协原党组书记、主席雷建平被开除党籍和公职,

  “我是去破纪录,全部推倒重来。”小不点小声道,对他们的话语很不满,真性情流露。

,好爽好紧宝贝坐上来视频,免费无遮挡🔞使劲往前在线观看,电影来5566黑夜免费播放最新章节。

  05月11日,宁波制造受RCEP市场青睐 三项指标创同期新高,

  一是强化安全意识,紧抓安全工作不放松。每月进行了安全隐患排查,发现问题及时落实整改。购买了二十多个灭火器,实现了教学楼、综合楼、寝室的每层楼及重要部位都配备了灭火器。中心小学安装了一键式报警器,购买了警棍、钢钗及警服,严格了门卫制度。

,伦理片6808,120分钟做爰视频,亚洲GV白嫩小受18cm。

责编:邢光银

审核:杰米·钟

责编:顾嘉棠

相关推荐 换一换