太阳成tyc7111cc·(中国)集团官方网站-Macau Bellwether
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

登顶开源大模型榜首 阿里Qwen3成色如何?_聚焦

2025-05-10 23:47:01
来源:

猫眼电影

作者:

苏永康

手机查看

  猫眼电影记者 赵海燕 报道w3u7903ejky2ywls

《科创板日报》5月1日讯(记者 黄心怡)阿里巴巴在“五一”节前开源新一代通义千问模型Qwen3,而且一口气开源了 8 个版本。

阿里千问大模型官网用“思深,行速”来描述Qwen3,是指Qwen3 是中国公司推出的首个混合推理模型,在同一个模型中融合了 “推理” 和 “非推理” 模式,可以根据不同问题选择 “快、慢思考”。

最新数据显示,阿里Qwen 系列大模型已被累计下载 3 亿次,基于 Qwen 的衍生模型数量超 10 万个,为全球第一。Qwen3 发布也引来众多开发者的使用和测评。

Qwen3 提供了不同参数的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。阿里方面称,千问3的30B参数MoE模型仅激活3B就能达到上代Qwen2.5-32B模型性能,而千问3的稠密模型比如32B版本的千问3模型,可超越上一代Qwen2.5-72B性能。

多名开发者告诉《科创板日报》记者,此次发布的千问3系列中的小参数量模型表现突出。“32B模型表现突出,小参数量跑出了优秀的效果,对大模型应用研发人员或公司来说是福利。毕竟大参数量还是成本太高。目前来看32B性价比最高,235B感觉相比千问2.5提升不太大,而32B能跑出目前效果确实很不错了。”

有业内人士推测,千问3选择在小参数模型发力,主要是为了苹果生态而准备。此前,阿里董事局主席蔡崇信确认了回应阿里与苹果在手机上合作落地AI的传闻。而今年4月的最新消息称,苹果果正积极推进在国行版iPhone上引入AI功能的计划,并计划于2025年中期前登陆国行iPhone。

▍并非全面碾压DeepSeek R1

尽管Qwen3发布后,有媒体报道其性能全面碾压同样开源的DeepSeek R1 。但《科创板日报》记者注意到,每家大模型公司在公布自己大模型的测评数据时,可能用的都是不同的指标,或者只公布自己得分高的测评测试。因此,比较公立的第三方测评比较有说服力。

著名华裔AI学者吴恩达的公司Artificial Analysis对包括Qwen3和DeepSeek R1在内的大模型测试显示,Qwen3只是在某些指标上超越DeepSeek R1,并非全面碾压。

在“GPQA 钻石:博士级多学科”项目测试中,Qwen3 235B测试结果70分,和 DeepSeek R1 的 71分 成绩接近;在“LiveCodeBench:编码能力”项目测试中,Qwen3 235B测试结果:71分,高于 DeepSeek R1 的 62分 成绩;在“MATH-500:高难度数学”项目测试中, Qwen3 235B测试结果93分,低于 DeepSeek R1 的 97分成绩; 在“MMLU:通用知识基准” Qwen3 235B测试结果83分,接近 DeepSeek R1 的 84分成绩;在“AIME2024:数学推理中等挑战,泛化能力参考”项目测试中,Qwen3 235B测试结果84分,高于 DeepSeek R1 的 68分成绩。

因此,业内普遍的看法是,总体看Qwen3推理模型整体表现略好于R1,但相比R1也不算有太大突破,还称不上“全面碾压”。

▍小参数模型远超预期

另一名开发者告诉《科创板日本》记者,此次千问3系列的超大参数模型不及预期,但小参数的模型远超预期。“4B模型在数学能力上属实惊到我了。”

小参数量模型的特点是能够主要用于端侧部署,比如4B模型可用于手机端,8B可在电脑和汽车端侧,32B可用于企业大规模部署,也适合有条件的开发者上手。

开放传神(OpenCSG)联合创始人陈冉认为,通义大模型的出现充分验证大模型领域金律“模型天天变,不变的是数据沉淀“,也再次证明开源是技术创新的压箱石。技术上,还在继续努力推进,目标还是降本增效,种类齐全,但核心创新点还有待观察。

《科创板日报》记者注意到,在千问3发布后,上下游供应链第一时间进行适配和调用。英伟达、英特尔、联发科、AMD等多家头部芯片厂商纷纷适配千问3。

《科创板日报》记者从英特尔方面获悉,英特尔在车端舱内对新发布的千问3系列模型,也已经完成匹配。国产芯片厂商海光信息则宣布其DCU完成对Qwen3全部8款模型的适配+调优,覆盖235B、32B、30B、14B、8B、4B、1.7B、0.6B各种参数。

随着算力成本的降低和性能的提升,业内分析普遍认为,千问3为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。阿里云智能集团副总裁霍嘉在接受《科创板日报》采访时表示,“模型推理模型能力不断提高,使得当前在业内有共识,今年会是 AI应用爆发的真正元年。

▍通用Agent在工程和技术两个方面仍面临挑战

华创证券在评价千问3大模型时称, Agent训练与落地成为了 AI+ 叙事的下一重心。天风证券认为,AI Agent市场规模有望超万亿,通义千问已发布多行业垂直生态体系,有望成为B端Agent链主。

《科创板日报》注意到,在第八届数字中国建设峰会期间,中国一汽正式发布企业智能体OpenMind。这是汽车行业首个面向全集团运营管理的AI Agent,正是基于阿里通义大模型打造。

此外,中国电信、蚂蚁集团等也纷纷发布了智能体相关平台,以加速AI Agent在政务、金融等领域落地:中国电信正式发布星辰行业Agent平台;蚂蚁数科则发布了面向金融机构发布智能体开发平台Agentar。

不过,通用Agent在工程和技术模型两个方面仍面临挑战。一名业内人士表示,“实际上能够处理通用或复杂任务的并不多。这些产品要么不够通用,要么无法应对复杂的任务。”

阿里云 CTO 和通义实验室负责人周靖人近日在接受媒体采访时透露, 今年在大模型领域,相对确定的进展是两个主线,一是模型能力上,会继续在类人思考和多模态上有提升;二是模型和底层云计算系统会更深度结合,能同时提升训练和推理效率,让模型更好用、更普及。

在谈及DeepSeek R1时,周靖人表示,DeepSeek看起来有算力、有 Infra 层、有模型,但不构成一个完整的云服务。"我们的一个核心认知是,大模型发展和云体系的支撑不可分割。”

谈及国外内大模型竞争对手的你追我赶,他认为,市场空间很大,欢迎一起来推动 AI 产业的发展。至于谁领先,他说:

“还是看市场反馈,把选择权留给客户。”

 时事1:被七个人绑着玩调教Sm

  05月10日,(乡村行·看振兴)新疆兵团:生态放牧助推畜牧业高质量发展 “赋能”乡村振兴,

  中国,是一个有着五千年悠久历史的国家,然而,却有一个问题一向在困扰着泱泱大国,那就是---环境污染。从古到今,环境污染无处不在,那么我们能为环保做些什么呢俗话说得好,解决问题需要从源头下手。

,娜美吃路飞棍子漫画在线观看。

  05月10日,“暖心”服务架起民生保障“连心桥” 实实在在成果提升百姓幸福感,

  增强大局意识,维护镇党委镇政府的权威,保证政令畅通,是一个很严肃的原则问题,是党性的集中表现。只要全镇上下同心协力,共同维护大局利益,就没有什么困难战胜不了。我们要求各村居的干部,在思想上、行动上,必须服从全镇一盘棋,正确处理好局部与整体的关系,自觉做到小局服从大局,不折不扣地执行镇党委、镇政府的出台的一系列文件精神,确保全镇政令畅通。讲大局,就必须把涂沟的事情办好,把各村居的事情办好。局部是大局不可分割的组成部分,局部的工作做好了,对大局就会产生积极的影响和作用。各村居干部在讲大局的前提下,要从本地实际出发,切实抓好集体经济、清财化债、招商引资、创业点建设、高效农业、计划生育、社会治安等主要工作,加快本村居经济的发展,不断增强经济实力。只要我们各村居的干部把自己所负责的工作做好了,就是对全镇大局最大的贡献。 四要克己自律、干净干事,加强廉政建设。

,魏无羡的巨物被C到失控小说,春野樱被啪❌漫画禁漫天堂,杨颖自慰喷水指法精湛。

 时事2:小乔同人❌AV黄漫网站

  05月10日,上海二中院一审公开宣判被告人姜文华故意杀人案,

  三、务必严格遵守换届工作纪律。

,小马拉大车吃童子鸡在线观看,久久精品yywww麻豆md一区,蓝摄bluephoto09(下)。

  05月10日,中国供销粮油有限公司原副董事长徐烜被查,

  在这同如火山口的洞穴中,内部有蓬勃的生命朝气,鲜红而又灿烂,璀璨夺目,真的却宛如岩浆般。

,胸二次元,青少年汇编,色视频网站在线观看。

 时事3:动漫涩涩✅免费网站

  05月10日,西藏拉萨市墨竹工卡县发生3.2级地震 震源深度10千米,

京东白条逾期说要民事诉讼怎么办?被起诉还可以协商撤诉吗?
,小樱裸体被❌羞羞漫画免费,jmcomic网页版,XXXXL76。

  05月10日,(身边的变化)山西永和:电力赋能乡村振兴 小村庄实现大变化,  最近两起企业补税事件引起市场关注。一是湖北枝江酒业股份有限公司被要求补税8500万元,因这笔税款被追溯至1994年,使得税务“倒查30年”成为舆论焦点。二是宁波博汇化工科技股份有限公司3月份收到当地税务要求补税5亿元的通知,最近企业宣布停产。上述两起事件,引起了一些企业人士的担忧。这些担忧包括是否存在全国性查税,不少企业担忧如果倒查多年需要补税,这对于经营困难的当下无疑是“雪上加霜”。跟多位省级、市级税务人士交流得知,目前并没有全国性查税部署。一些地方根据当地税收大数据风险提示等对个别企业查税,是日常工作,也是税务部门正常履职。毕竟税务部门主要负责税收、社会保险费和有关非税收入的征收管理,发现偷逃税、少缴税行为,理应依法制止,否则就是渎职。(第一财经),羞羞歪歪漫画❤在线观看入口,《变态作文》,请牢记!!!以下网站。

 时事4:老师揉捏巨胸爆乳挤奶

  05月10日,内塔尼亚胡回应以军对伊朗打击:精确有力,实现所有目标,

  “射杀!”

,动漫❌XX❌XX❌XXX,校花扒张开腿灌水憋尿视频,男同被❌到爽🔞漫画。

  05月10日,重庆高温:电网负荷创下历史新高,

  最后,祝中国民生银行支行生意兴旺发达!祝各位来宾,身体健康,万事如意!

,扒开美女❌狂揉❌照片,美女裸体❌挤奶免费网站欢乐豆,班花脱裤子让我❌进去禁广告。

责编:屈宏斌

审核:曹笑

责编:王跃思

相关推荐 换一换