猫眼电影
猫眼电影记者 刘群文 报道w3u7903ejky2ywls
开源大模型新王者,正在受到空前关注。
Qwen3预告一出,直接开启不眠夜模式。
△来自编辑部本部
等到深夜正式上线并宣布登顶全球最强开源模型,更是瞬间引爆全网热议。
网友们的反应在meme中尽数体现(doge)。
毕竟,单看纸面参数,Qwen3就是个妥妥的大工程:
8款混合推理模型全部开源,参数量从0.6B235B全面覆盖;32B模型就有超越OpenAI o1、DeepSeek R1的性能表现,在编程基准测评中还超过了风头正盛的Gemini 2.5 Pro;支持思考和非思考模式,支持119种语言和方言、加强对MCP支持……
还有网友认为,这是“又一个DeepSeek时刻”。
这一次模型开源,通义App和网页版也赶在第一时间满血上线Qwen3,并且有专属智能体体验。
新王究竟表现如何,我们第一时间深度实测,以见真章。
Qwen3住进App,还能这样玩儿
打开通义App/通义网页版首页,目前有两种方式可以体验到Qwen3模型:
直接用输入框对话(代码/数学/翻译类问题默认调用Qwen3-235B,其它问题不调用Qwen3)选用“千问大模型”智能体(默认使用旗舰版Qwen3-235B-A22B)
BTW,通义网页版近期上线了新域名tongyi.com,不要走错。
OK,接下来进入正题。
官方强调了新模型在Agent、编码方面的能力提升,还增强了对MCP的支持。具体表现如何,我们直接在通义App里全方位实测。
第一关:代码生成
先来个新模型“入门挑战”——空间内弹小球。
这个经典测试在考验模型代码能力的同时,还重点关注了它对物理世界的理解,几乎每一个新模型都会被拉出来遛一遛。
提示词如下(p5.js脚本、25个粒子、圆柱形容器):
而第一次接受挑战的旗舰版Qwen3模型,用时1分钟,唰唰唰就生成了一百多行代码:
将上述代码实际运行一下,结果be like:
虽然一眼看去没有“小球直接冲出圆圈”这样明显的错误,但也确实缺少3D空间感。
作为对比,我们拉出官方测评图中,和满血Qwen3代码实力最相近的Grok 3模型。
重复相同操作,让Grok 3基于同一提示词生成代码,并实际运行:
二者的区别相当明显,后者(Grok 3)的空间感肉眼可见更强。
为了进一步探究两段代码的差别,我们又直接让Qwen3“自己找找差距”(doge)。
结果,它真的很认真地进行了全方位对比,包括渲染模式、容器结构、粒子运动与碰撞测试等等。
最终结论也用表格进行了呈现,一目了然:
甚至,基于它提出的改进意见,我们继续让它出了一个新版本。
实际运行后,这次的结果已经非常符合我们的要求了。
事实上,深扒Qwen3的思考过程,我们才发现原来第一版的2D效果是它“深思熟虑”后的选择。
这里主要考虑到了兼容性问题,所以简化成了俯视图来呈现。
从上面这个简单测试,我们已经能够窥见Qwen3的程序员素养确实不错。
接下来难度升级,直接让它帮打工人设计一个提醒喝水的电脑端App。
注意,为了能快速在浏览器端预览生成效果,这里我们采用了“极简模式”,仅保留最基础的功能,不涉及使用任何第三方库。
结果生成的App有模有样,还能真实点击交互。
一旦让具备工程能力的童鞋们上手,估计能实现更多复杂效果。
第二关:逻辑推理
接下来我们考查一下Qwen3的逻辑推理能力。
老规矩,先上一道经典逻辑陷阱题:
农夫要把一头狼、一只羊和一盆菜带过一条河。河边只有一艘小船,农夫每次只能带一样东西过河。如果农夫不在场时,狼会吃羊,羊会吃菜。如何安排农夫的安全过河方案?
在故意关闭联网模式后,Qwen3经过一步步推理最终给出了正确答案。
农夫应按照以下顺序操作:带羊过河,返回。带狼过河,带回羊。带白菜过河,返回。带羊过河。此方案通过7次移动(4次过河,3次返回),确保所有物品安全抵达对岸。
而且从Qwen3的思考过程能够看到,其思维方式和人类一样,是通过不断推翻各种方案来找出可行路径。
再来一道超高难度专业数学题。
原题来自今年的普特南数学竞赛,该竞赛号称最难本科数学考试,人类要考6小时,并且所选取的题目据称前500名选手均未能完整作答。
而扔给Qwen3后,可以看到整体的思考时间确实明显变长,最终用时5分38秒给出了正确答案。
p.s. 千问智能体无法直接上传图片,最终选择从App首页上传图片,提取文字后继续使用千问智能体作答。
更有趣的是,扒一扒其思考过程,还能看到模型在线表演“崩溃”:
当然,虽然AI的解读速度和正确率明显胜于人类,但还是要和同类来比。
在国外网友的测试中,同一道题Grok 3(Think)在约8分钟内找到了解决方案。
所以对比下来,这一局算Qwen3略胜一筹。
第三关:多语言能力
另外据介绍,Qwen3的一大亮点是支持119种语言和方言,被网友戏称“AI届多邻国”(doge)。
别的不说,直接让它来挑战一把国内专业译者的地位试试。
将莎士比亚《哈姆雷特》的经典选段丢给它,让它按照“信达雅”翻译成中文。
它还知道参考优秀译本,并且注意避免直接抄袭造成侵权。
最终生成的结果如下(左侧),对比我们熟知的朱生豪经典译本(右侧),你觉得AI味儿浓度如何?
第四关:赛博闺蜜、shopping比价、写歌一网打尽
除了以上更侧重模型基础能力的考查,当Qwen3被塞进App后,我们还解锁了更多玩法。
做旅游规划这种就不必多说了,关键还能充当“赛博闺蜜”,帮忙选择更适合发朋友圈的游客照。
日常也能用来购物比价,比如分析出当下最值得入手的3000元预算内平板。
不仅用表格清晰列出了各品牌的核心参数,还按照不同需求进行了推荐,一整个造福伸手党。
此外,最近火上热搜的“AI写歌”,我们也用Qwen3尝试了一把。
五一版·大张伟嗨歌这就新鲜出炉,光看歌词确实有内味儿了:
Okk,以上为我们的全部实测。
小结一下,通过在通义App使用Qwen3专属智能体,我们能明显感受到以下几点:
Qwen3旗舰模型的生成速度非常快,体验很丝滑;模型擅长推理,能够解决经典逻辑陷阱和复杂数学题;代码能力方面,已经能够快速实现一些简单需求;由于载体是App,可拓展的玩法很多。
而且,通义App自上个月页面改版后,整体设计更简洁,交互也更加完善了。
更多网友实测
与此同时,随着Qwen3模型的爆火,更多网友也第一时间进行了试玩。
有和“空间内弹小球”类似效果的页面设计:
还有用阿拉伯语、法语和印地语解释爱因斯坦相对论的玩法,该博主声称:
简单到连十岁的小孩都能理解。
当然,大家一直尤为钟爱的小游戏开发也安排上了:
开源界的新王者
Qwen3引发热议背后,可以看到的是,在开源影响力上,以Qwen为代表的国产大模型,已经有超越Llama之势。
这一点,从reddit LocalLLaMA等开发者聚集的板块的最新话题中,亦可见一斑。
不仅是基准评测数据的纸面超越,实测越多,模型实力究竟几何就越能被客观公允地认知。
而如今的开源格局之变,并非一蹴而就。前有DeepSeek,今有Qwen3,背后体现的是来自中国的开源力量一以贯之的努力,和一如既往的“中国速度”。
以Qwen为例:
2024年11月底,开源推理模型QwQ;
2025年春节档,连发Qwen2.5百万上下文版本、视觉理解模型Qwen2.5-VL,还有超大规模MoE模型Qwen-2.5 Max;
2025年3月,QwQ-32B以1/10成本比肩DeepSeek-R1;
多模态方面,还有万相Wan的持续开源和迭代……
这还只是短短5个月内的进展。
再加上更加开放和商用友好的Apache 2.0协议,开发者们的转向,自然在情理之中。
作为普通用户,一方面,可以在通义App这样的官方应用上更快感知到满血模型的能力。
另一方面,也可以期待开源,带来更多衍生应用的可能性。
那么,再次打开传送门:
tongyi.com
如果你探索到了什么新鲜玩法,也欢迎在评论区跟大家分享~
时事1:美女露出🐻让男生揉亲嘴
05月05日,黑龙江黑河:零下30℃!消防员入冰水进行冰域救援技术训练,
从这部影片中我知道了很多安全常识——
,裸体+光屁屁+搂胸+中国。05月05日,中山大学与深圳市签署合作协议进一步加强合作,
通过这次安全日教育,了解了相关知识,具有了国家安全观,我们身为一个大学生,在面对任何事情上,都要考虑国家安全,维护国家安全,人人都是主角!在疫情期间,坚持网上网下结合不断提高国家安全法治宣传的影响力与传播力。让国家安全意识在全体人民心中生根发芽,让13亿人民成为国家安全的坚定维护者,我们必将推动中华号巨轮在时代风云中破浪前行,为实现两个一百年为奋斗目标,为实现中华民族伟大复兴中国梦筑牢安全保障。
,女女女女女❌❌❌❌,动漫被❌到爽漫画免费,日本❌❌❌❌❌10。时事2:失禁…顶弄…触手男男
05月05日,总书记@你来认领家乡特产, 公开资料显示,陈政高,男,汉族,1952年3月生,辽宁海城人,1970年12月参加工作,东北财经大学金融系货币银行学专业毕业,经济学硕士,系十七届中央候补委员、十八届中央委员。,🈲美女扒开胸露出尿头🈲漫画,国产❌❌❌❌69熟妇视频,王者瑶被❌超污裸体网站。
05月05日,刘亚仁出庭受审 其律师辩称“因抑郁症对医用毒品产生依赖”,
历史的潮流,浩浩荡荡、滚滚向前。今天,我们又站在一个新的历史起点上。我国已经进入全面落实科学发展观、构建社会主义和谐社会的新的发展阶段,上海也正在加快推进“四个率先”、加快建设“四个中心”和现代化国际大都市的征程上阔步前进。我们这代年轻人应该怎样来纪念历史?怎样来纪念“五四”?有一位先哲曾经说过:“我们对于历史最好的纪念,就是把前人想要做而没有来得及做或者没有完成的事情,做得更好。”对于当代年轻人来说,我们需要不懈地追求,只有理想远大、信念坚定、目标执着,将个人价值的实现融入党和人民的伟大事业中,我们的天地才会无限广阔;我们需要不懈地学习,把青年群体打造成一个最勤奋学习、最刻苦学习、最善于学习、最具学习能力的群体,以学习长实力,以实力求发展;我们需要不懈地创新,创新我们的思想,创新我们的工作,创新我们的机制,以创新来推动事业的进步,以创新来获得更大的发展;我们需要不懈地奉献,奉献在我们的岗位上,奉献在我们的社会中,以奉献提升我们的人生价值,以奉献使我们的社会变得更加和谐、更加温馨。
,姬小满撅起屁股迎接主人,裸体㊙️无遮挡打屁股黄瓜视频,国产清纯女学生被弄高。时事3:男男被x❌x到无套
05月05日,天津警方2023年破获环食药和知识产权领域刑事案件1055起, 本试卷现代文阅读I提到,长久以来,人们只能看到月球固定朝向地球的一面,“嫦娥四号”探月任务揭开了月背的神秘面纱;随着“天问一号”飞离地球,航天人的目光又投向遥远的深空……,亚洲AV秘无码一区二神宫寺,❤国产嫩草影院❤新年舞蹈,男人把小伸进男人的。
05月05日,第九届德国“中国曲艺周”在柏林首演,
如血凰般的老人闻言,眸子中露出奇光,久久没有说话。
,免费➕无码➕黄漫,吴梦梦AV无码一区二区三区小说,福瑞被触手玩弄狠狠侵犯男男。时事4:99重口㊙️猎奇网站
05月05日,积极因素不断累积增多 中国高质量发展“枝繁叶茂”成果丰硕,
“你……确信在对我说话?”他迟疑的问道。
第一百一十六章 风暴积蓄,婬乱妺妺的泬下面水好多动图,赵露思嗯灬啊灬把腿张开灬,91在线无码精品秘纳西妲。05月05日,云南保山:“五治”融合 绘就法治乡村新蓝图,
“老十五,你这是作甚?!”旁边,石渊比较镇静,大声喝问道。
,日联美女裸体㊙️免費观看直播,三男一女做爰视频试看,成人🔞爱爱网站。责编:廖开念
审核:傅博
责编:丁春秋