小米进军大模型,最擅长“以小博大”。
4月30日,小米宣布开源首个为推理而生的大模型Xiaomi MiMo。值得注意的是,其经过强化学习训练形成的MiMo-7B-RL模型,用仅仅70亿的参数,在多项权威基准测试中得分超过了OpenAI的闭源推理模型o1-mini 和阿里通义千问320亿参数的QwQ-32B-Preview,实现了“以小博大”。
受此消息影响,今日小米股价涨5.37%,金山云和金山软件更是分别大涨14.20%和7.07%。业内人士认为,小米作为国产头部的手机品牌厂商,此次开源的小参数规模模型展现了较强的性能,为AI在手机端侧的应用和运行提供了更坚实的模型基础。
小米开源MiMo推理大模型
4月30日,小米宣布开源首个为推理而生的大模型Xiaomi MiMo。据介绍,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型 QwQ-32B-Preview。
以70亿的小规模参数,实现了卓越的性能,MiMo展现了小米“以小博大”的能力。据悉,这一成绩的取得,主要源于团队在预训练和后训练的数据和算法方面进行了多层组合创新努力。预训练是让模型领略更多的推理模型,而后训练则是打磨高效稳定的强化学习算法及框架。
具体来看,MiMo背后包含了许多技术细节,包括使用改进的组相对策略优化(GRPO)算法进行训练,移除KL(Kullback-Leibler散度)损失、动态采样和增加上界裁剪等策略;提出测试难度驱动的奖励机制,将测试用例按难度分组,并根据难度分配奖励;采用易数据过滤和重采样策略,提高采样效率并稳定策略更新等等。
小米大模型团队也已公开了MiMo的技术报告,展现了相关的技术细节。此外,MiMo-7B全系列已开源,包括预训练模型MiMo-7B-Base,监督微调模型MiMo-7B-SFT以及强化学习模型MiMo-7B-RL和MiMo-7B-RL-Zero。
小米大模型团队表示,MiMo来自于全新成立不久的“小米大模型Core团队”的初步尝试。业内人士普遍认为,MiMo的开源标志着AI发展从盲目追求参数规模转向注重算法效率和能力密度的理性发展期,通过技术创新,小模型同样可以实现高效率、大智慧,带来“性价比革命”。
小米全面发力AI大模型
随着MiMo模型的开源,小米刚刚成立不久的小米大模型Core团队也终于浮出水面。小米创始人雷军曾在2023年表示,自2016年组建AI团队以来,到2023年4月第一时间成立专职大模型团队,经过多次扩展,小米AI团队相关人员规模已达3000多人,逐步建立了视觉、语音、声学、知识图谱、NLP、机器学习、多模态等AI技术能力。
小米大力“押宝”大模型早在去年底便已有消息传出。DeepSeek-V3爆火之后,背后的AI“天才少女”罗福莉引发了大众的关注,彼时就有媒体报道称,雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。
此外,小米也搭建了自己的GPU万卡集群,并持续提升算力储备,为大模型研发提供更充分的算力供给。今年3月,小米发布2024年报,明确2025年将投入70亿元以上资金用于AI研发,约占总研发经费的1/4,重点聚焦AI基础设施、大模型开发及应用场景搭建。
从招兵买马到“补充弹药”,小米全面发力AI大模型,将AI视为下一个“新战场”。值得注意的是,与其他大模型厂商追求高性能、大参数不同,小米大模型主攻轻量化、本地部署,也是业界第一个在手机芯片上跑通十亿参数规模大语言模型,验证了端侧小模型在部分目标场景可以取得媲美云端大模型效果。
雷军曾表示,“小米拥有品类众多的设备,是全球规模领先的消费级物联网平台。设备多样,使用场景也各不相同,一个大模型难以兼顾。如果把一部分大模型能力下放到端侧,不仅能更好地保护用户隐私、而且有机会在本地实现千人千面的个性化定制。”因此,在训练策略上,小米一直致力于减少参数的浪费,达到效率和效果的最佳均衡。
同时,小米发力AI,致力于将大模型与自身业务深度协同,围绕硬件生态做深场景,让AI真正服务于产品。目前,小米的AI技术能力已逐步接入手机、汽车、AIoT、机器人等业务板块,端侧赋能加速。业内人士认为,小米作为国产头部的手机品牌厂商,此次开源的小参数规模模型展现了较强的性能,为AI在手机端侧的应用和运行提供了更坚实的模型基础。
中信建投研报表示,大模型能力不断迭代增长,但模型之间差异在缩小。这些技术需要在终端设备上应用落地,最终通过这些应用/终端实现商业价值的转化,从而形成一个从投资到变现的完整闭环。目前,Meta、字节、小米等巨头已经开始大力布局端侧AI,抢夺AI Agent入口。除了手机、PC、眼镜、耳机外,潜在的端侧AI基数巨大,家电、机器人、智能车、教育办公设备、玩具等都受益于端侧AI的趋势,AI嵌入将带来广泛的硬件升级。重点关注算力、存储、连接、电力等硬件环节。
责编:万健祎
校对:廖胜超
《嘿搔黄漫》,《w3u7903ejky2ywls》美女扒开胸罩👙给男生桶
“动漫巨胸美女爆❌免费观看”
裸乳被爆❌白浆换脸
……
05月07日
“雏田的胸襟距离”栾留伟火锅店平台收藏数已破万
↓↓↓
05月07日,看!在宁夏,人与湿地如此和谐美好,NP玩烂了公用爽灌满视频播放,白丝妺妺洗澡忍不住c了她h,欧洲交,苍井空做爰高潮A片
05月07日,多举措激发冰雪经济活力 产业规模明年有望突破万亿元,千仞雪裸体被叫爽视频,猫咪成人网,痴梦少女全集免费观看中文版,18🈲动漫在线观看
05月07日,加拿大将也门胡塞武装列为“恐怖组织”,特级婬片A片AAA毛片AA做头,免费无遮挡🔞漫画网站双修,足控免费视频,撕开内衣秘挠奶头捆绑
05月07日|香港电影发展基金迄今已资助100多部电影|休内谢精一汇编的深刻含义和意义|成人🔞🈲️免费视频|无尽❌裸体❌触手❌|张家界吴敏16分钟演出网盘
05月07日|巴基斯坦外交部宣布召回驻伊朗大使|久久精品亚洲AV无码忘忧草|91在线无码精品㊙️入口不卡|无码㊙️人妻一区二区三区糖心|两面宿傩×虎杖悠仁
05月07日|稀有新发现!云南这一保护区首次看到鹰雕出没宁波制造受RCEP市场青睐 三项指标创同期新高|18🈲️男同|国产精品㊙️精东传媒下载|王者荣耀姬小满身材|偷拍男厕撒尿合集Gay2022……
05月07日,哈萨克斯坦执法机构捣毁三处大型毒品加工点,小仙儿乖妈妈有声小说全集,少妇搡BBBB搡BBB搡造水多,催眠云璃被爆❌超污网站,男主播飞机直播
05月07日,移动互联网十年 年轻人大厂围城,玩胸的100种变态玩法,奇优影院高清免费,伍六七之乱婬h侵犯在线观看,美女药跪床❌❌被🌿作文
05月07日|直播间成夏日旅行“任意门” 在线“云”游成常态|脱👙让摸🐻18禁|初毛初精青春期小男生的勃起|小情侣18🈲被偷拍免费观看|🔞🍌进🍑里❌❌❌片国产
05月07日,山西八里坪遗址:古国时代晚期东西互动的文化枢纽,彩虹🌈Gay.Cam,美女扒开内裤㊙️免费看火影,女性裸体被❌羞羞被扒胸电视,豆花免费跳转通道1
05月07日,航拍贵州乌江寨国际旅游度假区夜景美如画,欧美人与性囗牲恔配视频,剑来宁姚让人内射,怀孕期间可以擦防晒霜吗,高+H+肉自慰放荡爽全文动漫
05月07日,新疆吉木乃农业对外开放合作试验区揭牌,美女露出🐻让男生看的漫画,欧美人獸交3e人与狍交,军警脱裤自慰精牛粗大,羞羞漫在线观看♥无限免费
05月07日|大湾区海上互联互通提速 海事部门打出安全保障“组合拳”|美国vexin|男男啪啪激烈高潮CC漫画免费|porin94HD😍|直男白袜打自慰
05月07日|“中国凉都”贵州六盘水吸引游客避暑游玩|性裸交❌❌❌❌❌之深夜利器|uococo的相册|男男暴菊gy无套网站小蓝视频|www深夜成人🔞漫画网站
05月07日|哈马斯代表团离开开罗,加沙停火谈判处于关键阶段|国产XXXX振车|3d无尽动漫可爱得到男|兔女郎被吃胸乳❌❌❌动漫|少妇做爰奶水狂喷免费漫画
电影焚城预售,GALA触发禁用装备被处罚|国家移民管理局:“五一”假期超800万人次出入境|舒淇被躁120分钟视频|ass艳妇猛交bbw|日本1-1韩国|初音未来❌羞羞网站
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺