4月30日,全球科技巨头小米正式推出其首个人工智能大模型——Xiaomi MiMo,一个专为推理任务打造的7亿参数开源模型。这一发布不仅标志着小米在AI领域的重大突破,还以惊艳的性能震慑了行业,挑战了OpenAI和阿里巴巴等巨头的地位。小米此举,堪称中国开源AI的新里程碑!
MiMo性能炸裂:小模型大能量
MiMo以“推理能力”为核心,目标是破解当前大模型在逻辑推理上的瓶颈。别看它只有7亿参数,在公开测试中,MiMo的表现却让人瞠目结舌:
-
在AIME24-25数学推理测试和LiveCodeBench v5代码竞赛中,MiMo以7亿参数的“身板”,直接超越了OpenAI的闭源推理模型o1-mini和阿里巴巴的开源模型QwQ-32B-Preview。
-
相比经典的32亿参数开源模型(如DeepSeek-R1-Distill-7B和Qwen2.5-32B),MiMo在相同的强化学习训练数据下,数学和代码推理能力遥遥领先。
小米AI团队骄傲地表示:“MiMo不仅展示了我们在算法创新上的实力,也为全球AI行业树立了新标杆!”
创新训练法:让MiMo变“推理大师”
MiMo的超强推理能力,离不开小米在训练方法上的独门秘籍:
-
预训练阶段:小米整合了约2000亿token的推理语料,设计了三阶段训练策略,总计训练了25万亿token,逐步提升模型应对复杂推理任务的能力。
-
后训练阶段:小米引入了强化学习(RL)的全新玩法:
-
测试难度驱动奖励策略,解决了复杂算法问题中奖励稀疏的难题,让模型更擅长攻克硬核任务。
-
简单数据重采样策略,提升了训练的稳定性和效率。
-
无缝回放系统,将强化学习训练速度提高了2.29倍,验证速度提升了1.96倍。
-
这些创新让MiMo在推理任务中如鱼得水,性能远超预期。
全面开源:小米邀全球开发者共创
MiMo-7B模型已全面开源,登陆HuggingFace平台(链接:https://huggingface.co/XiaomiMiMo),全球开发者可以免费下载、使用,共同探索AI的无限可能。小米表示,MiMo是其新成立的大模型核心团队的“处女作”,虽然2025年被认为是AI发展的“下半场”,但通往通用人工智能(AGI)的路还很长。
小米AI负责人信心满满地说:“我们将持续以务实创新的精神,勇敢挑战未知,用技术回应每一份好奇心。”
未来展望:小米AI要搞大事
MiMo的发布只是小米的起点。作为一家以用户体验为核心的科技公司,小米希望通过AI技术,为智能生活带来更多可能。无论是更聪明的语音助手、更高效的代码工具,还是突破性的数学推理应用,MiMo都可能成为未来智能生态的“发动机”。