小米发布首个推理大模型MiMo:7亿参数碾压巨头,开源AI新标杆

4月30日,全球科技巨头小米正式推出其首个人工智能大模型——Xiaomi MiMo,一个专为推理任务打造的7亿参数开源模型。这一发布不仅标志着小米在AI领域的重大突破,还以惊艳的性能震慑了行业,挑战了OpenAI和阿里巴巴等巨头的地位。小米此举,堪称中国开源AI的新里程碑!

MiMo性能炸裂:小模型大能量

MiMo以“推理能力”为核心,目标是破解当前大模型在逻辑推理上的瓶颈。别看它只有7亿参数,在公开测试中,MiMo的表现却让人瞠目结舌:

  • AIME24-25数学推理测试LiveCodeBench v5代码竞赛中,MiMo以7亿参数的“身板”,直接超越了OpenAI的闭源推理模型o1-mini和阿里巴巴的开源模型QwQ-32B-Preview

  • 相比经典的32亿参数开源模型(如DeepSeek-R1-Distill-7B和Qwen2.5-32B),MiMo在相同的强化学习训练数据下,数学和代码推理能力遥遥领先。

小米AI团队骄傲地表示:“MiMo不仅展示了我们在算法创新上的实力,也为全球AI行业树立了新标杆!”

创新训练法:让MiMo变“推理大师”

MiMo的超强推理能力,离不开小米在训练方法上的独门秘籍:

  1. 预训练阶段:小米整合了约2000亿token的推理语料,设计了三阶段训练策略,总计训练了25万亿token,逐步提升模型应对复杂推理任务的能力。

  2. 后训练阶段:小米引入了强化学习(RL)的全新玩法:

    • 测试难度驱动奖励策略,解决了复杂算法问题中奖励稀疏的难题,让模型更擅长攻克硬核任务。

    • 简单数据重采样策略,提升了训练的稳定性和效率。

    • 无缝回放系统,将强化学习训练速度提高了2.29倍,验证速度提升了1.96倍。

这些创新让MiMo在推理任务中如鱼得水,性能远超预期。

全面开源:小米邀全球开发者共创

MiMo-7B模型已全面开源,登陆HuggingFace平台(链接:https://huggingface.co/XiaomiMiMo),全球开发者可以免费下载、使用,共同探索AI的无限可能。小米表示,MiMo是其新成立的大模型核心团队的“处女作”,虽然2025年被认为是AI发展的“下半场”,但通往通用人工智能(AGI)的路还很长。

小米AI负责人信心满满地说:“我们将持续以务实创新的精神,勇敢挑战未知,用技术回应每一份好奇心。”

未来展望:小米AI要搞大事

MiMo的发布只是小米的起点。作为一家以用户体验为核心的科技公司,小米希望通过AI技术,为智能生活带来更多可能。无论是更聪明的语音助手、更高效的代码工具,还是突破性的数学推理应用,MiMo都可能成为未来智能生态的“发动机”。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索