“天才少女”罗福莉亮相背后:曾被雷军亲自点将,能成小米新王牌?
- 要闻
- 2025-12-20
- 16
- 更新:2025-12-20 11:08:56
本文出处:时代周报 作者:朱成呈
小米MiMo大模型负责人罗福莉的首次公开露面,迅速在行业内引发关注。
12月17日,在小米“人车家全生态大会”上,罗福莉以小米高管的身份走上前台,进行了一场颇具学术风格的分享。她的演讲重点不在于参数或性能指标,而是通过提出一系列前瞻判断,从技术角度阐述了深入的思考。
罗福莉备受瞩目,与她“AI天才少女”的标签有关。她1995年生于四川宜宾,本科毕业于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所。2019年,因在人工智能顶级国际会议ACL上一次性发表8篇论文而受到广泛关注。
在经历了阿里达摩院和DeepSeek的职业旅程后,罗福莉与小米创始人雷军产生了交集。此前曾有报道称,雷军以千万年薪邀请她加入小米从事大模型研究,相关话题一度登上热搜。今年11月,罗福莉通过朋友圈正式宣布已加入小米。
罗福莉指出,当代智能体必须掌握一种高效的沟通语言,这主要体现在代码能力与工具调用能力上。智能体之间的沟通带宽实际上很低,需要思考如何提升这一带宽。这就要求模型具备极高的推理效率,因此必须围绕推理效率重新设计模型架构。
她认为,下一代智能体至少应具备两大潜力:其一,要从“回答问题”转向“完成任务”;其二,必须拥有与世界交互的能力。
这一观点与小米正在展开的大模型布局相呼应。今年以来,小米几乎按月节奏推进模型发布:从4月的推理模型MiMo,到5月的多模态MiMo-VL,9月的端到端语音MiMo-Audio,再到11月面向家庭场景的Miloco。
截至今年第三季度,小米AIoT平台全球连接设备数首次突破10亿,达到10.4亿台。罗福莉的加入,意味着小米开始探索一个更长期的命题:在“人、车、家”生态中,模型该如何理解世界并持续参与其中。
首秀之后,雷军交给罗福莉的考题其实才刚刚开始。
**聚焦“物理AI”方向**
罗福莉自带流量光环,但更值得关注的是她加入小米后的研究方向。
在官宣入职不到10天,MiMo团队的首篇论文就已公开。论文中,罗福莉作为团队负责人担任核心作者,小米智驾团队首席科学家陈龙出任项目负责人。该研究提出并开源了跨具身基座模型MiMo-Embodied,尝试连接自动驾驶与具身智能两大领域。
这并非临时起意。在加入小米之初,罗福莉就已表达对“物理AI”的浓厚兴趣。她在朋友圈写道:“智能终将从语言走向物理世界。我正在XiaomiMiMo,与一群充满创造力、才华横溢且热爱研究的伙伴,共同致力于构建这样的未来,向我们心目中的AGI全力迈进!”
根据英伟达官网的解释,物理AI是指能够运用运动技能理解现实世界并与之交互的模型,通常嵌入在机器人或自动驾驶汽车等自主机器中。罗福莉在演讲中给出了更直接的阐述:AI进化的下一个关键,必定是能够与真实环境持续交互的物理模型。真正的智能不是从文本中“读取”出来的,而是在交互中“活”出来的。
这一判断正好指向小米当前最核心的“人、车、家”生态。在这一体系中,AI不再是一个独立的能力模块,而必须融入具体业务场景,承担感知、决策与执行的角色。无论是智能驾驶还是具身智能,都可能成为小米大模型从“认知工具”迈向“行动主体”的关键落地场景。
值得注意的是,12月16日晚,小米公布了MiMo-V2-Flash开源MoE模型,总参数量达309B,活跃参数量为15B。罗福莉表示,MiMo-V2-Flash实现了低成本、高速度,已初步具备模拟世界的能力。
**“小米方案”能否突破设备边界?**
按照卢伟冰披露的时间线,小米自研的MiMo系列已覆盖推理、视觉、多模态、音频与具身等多个层级。包括推理大模型MiMo-7B、视觉推理大模型MiMo-VL、原生端到端音频生成模型MiMo-Audio、端侧视觉语言大模型MiMo-VL-Miloco以及具身大模型MiMo-Embodied。
其中,MiMo-VL-Miloco大模型显然是为智能家居场景设计的。11月14日,小米推出了智能家居未来探索方案Xiaomi Miloco,试图让智能家居设备从“被动响应指令”转向“主动理解与服务”。
“AI将打破设备边界,未来甚至连桌椅板凳都可能融入智能家居系统。”资深互联网观察家丁道师向时代周报记者表示,“像小米Miloco这类方案,能够打破设备孤岛,无需用户发出指令,依靠本地大模型即可自动感知需求、切换场景,同时还能保护隐私。”丁道师指出,小米Miloco将使智能家居从“听指令”转变为“主动服务”。
长期以来,智能家居的核心瓶颈不在于设备数量,而在于交互方式。大多数系统依赖规则引擎,用户需要手动设置触发条件与执行逻辑:温度达到多少、时间到几点、哪个传感器先触发。这套机制在工程上稳定,却极度依赖用户“事先规划好一切”,导致交互体验显得机械而碎片化。即便是熟悉智能家居的极客用户,也未必愿意长期维护复杂的规则链。
罗福莉首次公开亮相 时代周报记者 拍摄
国金证券研报指出,Miloco的核心优势在于,用户可以通过口语化表达需求,由系统自动调用工具创建智能规则,无需手动设置复杂触发条件;在智能层面,依托自研的Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型,结合家庭摄像头的实时视觉数据,智能家居得以从“单一条件触发”升级为“多维度场景感知”。
实际上,已有多家品牌在布局家庭智能。丁道师表示,华为、三星、美的、欧瑞博、Rokid等企业都提出了Home AI相关概念。未来用户使用智能家居时,可能连APP都无需打开,回家灯自动亮起、空调自动调节,甚至能根据用户状态判断是否播放一首舒缓的音乐。
GKURC产经智库首席分析师丁少将认为,Miloco这类系统将改变当前以APP为中心的碎片化操控模式,转向以用户意图为核心的场景化自动执行。
丁少将向时代周报记者表示,智能家居领域可能会出现类似AI手机的集中式操作系统。小米的Miloco概念已展现出这一趋势,通过本地化AI中枢统一调度跨品牌设备,实现主动服务与无感交互。然而关键在于能否打破品牌生态壁垒,建立统一的协议标准。一旦实现,智能家居将从“单点智能”跃升为真正自主决策的“空间智能体”,重新定义人、设备与环境之间的关系。
责任编辑:李超_NB12814
有话要说...