DeepSeek 开源大模型关键开发者之一罗福莉将加入小米

dennyyang • 2024年12月26日上午11:45 • 科技前沿 • 362 人阅读

第一财经「新皮层」独家获悉，DeepSeek 开源大模型 DeepSeek-V2 的关键开发者之一罗福莉将加入小米，或供职于小米 AI 实验室，领导小米大模型团队。

知情人士称，雷军认为小米在大模型领域发力太晚，于是亲自挖人，重金招募能够领军小米大模型的人才，支付的薪酬水平在千万元级别。

小米 AI 实验室正式成立于 2016 年年初，目前团队大约有 250 人，研究方向包括视觉、声学、语音、自然语言处理（NLP）、知识图谱、机器学习和大模型。

根据公开信息，罗福莉硕士毕业于北京大学计算语言学研究所，研二时在自然语言处理领域顶级会议 ACL 2019 上发表 8 篇论文，其中两篇为一作。毕业后，罗福莉加入阿里达摩院机器智能实验室。期间，她主导开发的多语言预训练模型 VECO（同时支持多语言理解和生成的跨语言模型），被纳入阿里达摩院深度语言模型体系 AliceMind。此外，她还主导了 AliceMind 的开源工作。

2022 年，罗福莉离开阿里，在 DeepSeek 担任深度学习研究员，参与了 DeepSeek 的 MoE 大模型 DeepSeek-V2 的开发。

罗福莉的加入可能加速小米在大模型领域的研发进度。2023 年 4 月，小米 AI 实验室下设了专门的大模型团队，任命栾剑担任负责人，向小米技术委员会副主席、AI 实验室主任王斌汇报。公开资料显示，栾剑曾任东芝（中国）研究院研究员、微软（中国）工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。

2023 年年度演讲中，雷军宣布小米将全面拥抱 AI 大模型，大模型技术的主力突破方向为「轻量化」和「本地部署」。基于该原则，小米的大模型团队研发了 MiLM 系列模型，并于今年 11 月升级至第二代 ——MiLM2，其中，模型参数最小为 0.3B，最大为 30B，多数在端侧部署，MiLM2-30B 专为云端场景设计。目前，MiLM2 已经在澎湃 OS、小爱同学、智能座舱、智能客服中应用落地。

本文发布者：dennyyang，转载请注明出处：https://www.kongyoo.com/front-technology/4562.html