第一财经「新皮层」独家获悉,DeepSeek 开源大模型 DeepSeek-V2 的关键开发者之一罗福莉将加入小米,或供职于小米 AI 实验室,领导小米大模型团队。
知情人士称,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才,支付的薪酬水平在千万元级别。
小米 AI 实验室正式成立于 2016 年年初,目前团队大约有 250 人,研究方向包括视觉、声学、语音、自然语言处理(NLP)、知识图谱、机器学习和大模型。
根据公开信息,罗福莉硕士毕业于北京大学计算语言学研究所,研二时在自然语言处理领域顶级会议 ACL 2019 上发表 8 篇论文,其中两篇为一作。毕业后,罗福莉加入阿里达摩院机器智能实验室。期间,她主导开发的多语言预训练模型 VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系 AliceMind。此外,她还主导了 AliceMind 的开源工作。
2022 年,罗福莉离开阿里,在 DeepSeek 担任深度学习研究员,参与了 DeepSeek 的 MoE 大模型 DeepSeek-V2 的开发。
罗福莉的加入可能加速小米在大模型领域的研发进度。2023 年 4 月,小米 AI 实验室下设了专门的大模型团队,任命栾剑担任负责人,向小米技术委员会副主席、AI 实验室主任王斌汇报。公开资料显示,栾剑曾任东芝(中国)研究院研究员、微软(中国)工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。
2023 年年度演讲中,雷军宣布小米将全面拥抱 AI 大模型,大模型技术的主力突破方向为「轻量化」和「本地部署」。基于该原则,小米的大模型团队研发了 MiLM 系列模型,并于今年 11 月升级至第二代 ——MiLM2,其中,模型参数最小为 0.3B,最大为 30B,多数在端侧部署,MiLM2-30B 专为云端场景设计。目前,MiLM2 已经在澎湃 OS、小爱同学、智能座舱、智能客服中应用落地。
本文发布者:dennyyang,转载请注明出处:https://www.kongyoo.com/front-technology/4562.html