3月10日,华为离职“天才少年”稚晖君(原名彭志辉)发布智元通用具身基座大模型Genie Operator-1(GO-1)。

稚晖君曾在OPPO研究院人工智能实验室任职,2020年通过华为”天才少年计划”(最高档年薪201万元)加入华为技术团队,主要承担昇腾系列AI芯片研发及人工智能算法优化工作。2022年12月从华为离职后,于2023年2月参与创立智元机器人技术公司,担任智元机器人联合创始人兼CTO。在3月7日,稚晖君曾在微博上预告“下周有好东西发布”。
稚晖君所预告的“好东西”正是基座大模型GO-1,该模型提出了Vision-Language-Latent-Action (ViLLA)架构,该架构由VLM(多模态大模型) + MoE(混合专家)组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力,三者合作实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体。