华为前天才少年创业者打造,智元机器人推出首款通用型实体基础大模型

admin122025-03-10 14:54:41

标题:智元机器人发布突破性大模型,引领机器人智能新纪元

正文:

在人工智能领域的又一里程碑时刻,智元机器人于3月10日宣布推出其首个通用具身基座模型——智元启元大模型(Genie Operator-1)。这一创新成果不仅标志着智元机器人在机器人技术上的重大突破,也为整个行业的发展开辟了新的可能性。

ViLLA架构:智能升级的基石

智元启元大模型的核心是其所采用的ViLLA(Vision-Language-Latent-Action)架构。这一架构由VLM(多模态大模型)和MoE(混合专家)技术组成,实现了机器人通过人类视频学习的能力,并能够快速泛化到小样本学习,显著降低了具身智能的门槛。该架构已在智元的多款机器人产品中得到成功应用。

性能卓越:GO-1大模型的表现

在一系列复杂度不同的任务测试中,GO-1大模型的表现令人瞩目。与现有最优模型相比,GO-1的成功率大幅提升,平均成功率提高了32%(从46%提升至78%)。在“倒水”、“清理桌面”和“补充饮料”等任务中,GO-1的优异表现尤为显著。

ViLLA架构的额外优势

对ViLLA架构中的Latent Planner进行了单独验证,结果显示其能够将成功率提升12%(从66%提升至78%),进一步证明了该架构的强大能力。

GO-1大模型的多重优势

GO-1大模型凭借其革命性的学习能力,能够泛化应用于各种环境和物品,快速适应新任务和学习新技能。此外,它还支持部署到不同的机器人本体,高效实现落地,并在实际使用中不断进化。

以下是GO-1大模型的四大核心优势:

  1. 人类视频学习:GO-1大模型结合互联网视频和真实人类示范进行学习,增强了模型对人类行为的理解,更好地服务于人类。
  2. 小样本快速泛化:GO-1大模型具有强大的泛化能力,即使在数据极少的情况下也能泛化到新场景和新任务,降低了具身模型的使用门槛,后训练成本极低。
  3. 一脑多形:GO-1大模型是通用机器人策略模型,能够在不同机器人形态之间迁移,快速适配到不同本体,实现群体智能的提升。
  4. 持续进化:GO-1大模型搭配智元的数据回流系统,可以从实际执行中遇到的问题数据中持续进化学习,使用时间越长,智能水平越高。

创始人背景:彭志辉的AI之路

值得一提的是,智元机器人的创始人彭志辉(稚晖君)在2020年以“华为天才少年计划”最高档年薪201万元加入华为,从事昇腾AI芯片和AI算法的研究工作。2022年年底,彭志辉从华为离职,并于2023年2月联合创立了智元机器人。

智元机器人的这一系列创新成果,无疑为机器人智能领域的发展带来了新的动力。随着GO-1大模型的应用,我们期待着未来机器人将在更多领域发挥重要作用,为人类社会带来更多便利和惊喜。