2024年3月,对于通用机器人领域来说,确实是一个值得纪念的月份。在这个月里,Covariant公司推出了RFM-1,这是一款基于真实任务数据训练的机器人基础模型,被认为是最接近解决真实世界任务的机器人大模型。这一事件,以及随后Pi公司的成立和Figure 01 demo的发布,都在科技界引起了广泛的关注和讨论。
26192540-2024-03-26T11:25:21.png
Covariant的RFM-1模型是一个基于Transformer架构的大模型,拥有80亿参数,能够处理文本、图片、视频、机器人动作和传感器信息等多种模态的数据。RFM-1的推出,标志着AI在物理世界探索方面迈出了重要一步,它不仅构建了机器人理解人类物理环境的世界模型,还具备了基于多模态与物理世界互动的能力。

RFM-1的推出被Tech Crunch称为“ChatGPT for robots”,这一比喻强调了RFM-1在机器人领域的潜在影响力。Covariant的创始人之一,陈曦(Peter Chen),在专访中解释了RFM-1的由来、模型结构、以及它如何作为一个世界模型进行工作。他强调,RFM-1是一个真正意义上的世界模型,它能够在不同的硬件、任务和场景中适配,这是其成功的关键。

陈曦还提到了RFM-1的“any to any”特性,这意味着模型能够适应各种输入模态和输出模态,从而实现多样化的应用。这种灵活性是RFM-1强大的原因之一,它允许模型学习世界模型,理解物理世界,并基于这个理解做出更好的机器人动作。

在谈到机器人大模型的竞争时,陈曦表示,虽然市场上有多家公司在这一领域竞争,但Covariant在多场景和多硬件的适配能力上拥有明显的优势。他还提到了RFM-1的数据收集策略,强调了在真实世界中收集数据的重要性,以及Covariant在这方面的丰富经验。

最后,陈曦对机器人领域的未来进行了展望,认为现在是投身于机器人应用开发和基础设施建设的好时机。他预测,随着机器人大模型的成熟,这个领域的发展速度将会加快,硬件技术的成熟也将促进更多的产品推出和公关活动,从而提高公众对机器人的接受度。

总的来说,2024年3月的这些事件标志着机器人技术的一个重要转折点,预示着AI在物理世界中的应用将更加广泛和深入。随着RFM-1等模型的推出,我们可以期待在不久的将来,机器人将在各种真实世界任务中发挥更大的作用。

相关链接:
https://covariant.ai/insights/introducing-rfm-1-giving-robots-human-like-reasoning-capabilities/
https://covariant.ai/insights/rfm-1-a-world-model-that-understands-physics/
https://techcrunch.com/2024/03/11/covariant-is-building-chatgpt-for-robots/