Genesis AI 新型机器人大脑:单模型即可烹饪、弹钢琴

就在你以为家里的扫地机器人总算开了窍的时候,科技初创公司 Genesis AI 甩出了一套系统,直接让前者显得像块只会发呆的“宠物石”。该公司发布了一系列震撼视频,展示了其被称为“机器人大脑”的 GENE-26.5。从下厨烹饪到弹奏钢琴,再到进行精密的实验室操作,这套系统在处理这一系列令人眼花缭乱的复杂任务时,据称使用的都是同一个 AI 模型,且全程无需针对特定任务进行重新训练。

根据其 CEO Zhou Xian 发布的内容,所有演示均为机器人完全自主运行,并以 1x 倍速实时呈现。其中一段视频记录了机器人有条不紊地准备菜肴的过程,Zhou Xian 幽默地表示,这顿饭他们已经“焖了一年”——这既是对研发周期的双关调侃,也道出了攻克此类问题的极高门槛。此外,该系统在还原三阶魔方以及操作实验室设备时展现出的毫米级精度,同样刷新了人们对机器人灵巧性的认知。

Genesis AI 宣称,此次突破的关键在于他们从底层逻辑上彻底重构了机器人技术栈(robotics stack)。整套系统由四个核心支柱构成:一个原生集成了语言、视觉、本体感受和触觉数据的机器人大模型;一只 1:1 还原人类动作的类人机械手;一副能够精准捕捉人类示教者动作、力度和触感的非侵入式数据采集手套;以及一个旨在大幅缩短实验周期的仿真器。

这为何至关重要?

现代机器人领域的“圣杯”在于通用性(generalization)——即打造一个无需为每个特定场景单独编程,就能学习并胜任各种任务的单一系统。多年来,获取高质量、多模态的人类示教数据一直是行业最大的瓶颈。Genesis AI 这种“全栈式”的打法,尤其是将数据采集手套与类人机械手深度结合,正是为了正面硬刚这一难题。

当其他公司还在埋头卷 AI 模型规模时,Genesis 已经在构建一整套生态系统,旨在为模型喂入最正确、最直观的数据。如果 GENE-26.5 真的能仅凭一套权重就在如此多样且精细的任务中实现泛化,那么我们距离那种不再只是“听令行事”、而是真正能够“习得技能”的机器人时代,又跨出了具有里程碑意义的一步。