Sunday AI: Roboter-Puppen übersprungen, Hausarbeit per Hand lehren

Das dunkle Geheimnis der modernen Robotik ist, dass die meisten beeindruckenden Demos nur High-Tech-Marionettentheater sind. Eine Armee menschlicher Bediener, geschnallt in komplexe und kostspielige Teleoperations-Rigs, steuert jede Bewegung eines Roboters ferngesteuert, um die Daten zu generieren, die nötig sind, um ihm etwas Nützliches beizubringen. Es ist ein langsamer, teurer und, offen gesagt, nicht skalierbarer Prozess. Die Stanford-PhD-Abbrecher Tony Zhao und Cheng Chi von Sunday AI haben diese „Skalierungs-Sackgasse“ genauer unter die Lupe genommen und beschlossen, sie komplett zu umgehen.

Ihre Lösung, die ein neues Grundmodell namens ACT-1 antreibt, ist täuschend einfach: Wenn man möchte, dass ein Roboter eine Aufgabe lernt, macht man es einfach selbst. Anstelle eines 20.000-Dollar-Teleoperations-Rigs verwenden die Ingenieure von Sunday einen 200-Dollar-„Skill Capture Glove“. Dieser Handschuh, dessen Design auf die Geometrie und die Sensoren der Hand ihres Memo-Roboters abgestimmt ist, erfasst die subtilen, kontaktintensiven Daten menschlicher Bewegungen. Die Prämisse ist kühn: Wenn ein Mensch es mit dem Handschuh tun kann, kann der Roboter es lernen – kein Marionettenspiel erforderlich.

Der Datenengpass und die Handschuh-Lösung

Die Kernüberzeugung von Sunday ist, dass die Robotik nicht durch Hardware, Rechenleistung oder Finanzierung gebremst wird, sondern durch eine einzige, entscheidende Einschränkung: Daten. Während große Sprachmodelle das gesamte Internet aufnehmen konnten, verfügt die Robotik über keinen solchen Korpus an realen Interaktionsdaten. Unternehmen wie Tesla können Millionen von Autos zur Datenerfassung nutzen, aber Robotik-Startups haben diesen Luxus nicht. Teleoperation war die Antwort der Branche, aber es ist ein Brute-Force-Ansatz, der sowohl kapitalintensiv als auch langsam ist.

Der Skill Capture Glove von Sunday AI, der die Hand des Memo-Roboters widerspiegelt.

Der Skill Capture Glove ist Sundays eleganter Schachzug, um dieses Problem zu umgehen. Durch die Dezentralisierung der Datenerfassung kann jeder, überall, zum Trainingsdatensatz beitragen, ohne dass ein physischer Roboter anwesend sein muss. Dies bietet zwei entscheidende Vorteile:

  • Kapitaleffizienz: Sunday behauptet, dass der Handschuh um zwei Größenordnungen billiger ist als eine Standard-Teleoperations-Einrichtung, was die Kosten der Datenerfassung drastisch senkt.
  • Datenqualität: Für Aufgaben, die auf Gefühl angewiesen sind – wie die Bestimmung der Kraft, die zum Falten einer Socke oder zum Platzieren eines Weinglases in einem Geschirrspülerkorb erforderlich ist – liefert der Handschuh ein natürliches Kraftfeedback, das die Fernsteuerung einfach nicht replizieren kann.

Dieser Ansatz ermöglicht es Sunday, Daten aus Hunderten von unordentlichen, realen Haushalten zu erfassen und einen Datensatz aufzubauen, der den „langen Schwanz des Lebens“ widerspiegelt, wie sie es nennen – Katzen in Geschirrspülern und alles, was dazugehört.

Vom Esstisch in den Geschirrspüler

Um ACT-1s Können unter Beweis zu stellen, präsentierte Sunday, was sie als „die komplexeste Aufgabe, die jemals von einem Roboter autonom erledigt wurde“ bezeichnen: einen Esstisch abräumen und einen Geschirrspüler beladen. Das ist nicht nur einfaches Aufnehmen und Abstellen. Die Aufgabe umfasst 33 einzigartige und insgesamt 68 geschickte Interaktionen mit 21 verschiedenen Objekten – von zerbrechlichen, transparenten Weingläsern bis hin zu Keramiktellern und Metallbesteck.

Während dieser langfristigen Aufgabe navigiert der Memo-Roboter über 40 Meter, entsorgt Essensreste und bedient sogar den Geschirrspüler. Es ist eine Symphonie aus feingliedriger Manipulation und raumgreifender Navigation, gesteuert von einem einzigen End-to-End-Modell. Mitbegründer Tony Zhao gibt zu, dass sie während der Entwicklung viele Gläser zerbrochen haben, aber bei mehr als 20 Live-Demos keine einzige Beschädigung verzeichneten – ein Beleg für die erlernte Sensibilität des Modells.

Zero-Shot-Generalisierung in der Praxis

Ein Roboter, der nur im eigenen Labor funktioniert, ist nur ein akademisches Projekt. Um ACT-1s Anpassungsfähigkeit zu beweisen, setzte das Team Memo in sechs unbekannten Airbnbs ein. Das Ziel: den Tisch abräumen und den Geschirrspüler beladen, ohne umgebungsspezifisches Training.

Sundays Memo-Roboter bei der Ausführung von Aufgaben in einer realen Wohnumgebung.

Durch die Konditionierung des Modells mit 3D-Karten während des Trainings lernt ACT-1, neue Layouts zu interpretieren, anstatt sich spezifische zu merken. Wenn es in einem neuen Haus eingesetzt wird, verwendet es die bereitgestellte Karte, um zu Schlüsselpositionen zu navigieren, was eine entscheidende Fähigkeit für jeden Roboter darstellt, der für das Wirrwarr eines echten Zuhauses gedacht ist. Bis heute ist ACT-1 das erste Grundmodell, das dieses Maß an langfristiger Manipulation mit kartenbasierter Navigation kombiniert.

Die Grenzen der Geschicklichkeit verschieben

Jenseits der Marathon-Geschirrspüler-Aufgabe zeigt Sunday auch die Finesse von ACT-1 bei zwei notorisch schwierigen Herausforderungen: Socken falten und einen Espresso zubereiten. Während andere Roboter große, vorhersehbare Gegenstände gefaltet haben, sind Socken ein Albtraum aus Verformbarkeit und Selbstverdeckung. ACT-1 identifiziert erfolgreich Paare aus einem unordentlichen Haufen, rollt sie mit Mehrfingerbewegungen zusammen und legt sie in einen Korb.

Die Bedienung einer Espressomaschine demonstriert derweil eine Kombination aus Millimeterpräzision und roher Kraft. Der Roboter führt ein Tampern in der Luft durch, setzt den Siebträger ein und erzeugt das hohe Drehmoment, das zum Verriegeln erforderlich ist, bevor er den Knopf drückt. Dies sind nicht nur aufsehenerregende Demos; es sind sorgfältig ausgewählte Beweise für die hochwertigen, nuancierten Daten, die der Skill Capture Glove liefern kann.

Sundays Ansatz ist ein kühnes Wagnis. Indem das Unternehmen alles auf eine neuartige Datenerfassungsmethode gesetzt hat, hat es den größten Engpass der Branche umgangen und ein Modell mit verblüffenden Fähigkeiten hervorgebracht. Der rollende Memo-Roboter mag nicht den Science-Fiction-Appeal eines zweibeinigen Humanoiden haben, aber seine praktische Intelligenz ist unbestreitbar. Sunday hat still und leise den Fehdehandschuh hingeworfen und deutet an, dass die Zukunft der Robotik nicht von Marionettenspielern, sondern einfach dadurch gestaltet wird, dass man einem Roboter zeigt, wie es geht.