Treino de Robôs: Professores Humanos ou Maratona de YouTube?

A corrida desenfreada para construir um robô humanoide verdadeiramente capaz está rapidamente a deixar de ser uma questão de hardware para se transformar numa pergunta filosófica basilar: qual a melhor forma de ensinar uma máquina? De um lado, empresas como a Sunday apostam tudo num exército de instrutores humanos. Do outro, gigantes como a Tesla e a Nvidia esperam que os seus robôs aprendam a golpes de vídeos do YouTube. Esta clivagem estratégica molda todo o setor, e a verdade é que ninguém parece ter a resposta na ponta da língua.

A Sunday joga todas as suas fichas na aprendizagem por imitação (imitation learning), munindo 500 “memory developers” com luvas especiais para registar, com um rigor quase cirúrgico, dados de alta qualidade para cada tarefa imaginável. A empresa gaba-se de que este método lhe permite treinar e avaliar uma nova tarefa a cada uma ou duas semanas, dando à luz o que apelida de “robô mais rápido do mundo a aprender”. É uma abordagem prática, quase artesanal, à recolha de dados, onde a qualidade se sobrepõe à mera quantidade.

Video thumbnail

Este modelo centrado no humano não é, contudo, monolítico. A norueguesa 1X Technologies também se socorre da orientação humana, mas, em vez de luvas e sessões cuidadosamente orquestradas, prefere lançar os seus 1X Neo: O mordomo de IA chegou — mas prepare o bolso robôs diretamente em cenários do mundo real para que aprendam através da teleoperação. É menos uma sala de aula e mais uma aprendizagem no terreno, um verdadeiro estágio em tempo real. Entretanto, a Figure aposta na criação de “Neura Gyms” físicos, ambientes estruturados onde os seus robôs podem treinar em tarefas específicas, por vezes com o apoio de parcerias de peso como a BMW.

Depois, temos o campo do “basta ver vídeos”. A Tesla não se tem coibido de expressar o seu objetivo de que o bot Optimus aprenda tarefas apenas observando vídeos de humanos a executá-las. A Nvidia, com a sua plataforma NVIDIA cria uma 'Matrix' para robôs com a plataforma Cosmos , também está a tirar partido da simulação e de uma montanha de dados de vídeo à escala da internet para treinar os seus foundation models para robótica. Este método acena com uma escala colossal – afinal, há mais horas de vídeos “como fazer” na internet do que qualquer exército de “memory developers” jamais conseguiria produzir – mas debate-se com a falta de contexto, a incorporação física e o ruído ensurdecedor dos dados não estruturados.

A Relevância da Questão

O cisma na metodologia de treino representa o maior calcanhar de Aquiles na criação de um robô verdadeiramente de propósito geral. No cerne deste debate está um problema clássico de qualidade versus quantidade, amplificado pelas complexidades da interação física.

Será que um dataset meticulosamente curado e de alta qualidade, proveniente de demonstradores humanos — como o que a Sunday AI: Robôs aprendem tarefas domésticas sem 'marionetes' está a construir — detém a chave para uma execução de tarefas infalível? Ou será que o volume puro e caótico de dados da internet acabará por traçar um caminho mais robusto e escalável rumo à inteligência, como a Tesla e a Nvidia parecem advogar? A empresa que conseguir desvendar este quebra-cabeças da aprendizagem escalável não se limitará a construir um robô melhor; é bem provável que venha a ditar os contornos da próxima década de inteligência artificial e automação.