Robótica não terá momento ChatGPT, dizem veteranos da indústria

O capital de risco corre a rodos, as demonstrações no YouTube acumulam milhões de visualizações e as promessas tornam-se mais audazes a cada trimestre que passa. Depois de vermos grandes modelos de linguagem como o ChatGPT da OpenAI conquistarem o mundo digital aparentemente do dia para a noite, todos fazem a mesma pergunta de muitos mil milhões de dólares: quando é que a robótica terá o seu “momento ChatGPT”?

De acordo com dois nomes que têm estado na linha da frente da IA incorporada (embodied AI), a resposta é simples: não vai ter. E convém ouvi-los. Jonathan W. Hurst, cofundador da Agility Robotics (os cérebros por trás do humanoide Digit), e Hans Peter Brøndmo, que liderou o projeto “moonshot” Everyday Robots na Google X, escreveram um choque de realidade mais do que necessário. Estão aqui para despejar um balde de água gelada industrial sobre o comboio do hype, argumentando que não existe um avanço único e mágico da IA que venha salvar o dia. O caminho para um mundo povoado por robôs úteis é pavimentado por um trabalho de engenharia extenuante, incremental e profundamente longe do glamour.

Com o financiamento de risco para a robótica a atingir os 6,1 mil milhões de dólares em 2024 (acima dos 5,1 mil milhões em 2023), as apostas são astronomicamente altas. Mas, como defendem Hurst e Brøndmo, o abismo entre uma demonstração vistosa e um robô comercialmente viável, seguro e fiável continua a ser enorme.

A Grande Ilusão: Desconstruindo a Demo do YouTube

Todos já as vimos. Vídeos de robôs humanoides a executar mortais perfeitos, a realizar danças sincronizadas ou em coreografias de artes marciais milimetricamente ensaiadas. A mais recente sensação viral mostrou os humanoides da Unitree Robotics numa performance de kung fu na Gala do Festival da Primavera de 2026, na China — uma exibição impressionante de coordenação a poucos metros de crianças que também atuavam.

Video thumbnail

Hurst e Brøndmo apressam-se a apontar o que os especialistas já sabem há anos: “nunca confies num vídeo de um robô no YouTube”. Estas performances, embora tecnicamente deslumbrantes, são o equivalente robótico de um espetáculo da Broadway meticulosamente planeado. Demonstram um controlo motor de baixo nível e uma coreografia notáveis, mas o seu nível de autonomia está mais próximo de um robô de linha de montagem do que de uma máquina pensante. O mundo real — caótico, imprevisível e teimosamente sem guião — é um bicho completamente diferente. Este é o caso clássico do Paradoxo de Moravec: tarefas que são triviais para um humano, como navegar num quarto desarrumado, são monumentalmente difíceis para um robô, enquanto cálculos complexos são canja.

Os Dados: Um Desafio Hercúleo por Resolver

Os LLMs tiveram uma vantagem massiva: foram treinados com a internet, uma base de dados colossal de texto e imagens gerada por humanos. Os robôs não têm esse luxo. Para aprender, um robô precisa de dados do mundo físico, um espaço de dimensões infinitas onde as variáveis incluem tudo, desde ângulos de articulação e feedback de força até condições de iluminação e os movimentos imprevisíveis das pessoas.

A escala deste desafio é assombrosa. Na Everyday Robots, a equipa de Brøndmo executou 240 milhões de instâncias de robôs simulados em 2022 apenas para treinar um modelo a separar lixo com uma competência mínima. E isso foi para um único conjunto de competências relativamente simples. Agora, multipliquem esse esforço pelo número quase infinito de tarefas que esperamos que os robôs de uso geral realizem. É um problema de recolha de dados de uma magnitude completamente diferente e que permanece, em grande parte, sem solução. O projeto acabou por ser encerrado no início de 2023 como parte de medidas mais amplas de corte de custos na casa-mãe, a Alphabet.

Não haverá uma “IA Robótica” única

A ideia de um modelo de IA único e monolítico que possa pilotar qualquer robô — com rodas, pernas, voador ou nadador — é pura ficção científica. As realidades físicas de diferentes corpos e ambientes são demasiado vastas. Os autores defendem que a arquitetura vencedora será o que chamam de “IA agêntica”. Isto envolve modelos de coordenação de alto nível que conseguem raciocinar, planear e delegar tarefas a um conjunto de ferramentas de IA mais pequenas e especializadas. Um modelo pode tratar da locomoção bípede, outro da manipulação de precisão e um terceiro seria dedicado à interação segura entre humanos e robôs.

Esta abordagem modular, argumentam, levará a uma “Explosão Cambriana” de máquinas inteligentes e úteis. Não será um único “Big Bang”, mas sim um florescimento de capacidades diversas e especializadas que, quando orquestradas corretamente, criam uma máquina verdadeiramente competente.

O Hardware continua a ser um pesadelo

Apesar de todo o foco na IA, um robô continua a ser um objeto físico. E o hardware, particularmente as partes que lhe permitem interagir com o mundo, continua a ser o principal estrangulamento. A maioria dos robôs industriais utiliza atuadores rígidos e potentes que são fantásticos para precisão numa área isolada, mas desastrosos num ambiente humano. Uma simples colisão acidental pode ser catastrófica.

Os humanos, por contraste, são “complacentes” (flexíveis). Usamos o tato e o feedback de força constantemente, quer estejamos a tentar acertar com a chave na fechadura ou a apoiar-nos num balcão. Para que os robôs consigam isto, precisam de uma nova classe de atuadores que sejam sensíveis, flexíveis e conscientes da força. Embora estes existam em laboratórios, ainda não estão disponíveis à escala, custo ou fiabilidade necessários para uma implementação em massa. A IA mais brilhante do mundo é inútil se o seu corpo for um fardo desajeitado e perigoso.

O Valor Real vem de resolver problemas “fáceis”

A verdade final, e talvez a mais importante, é que o valor no mundo real não vem de dar mortais para trás. Vem de realizar de forma fiável os trabalhos mundanos, repetitivos e muitas vezes fisicamente desgastantes que os humanos não querem fazer. É aqui que a teoria encontra a prática — ou, neste caso, onde os pés do robô tocam o chão do armazém.

Ambos os autores falam por experiência própria. Quando a Agility Robotics começou a implementar o Digit em instalações de clientes com parceiros como a GXO Logistics, perceberam rapidamente que o seu primeiro grande obstáculo não era a execução da tarefa — era a segurança. Isto levou a um esforço de engenharia de vários anos para redesenhar o robô para uma operação segura em espaços humanos. Da mesma forma, a equipa da Everyday Robots na Google aprendeu em primeira mão como um ambiente aparentemente simples, como a cafetaria de um escritório, é caótico e difícil para um robô que tenta limpar mesas.

Video thumbnail

Esta experiência no mundo real é o único caminho a seguir. É ela que informa a arquitetura da IA, destaca as deficiências do hardware e ancora roteiros ambiciosos na dura realidade das necessidades dos clientes. Não existe um algoritmo milagroso ou um conjunto de dados que substitua o processo lento, doloroso e caro de implementar robôs, vê-los falhar e projetar meticulosamente as soluções. O futuro da robótica está a chegar, mas chegará um passo deliberado e bem arquitetado de cada vez.