ثورة الروبوت مفتوحة المصدر: نيفيديا GR00T N1 تدشن عصر الروبوتات متعددة المهام
في مركز SAP الفسيح بمدينة سان خوسيه، وسط حماس كهربائي من آلاف المطورين والتقنيين، اجتاز جنسن هوانغ الرئيس التنفيذي لشركة نيفيديا المسرح بسترته الجلدية الأيقونية، متوقفًا بشكل درامي قبل أن يعلن: “لقد حل عصر الروبوتات متعددة المهام”. ذلك التصريح، الذي أُلقي في مؤتمر نيفيديا GTC ٢٠٢٥ يوم الثلاثاء، كان أكثر من مجرد مبالغة - كان كشفًا عما قد يصبح لحظة “أندرويد” لعالم الروبوتات: نيفيديا إسحاق GR00T N1، أول نموذج أساسي مفتوح للروبوتات البشرية في العالم.
عقل لكل جسد: ديمقراطية ذكاء الروبوت
على النقيض تمامًا من أنظمة الذكاء الاصطناعي المملوكة التي تهيمن على عناوين الأخبار اليوم، يمثل GR00T N1 نهجًا مختلفًا جوهريًا لذكاء الروبوت - نهج مبني على الانفتاح والوصول، ورؤية للروبوتات التي يمكنها التعميم عبر البيئات والمهام دون برمجة متخصصة لكل سيناريو.
“مع نيفيديا إسحاق GR00T N1 وأطر عمل جديدة لتوليد البيانات وتعلم الروبوت، سيفتح مطورو الروبوتات في كل مكان الحدود التالية في عصر الذكاء الاصطناعي،” قال هوانغ للحشد المكتظ في كلمته الرئيسية التي امتدت لأكثر من ساعتين. يلخص هذا التصريح استراتيجية نيفيديا الطموحة: إنشاء الذكاء الأساسي الذي سيشغل الجيل القادم من الروبوتات البشرية، ثم إتاحته مجانًا للمطورين في جميع أنحاء العالم.
ما يجعل هذا الإعلان مهمًا بشكل خاص هو كيفية معالجته للتحدي الأكثر استمرارًا في الروبوتات - قابلية بيانات التدريب للتوسع. كما أوضح جيم فان، مدير الأبحاث الأول في نيفيديا وقائد الذكاء الاصطناعي المجسد، في منشور على LinkedIn بعد الكلمة الرئيسية: “نحن في مهمة لدمقرطة الذكاء الاصطناعي الفيزيائي. قوة دماغ الروبوت العام، في راحة يدك - بمعلمات ٢ مليار فقط، يتعلم N1 من أكثر مجموعات بيانات الإجراءات الفيزيائية تنوعًا تم تجميعها على الإطلاق ويتفوق على وزنه.”
الروبوت ذو التفكير السريع والبطيء
في قلب GR00T N1 توجد بنية نظام مزدوج مستوحاة من الإدراك البشري - ما تسميه نيفيديا التفكير “السريع والبطيء”. يستمد النهج من نظريات علم الإدراك التي تفصل التفكير البشري إلى نظامين: الاستجابات البديهية التلقائية والتفكير المتعمد المنهجي.
“النظام ٢”، مكون التفكير البطيء، يستخدم نموذج لغة الرؤية لإدراك والتفكير في بيئة الروبوت والتعليمات التي يتلقاها، ثم يخطط للإجراءات المناسبة. “النظام ١”، مكون التفكير السريع، يترجم هذه الخطط إلى حركات روبوت دقيقة ومستمرة بمعدلات تنفيذ ١٢٠ هرتز. تسمح هذه البنية للروبوتات بالتعامل مع المهام المعقدة التي تتطلب كلاً من التداول والحركة السلسة - التقاط الأشياء والتلاعب بها بذراع واحدة أو بكلتا الذراعين وتنفيذ تسلسلات متعددة الخطوات.
في عرض توضيحي أثار حماس الجمهور بشكل واضح، أظهر هوانغ روبوت Neo البشري من 1X وهو يؤدي مهام ترتيب المنزل بشكل مستقل باستخدام سياسة مبنية على GR00T N1. أبرزت حركات الروبوت السلسة وفهمه الواضح لبيئته إمكانات النموذج للتطبيقات العملية.
كسر حاجز البيانات بواقع اصطناعي
ربما يكون الجانب الأكثر ثورية في نهج نيفيديا هو كيفية حلها للمشكلة الأساسية للروبوتات في البيانات. في حين يمكن لنماذج اللغة التدرب على مجموعة النصوص الهائلة للإنترنت، كان تعلم الروبوت مقيدًا تقليديًا بمحدودية العالم المادي - المتظاهر البشري يمكنه فقط إنتاج ٢٤ ساعة من بيانات التدريب يوميًا.
“بيانات التظاهر البشري محدودة بعدد الساعات في اليوم،” شرح الراوي في فيديو تقديم نيفيديا GR00T N1. للتغلب على هذا القيد، طورت نيفيديا أطر عمل لمضاعفة العروض التوضيحية الواقعية بشكل أسي إلى مجموعات بيانات اصطناعية ضخمة.
باستخدام المكونات الأولى من مخطط نيفيديا إسحاق GR00T، أنتجت الشركة ٧٨٠,٠٠٠ مسار اصطناعي - ما يعادل تسعة أشهر متواصلة من بيانات العرض البشري - في ١١ ساعة فقط. عند دمجها مع البيانات الحقيقية، حسنت مجموعة البيانات الاصطناعية هذه أداء GR00T N1 بنسبة ٤٠٪ مقارنة باستخدام البيانات الحقيقية وحدها.
يستخدم النهج ثلاثة مصادر للبيانات: بيانات التحكم عن بعد الإنساني الحقيقية (التي تم جمعها باستخدام أنظمة مثل Apple Vision Pro للتحكم الغامر)، وبيانات المحاكاة واسعة النطاق (التي تتيحها نيفيديا كمصدر مفتوح مع أكثر من ٣٠٠,٠٠٠ مسار)، وما يسميه فان “المسارات العصبية” - استخدام أحدث نماذج توليد الفيديو “لتخيل” بيانات اصطناعية جديدة بفيزياء دقيقة.
“باستخدام كلمات جنسن، ‘بيانات لا نهائية بشكل منهجي’!” ذكر فان في منشوره، مشيرًا إلى توصيف هوانغ لهذا النهج في توليد البيانات.
لحظة حرب النجوم: بلو يخطف الأضواء
في لحظة جعلت الجمهور يلتقط هواتفهم، قدم هوانغ “بلو”، وهو روبوت جذاب يبدو وكأنه خرج من فيلم حرب النجوم. الروبوت ذو الساقين، الذي يذكرنا بـ R2-D2 ولكن بشخصية متميزة خاصة به، تجول حول هوانغ، وأصدر أصواتًا تعبيرية، وأومأ برأسه لإسعاد الجمهور.
“قل لي أنّ ذلك لم يكن مذهلًا،” قال هوانغ وسط تصفيق الحضور بينما عرض بلو قدراته. لم يكن الروبوت مجرد عرض استعراضي - بل أظهر شراكة نيفيديا الجديدة مع Google DeepMind وDisney Research لبناء محرك فيزياء مفتوح المصدر جديد يُدعى Newton.
“نحتاج إلى محرك فيزياء مصمم للأجسام الصلبة واللينة الدقيقة جدًا، مصمم للقدرة على تدريب التغذية الراجعة اللمسية والمهارات الحركية الدقيقة وضوابط المشغلات،” شرح هوانغ. سيتم تحسين محرك Newton، المبني على إطار عمل NVIDIA Warp، لتعلم الروبوت وسيكون متوافقًا مع أطر المحاكاة مثل Google DeepMind’s MuJoCo ومختبر نيفيديا إسحاق.
قدم كايل لافلين، نائب الرئيس الأول في Walt Disney Imagineering للبحث والتطوير، سياقًا لمشاركة ديزني: “روبوتات BDX هي مجرد البداية. نحن ملتزمون بإحياء المزيد من الشخصيات بطرق لم يرها العالم من قبل، وهذا التعاون مع Disney Research ونيفيديا وGoogle DeepMind هو جزء أساسي من تلك الرؤية.”
فرصة بقيمة ١٠ تريليون دولار
الرهانات في ثورة الروبوتات هذه هائلة. وصف هوانغ الروبوتات بأنها “الصناعة التالية بقيمة ١٠ تريليون دولار،” معالجة النقص العالمي في العمالة المقدر بأكثر من ٥٠ مليون شخص.
بالنسبة للشركات التي تطور الروبوتات البشرية، يقدم GR00T N1 بداية كبيرة. بدلاً من بناء ذكاء الروبوت من الصفر، يمكن للمطورين الاستفادة من نموذج نيفيديا الأساسي وتخصيصه للروبوتات أو المهام المحددة من خلال التدريب اللاحق.
أكد بيرنت بورنيش، الرئيس التنفيذي لـ 1X Technologies، أحد الشركاء المبكرين الذين يستخدمون GR00T N1، على هذه الميزة: “يوفر نموذج نيفيديا GR00T N1 اختراقًا رئيسيًا لتفكير الروبوت والمهارات. مع كمية ضئيلة من بيانات التدريب اللاحق، تمكنا من النشر الكامل على NEO Gamma - مما يعزز مهمتنا في إنشاء روبوتات ليست مجرد أدوات، بل رفقاء يمكنهم مساعدة البشر بطرق هادفة لا تقدر بثمن.”
من بين مطوري الروبوتات البشرية الرائدين الآخرين الذين حصلوا على وصول مبكر شركات Agility Robotics وBoston Dynamics وMentee Robotics وNEURA Robotics.
عبر التجسيد: التحول غير المتوقع
في حين أن الروبوتات البشرية هي التركيز الأساسي لـ GR00T N1، كشف فان عن قدرة مثيرة للاهتمام: دعم عبر التجسيد. “لقد قمنا بضبطه الدقيق للعمل على ذراع الروبوت HuggingFace LeRobot SO100 البالغ سعره ١١٠ دولارًا!” كتب. هذا يوضح أن فوائد النموذج الأساسي يمكن أن تمتد إلى ما هو أبعد من منصات الإنسان الآلي باهظة الثمن إلى أجهزة أكثر يسهل الوصول إليها.
كان حماس فان لهذا التطور واضحًا في استنتاجه: “دماغ الروبوت المفتوح يعمل على أجهزة مفتوحة. يبدو مناسبًا تمامًا. دعونا نحل مشكلة الروبوتات، معًا، رمزًا تلو الآخر.”
الطريق إلى الأمام
نموذج GR00T N1 وبيانات التدريب وسيناريوهات تقييم المهام متاحة الآن على Hugging Face وGitHub، مع توفر مخطط نيفيديا إسحاق GR00T لتوليد حركة التلاعب الاصطناعية كعرض تفاعلي على build.nvidia.com.
بالنسبة للمطورين الراغبين في العمل مع هذه النماذج، أعلنت نيفيديا أيضًا عن كمبيوتر الذكاء الاصطناعي الشخصي DGX Spark، مما يوفر نظامًا جاهزًا لتوسيع قدرات GR00T N1 للروبوتات والمهام والبيئات الجديدة دون برمجة مخصصة واسعة.
من المتوقع أن يكون محرك فيزياء Newton متاحًا في وقت لاحق من هذا العام، مما يوسع مجموعة الأدوات لمطوري الروبوتات.
ديمقراطية الذكاء الاصطناعي الفيزيائي
ما يميز نهج نيفيديا هو تركيزها على الانفتاح وسهولة الوصول. من خلال إتاحة GR00T N1 وأدواته المرتبطة على نطاق واسع، تضع نيفيديا نفسها ليس كبناء وحيد لذكاء الروبوت، ولكن كطبقة أساسية يمكن لمجتمع عالمي من المطورين الابتكار عليها.
مع انتقال الروبوتات من التطبيقات الصناعية المتخصصة إلى القدرات العامة عبر بيئات متنوعة، يمكن أن يسرع نهج نيفيديا المفتوح الابتكار بطرق مماثلة لكيفية تحويل البرمجيات مفتوحة المصدر لعالم الحوسبة. الشركة التي بنت سمعتها على معالجة الرسومات للألعاب تضع الآن الأساس لمستقبل تكون فيه الروبوتات الذكية شائعة مثل الهواتف الذكية اليوم.
في مجتمع الروبوتات، كانت ردود الفعل على GR00T N1 متحمسة، على الرغم من بقاء بعض الشكوك حول القيود الحالية لأجهزة الروبوت. كما ذكر أحد مؤسسي شركات الروبوتات ردًا على تحديث GR00T السابق، “ستكون جيدة إذا كانت أجهزة الروبوت قابلة للمقارنة بالإنسان. وهي ليست كذلك. نقطة الألم هي أن الروبوتات تقريبات خرقاء وغير مرنة وليست قريبة من المكافئ البشري.”
ومع ذلك، فإن رؤية نيفيديا واضحة: إذا كان للروبوتات أن تصبح متعددة الاستخدامات ومفيدة حقًا عبر السيناريوهات التي لا تحصى للحياة البشرية، فإنها تحتاج إلى ذكاء عام يمكنه التكيف بسرعة مع البيئات والمهام الجديدة. مع GR00T N1، أصبح هذا المستقبل أقرب بخطوة كبيرة.
“لقد حل عصر الروبوتات متعددة المهام،” أعلن هوانغ. بالنسبة لمجال غالبًا ما بالغ في الوعود وقصر في التسليم، يمثل نهج نيفيديا المنهجي لذكاء الروبوت - الذي يجمع بين النماذج الأساسية وتوليد البيانات الاصطناعية والتعاون المفتوح - ربما المسار الأكثر مصداقية حتى الآن نحو جعل هذا الإعلان حقيقة.