في عام 2018، قام برنامج AlphaZero التابع لشركة Google DeepMind بتعليم نفسه ألعاب الشطرنج والشوغي والغو باستخدام التعلم الآلي وخوارزمية خاصة لتحديد أفضل التحركات للفوز بلعبة ضمن شبكة محددة. الآن، قام فريق من الباحثين في معهد كاليفورنيا للتكنولوجيا بتطوير خوارزمية مماثلة للروبوتات المستقلة – وهو نظام للتحكم في التخطيط واتخاذ القرار يساعد الروبوتات التي تتحرك بحرية على تحديد أفضل الحركات التي يجب القيام بها أثناء تنقلها في العالم الحقيقي.
يقول سون-جو تشونغ، أستاذ التحكم والأنظمة الديناميكية في معهد كاليفورنيا للتكنولوجيا وأحد كبار خريجي جامعة كاليفورنيا: “تضع الخوارزمية الخاصة بنا في الواقع إستراتيجيات ثم تستكشف جميع الحركات الممكنة والمهمة وتختار أفضلها من خلال المحاكاة الديناميكية، مثل لعب العديد من ألعاب المحاكاة التي تتضمن روبوتات متحركة”. عالم أبحاث في مختبر الدفع النفاث (JPL)، الذي يديره معهد كاليفورنيا للتكنولوجيا لصالح وكالة ناسا. “إن الابتكار المذهل هنا هو أننا استنتجنا طريقة فعالة للغاية للعثور على الحركة الآمنة المثالية التي لن تتمكن الطرق النموذجية القائمة على التحسين من العثور عليها أبدًا.”
ويصف الفريق هذه التقنية،…