تحاول مجالات تتراوح من الروبوتات إلى الطب إلى العلوم السياسية تدريب أنظمة الذكاء الاصطناعي على اتخاذ قرارات ذات معنى من جميع الأنواع. على سبيل المثال، يمكن أن يساعد استخدام نظام الذكاء الاصطناعي للتحكم بذكاء في حركة المرور في مدينة مزدحمة سائقي السيارات في الوصول إلى وجهاتهم بشكل أسرع، مع تحسين السلامة أو الاستدامة.
لسوء الحظ، فإن تعليم نظام الذكاء الاصطناعي كيفية اتخاذ قرارات جيدة ليس بالمهمة السهلة.
لا تزال نماذج التعلم المعزز، التي تكمن وراء أنظمة صنع القرار المعتمدة على الذكاء الاصطناعي، تفشل في كثير من الأحيان عندما تواجه اختلافات صغيرة في المهام التي تم تدريبها على أدائها. في حالة حركة المرور، قد يواجه النموذج صعوبة في التحكم في مجموعة من التقاطعات ذات حدود سرعة مختلفة، أو عدد من الممرات، أو أنماط حركة المرور.
لتعزيز موثوقية نماذج التعلم المعزز للمهام المعقدة ذات التباين، قدم باحثون من معهد ماساتشوستس للتكنولوجيا خوارزمية أكثر كفاءة لتدريبها.
تختار الخوارزمية بشكل استراتيجي أفضل المهام لتدريب وكيل الذكاء الاصطناعي حتى يتمكن من أداء جميع المهام بفعالية…