
هل كان Pokémon عقبة صعبة للذكاء الاصطناعي؟ يؤكد مجموعة من الباحثين أن Super Mario Bros. أصعب حتى.
\n\nأطلقت مختبرات Hao AI، التابعة لجامعة كاليفورنيا في سان دييغو، الذكاء الاصطناعي في ألعاب Super Mario Bros. الحية. حقق Claude 3.7 من Anthropic أفضل أداء، تلاه Claude 3.5. بينما واجه Gemini 1.5 Pro من Google و GPT-4o من OpenAI صعوبات.
\n\nلم تكن نسخة Super Mario Bros. نفسها الصادرة في عام 1985 بالتحديد. كانت اللعبة تعمل في محاكي ومتكاملة مع إطار عمل يُدعى GamingAgent، ليمنح الذكاء الاصطناعي السيطرة على ماريو.
\n\n
قام GamingAgent، الذي طوّرته Hao داخل المنزل، بتغذية الذكاء الاصطناعي بتعليمات أساسية، مثل، "إذا كانت هناك عقبة أو عدو بالقرب، تحرك / قفز لليسار لتجنبه" وصور شاشة اللعبة. ثم قام الذكاء الاصطناعي بتوليد مداخل في شكل رمز Python للتحكم في ماريو.
\n\nمع ذلك، يقول Hao أن اللعبة اضطرت كل نموذج إلى "تعلم" التخطيط للحركات المعقدة وتطوير استراتيجيات اللعب. وبشكل مثير للاهتمام، وجدت المختبرات أن النماذج العقلانية مثل o1 من OpenAI، التي "تفكر" في المشاكل خطوة بخطوة للوصول إلى الحلول، حققت أداءً أسوأ من النماذج "غير العقلانية"، على الرغم من كونها عمومًا أقوى على معظم المعايير.
\n\nأحد الأسباب الرئيسية التي تواجه النماذج العقلانية صعوبة في اللعب في ألعاب فعلية مثل هذه هو أنها تستغرق وقتًا - ثوان، عادةً - لاتخاذ القرارات بشأن الأفعال، وفقًا للباحثين. في Super Mario Bros.، الوقت هو كل شيء. ثانية يمكن أن تعني الفارق بين القفز بأمان وسقوط إلى الموت.
\n\nيُستخدم الألعاب لقياس الذكاء الاصطناعي منذ عقود. لكن بعض الخبراء قد شككوا في حكم ربط مهارات الذكاء الاصطناعي باللعب، والتقدم التكنولوجي. على عكس العالم الحقيقي، تميل الألعاب إلى أن تكون مجردة وبسيطة نسبيًا، وتوفر كمية نظرية لا حصر لها من البيانات لتدريب الذكاء الاصطناعي.
\n\nتشير مؤشرات الألعاب الجديدة والبراقة إلى ما وصفه أندريه كارباثي، عالم البحوث والعضو المؤسس في OpenAI، بـ "أزمة التقييم".
\n\n"ليس لدي فعلياً أي معايير [للذكاء الاصطناعي] للنظر إليها الآن"، كتب في منشور على X. "ملخص قصير لردود فعلي هو أنني لا أعرف حتى مدى جودة هذه النماذج في الوقت الحالي".
\n\nعلى الأقل يمكننا مشاهدة الذكاء الاصطناعي يلعب ماريو على الأقل.