يستخدم الناس الآن Mario Super لقياس الذكاء الاصطناعي

\n

هل كان Pokémon عقبة صعبة للذكاء الاصطناعي؟ يؤكد مجموعة من الباحثين أن Super Mario Bros. أصعب حتى.

\n\n

أطلقت مختبرات Hao AI، التابعة لجامعة كاليفورنيا في سان دييغو، الذكاء الاصطناعي في ألعاب Super Mario Bros. الحية. حقق Claude 3.7 من Anthropic أفضل أداء، تلاه Claude 3.5. بينما واجه Gemini 1.5 Pro من Google و GPT-4o من OpenAI صعوبات.

\n\n
\n
\n
\n
\n\n
\n
\n
\n
\n\n

لم تكن نسخة Super Mario Bros. نفسها الصادرة في عام 1985 بالتحديد. كانت اللعبة تعمل في محاكي ومتكاملة مع إطار عمل يُدعى GamingAgent، ليمنح الذكاء الاصطناعي السيطرة على ماريو.

\n\n
حقوق الصورة:Hao Lab

قام GamingAgent، الذي طوّرته Hao داخل المنزل، بتغذية الذكاء الاصطناعي بتعليمات أساسية، مثل، "إذا كانت هناك عقبة أو عدو بالقرب، تحرك / قفز لليسار لتجنبه" وصور شاشة اللعبة. ثم قام الذكاء الاصطناعي بتوليد مداخل في شكل رمز Python للتحكم في ماريو.

\n\n

مع ذلك، يقول Hao أن اللعبة اضطرت كل نموذج إلى "تعلم" التخطيط للحركات المعقدة وتطوير استراتيجيات اللعب. وبشكل مثير للاهتمام، وجدت المختبرات أن النماذج العقلانية مثل o1 من OpenAI، التي "تفكر" في المشاكل خطوة بخطوة للوصول إلى الحلول، حققت أداءً أسوأ من النماذج "غير العقلانية"، على الرغم من كونها عمومًا أقوى على معظم المعايير.

\n\n

أحد الأسباب الرئيسية التي تواجه النماذج العقلانية صعوبة في اللعب في ألعاب فعلية مثل هذه هو أنها تستغرق وقتًا - ثوان، عادةً - لاتخاذ القرارات بشأن الأفعال، وفقًا للباحثين. في Super Mario Bros.، الوقت هو كل شيء. ثانية يمكن أن تعني الفارق بين القفز بأمان وسقوط إلى الموت.

\n\n

يُستخدم الألعاب لقياس الذكاء الاصطناعي منذ عقود. لكن بعض الخبراء قد شككوا في حكم ربط مهارات الذكاء الاصطناعي باللعب، والتقدم التكنولوجي. على عكس العالم الحقيقي، تميل الألعاب إلى أن تكون مجردة وبسيطة نسبيًا، وتوفر كمية نظرية لا حصر لها من البيانات لتدريب الذكاء الاصطناعي.

\n\n

تشير مؤشرات الألعاب الجديدة والبراقة إلى ما وصفه أندريه كارباثي، عالم البحوث والعضو المؤسس في OpenAI، بـ "أزمة التقييم".

\n\n

"ليس لدي فعلياً أي معايير [للذكاء الاصطناعي] للنظر إليها الآن"، كتب في منشور على X. "ملخص قصير لردود فعلي هو أنني لا أعرف حتى مدى جودة هذه النماذج في الوقت الحالي".

\n\n

على الأقل يمكننا مشاهدة الذكاء الاصطناعي يلعب ماريو على الأقل.