قام مطور ببناء اختبار لمعرفة كيف تستجيب الروبوتات الدردشة الذكية لمواضيع جدلية

الأخبار الزرقاء

Sunday, April 20 2025

قام مطور مجهول الهوية بإنشاء ما يطلق عليها 'تقييم حرية التحدث' ، SpeechMap ، لنماذج الذكاء الاصطناعي التي تشغل الروبوتات الدردشة مثل ChatGPT من OpenAI و Grok من X. الهدف هو مقارنة كيفية معاملة النماذج المختلفة للمواضيع الحساسة والجدلية ، أوضح المطور لموقع TechCrunch ، بما في ذلك الانتقاد السياسي والأسئلة حول حقوق الإنسان والاحتجاج.

لقد ركزت شركات الذكاء الاصطناعي على ضبط كيفية تعامل نماذجها مع بعض المواضيع حيث يتهم بعض حلفاء البيت الأبيض روبوتات الدردشة الشهيرة بكونها زائدة عن الحاجة. لقد اتهم العديد من الحلفاء القريبين من الرئيس دونالد ترامب ، مثل إيلون ماسك ودافيد ساكس ، المستشار الخاص في مجال العملات المشفرة والذكاء الاصطناعي ، الروبوتات الدردشة بالرقد.

\n\t

على الرغم من أن أيًا من هذه الشركات لم ترد على الاتهامات مباشرةً ، إلا أن العديد منها تعهد بضبط نماذجها بحيث ترفض الإجابة على الأسئلة المثيرة للجدل بشكل أقل. على سبيل المثال ، لنماذج لاما الأخيرة من Meta ، قالت إنها ضبطت النماذج لا تؤيد 'بعض الآراء على حساب الآخرين' ، والرد على المزيد من الاقتراحات السياسية 'المحورة'.

قال مطور SpeechMap ، الذي يعرف باسم "xlr8harder" على X ، إنه كان يتحدى للمساعدة في إثراء النقاش حول ما يجب وما لا يجب على النماذج فعله.

'أعتقد أن هذه هي نوعيات المناقشات التي يجب أن تحدث في الجمهور ، ليس فقط داخل مقرات الشركات' ، قال xlr8harder لموقع TechCrunch عبر البريد الإلكتروني. 'لهذا السبب قمت ببناء الموقع للسماح لأي شخص باستكشاف البيانات بنفسه'.

يستخدم SpeechMap نماذج الذكاء الاصطناعي للحكم على مدى امتثال النماذج الأخرى لمجموعة معينة من التحفيزات الاختبارية. تلامس التحفيزات مجموعة متنوعة من المواضيع ، من السياسة إلى السرد التاريخي والرموز الوطنية. يسجل SpeechMap ما إذا كانت النماذج ترضي طلبًا "تمامًا" (أي تجيب عليه دون تردد) ، أو تعطي إجابات "متهربة" ، أو ترفض بشكل صريح الرد.

يعترف Xlr8harder بأن الاختبار لديه عيوب ، مثل 'الضوضاء' بسبب أخطاء مزود النموذج. من الممكن أيضًا أن تحتوي النماذج "القاضي" على تحيزات قد تؤثر على النتائج.

لكن بالافتراض أن المشروع تم إنشاءه بإيمان حسن والبيانات دقيقة ، تكشف SpeechMap عن بعض الاتجاهات المثيرة للاهتمام.

على سبيل المثال ، تجاهلت نماذج OpenAI مع مرور الوقت تدريجيًا الاستجابة للمحفزات المتعلقة بالسياسة ، وفقًا لـ SpeechMap. عائلة النماذج الأخيرة للشركة ، GPT-4.1 ، أكثر انفتاحًا قليلاً ، ولكن لا يزالوا خطوة واحدة أدنى من إصدار OpenAI العام الماضي.

قالت شركة OpenAI في فبراير إنها ستضبط النماذج المستقبلية لعدم اتخاذ موقف تحريري ، وتقديم وجهات نظر متعددة حول المواضيع المثيرة للجدل - كل ذلك في محاولة لجعل نماذجها تبدو أكثر 'حيادية'.

أداء النموذج OpenAI على SpeechMap مع مرور الوقت.الصورة الائتمانات: OpenAI

وبلا منازع ، النموذج الأكثر انفتاحًا من الجميع هو Grok 3 ، الذي طورته شركة xAI التي تمتلكها إيلون ماسك ، وفقًا لمقاييس SpeechMap. يقوم Grok 3 بتشغيل عدد من الميزات على X ، بما في ذلك روبوت الدردشة Grok.

\n\t

يستجيب Grok 3 ل٪ 96.2 من محفزات اختبار SpeechMap ، مقارنة بمتوسط 'معدل الامتثال' العالمي 71.3٪.

'على الرغم من أن نماذج OpenAI الأخيرة أصبحت أقل انفتاحًا مع الوقت ، خاصة على المحفزات السياسية الحساسة ، إلا أن xAI يتحرك في الاتجاه المعاكس' ، قال xlr8harder.

عندما أعلن ماسك عن Grok قبل نحو عامين تقريبًا ، قدم النموذج الذكاء الاصطناعي على أنه جريء ، غير مصفى ، ومضاد لـ 'الاستيقاظ' - بشكل عام ، على استعداد للإجابة على أسئلة مثيرة للجدل لنظم الذكاء الاصطناعي الأخرى لن تفعل ذلك. وقد أوفى ببعض تلك الوعود. فمثلاً ، عند طلب الاهانة ، ستكون Grok و Grok 2 سعداء للوفاء ، مستمرين في إخراج لغة ملونة لن تسمعها على الأرجح من ChatGPT.

لكن نماذج Grok قبل Grok 3 كانت تتهرب من المواضيع السياسية ولن تتجاوز بعض الحدود. في الواقع ، وجدت دراسة واحدة أن Grok يميل إلى اليسار السياسي في مواضيع مثل حقوق المتحولين جنسياً وبرامج التنوع وعدم المساواة.

وقد ألقى ماسك باللوم على بيانات تدريب Grok - صفحات ويب عامة - وتعهد بـ 'نقل Grok أقرب إلى الحياد سياسيًا.' باستثناء الأخطاء البارزة مثل حظر الإشارات المتضمنة لدونالد ترامب وماسك بشكل مؤقت ، يبدو أنه قد حقق هذا الهدف.

الأخبار الزرقاء

قام مطور ببناء اختبار لمعرفة كيف تستجيب الروبوتات الدردشة الذكية لمواضيع جدلية

Recent Posts

أكشاي باتيا يسجل 64 في ديترويت ليتصدر الجولة الأولى في كلاسيكو روكيت مورتجيج

تطلق NHL تطبيقًا للآيباد في المكتب الأمامي لتحديث معلومات التشكيلة والعقود وحد الراتب للفرق

تويتش يحد حجم تخزين البثوث المباشرة للمدونين على 100 ساعة من اللقطات والمرفوعات

الجناح الأحمر يفوز 5-1 على يوتا، وينقض سلسلة خسارته الست مباريات خارج الديار

كونور ماكديف يسجل في الوقت القاتل ليمنح كندا الفوز 3-2 على الولايات المتحدة في النهائي لمواجهة الأمة الأربعة