Google تكشف عن عائلة جديدة من نماذج الذكاء الاصطناعي في المستوى القادم

في يوم الثلاثاء، كشفت Google عن جيميني 2.5، وهي عائلة جديدة من نماذج الذكاء الاصطناعي التي تتوقف لـ"التفكير" قبل الإجابة على السؤال.

لإطلاق العائلة الجديدة من النماذج، تقوم Google بإطلاق Gemini 2.5 Pro Experimental وهو نموذج ذكاء اصطناعي متعدد الوسائط والتفكير الذي تزعم الشركة أنه النموذج الأكثر ذكاء حتى الآن. سيكون هذا النموذج متاحًا يوم الثلاثاء على منصة المطور الخاصة بالشركة، Google AI Studio، بالإضافة إلى تطبيق Gemini للمشتركين في خطة الذكاء الاصطناعي بقيمة 20 دولارًا شهريًا، Gemini Advanced.

وفي المستقبل، تقول Google إن جميع نماذجها الجديدة للذكاء الاصطناعي ستحتوي على إمكانيات التفكير.

ومنذ أن قامت OpenAI بإطلاق أول نموذج للتفكير في الشهر الثالث عام 2024، o1، فإن صناعة التكنولوجيا سابقت حتى تجاوزت إمكانيات هذا النموذج بنماذجها الخاصة. اليوم، لديهم شركة Anthropic، DeepSeek، Google، وxAI جميعها نماذج للتفكير في الذكاء الاصطناعي، حيث يستخدمون قدرات أكبر لمعالجة البيانات والتفكير في المشكلات قبل تقديم إجابة.

وقد ساعدت تقنيات التفكير النماذج الذكاء الاصطناعي في تحقيق إنجازات جديدة في مهام الرياضيات والبرمجة. يعتقد العديد في عالم التكنولوجيا أن نماذج التفكير ستكون عنصراً أساسياً في وكلاء الذكاء الاصطناعي، والأنظمة الذاتية التي تستطيع أداء المهام تقريباً بدون تدخل بشري. ومع ذلك، هذه النماذج أيضًا أكثر تكلفة.

قد قامت Google بتجربة نماذج التفكير في الذكاء الاصطناعي من قبل، وأطلقت سابقًا نسخة "تفكير" من Gemini في ديسمبر. ولكن Gemini 2.5 يمثل أحد أكثر محاولات الشركة جدية للتفوق على سلسلة نماذج "o" من OpenAI.

تزعم Google أن Gemini 2.5 Pro يتفوق على نماذجها السابقة المتقدمة، وبعض النماذج المنافسة الرائدة على عدة مقاييس. على وجه التحديد، تقول Google إنها صممت Gemini 2.5 لتتميز في إنشاء تطبيقات الويب الملهمة بصريًا وتطبيقات البرمجة الأجنبية.

في تقييم يقيس تحرير الشفرة، المسمى Aider Polyglot، تقول Google إن Gemini 2.5 Pro يحصل على نسبة 68.6%، متفوقًا على أفضل نماذج الذكاء الاصطناعي من OpenAI، Anthropic، ومختبر الذكاء الاصطناعي الصيني DeepSeek.

ومع ذلك، في اختبار آخر يقيس قدرات تطوير البرنامج، SWE-bench Verified، يحصل Gemini 2.5 Pro على نسبة 63.8%، يتفوق على o3-mini من OpenAI و R1 من DeepSeek، ولكن يحقق أداءً أقل من Claude 3.7 Sonnet من Anthropic الذي حصل على نسبة 70.3%.

في امتحان آخر يتكون من آلاف الأسئلة التي تتعلق بالرياضيات، والعلوم الإنسانية، والعلوم الطبيعية، تقول Google إن Gemini 2.5 Pro يحصل على نسبة 18.8%، ويؤدي بشكل أفضل من معظم النماذج الرئيسية المنافسة.

للبدء، تقول Google إن Gemini 2.5 Pro سيتم شحنه مع نافذة سياق تتكون من مليون توكن، مما يعني أن نموذج الذكاء الاصطناعي يمكنه احتضان حوالي 750،000 كلمة في مرة واحدة. وهذا أطول من سلسلة كتب "سيد الخواتم" بأكملها. وقريبا، سيدعم Gemini 2.5 Pro ضعف طول الإدخال (2 مليون توكن).

لم تقم Google بنشر تسعير API لـ Gemini 2.5 Pro. تقول الشركة إنها ستشارك المزيد خلال الأسابيع القادمة.