مطورون يتوقعون اقتراب الذكاء الاصطناعي من اجتياز الامتحان الأخير للبشرية

علوم وتكنولوجيا مارس 31, 2026

يرى مطورون أن أنظمة الذكاء الاصطناعي قد تتمكن خلال الأشهر المقبلة من تحقيق العلامة الكاملة في أحد أصعب الاختبارات المعرفية في العالم، المعروف باسم “الامتحان الأخير للبشرية” (HLE).

ويهدف هذا الاختبار، الذي وضعه مختصون في قطاع التكنولوجيا، إلى قياس مستوى ذكاء الأنظمة الحديثة، ويضم 2500 سؤال منتقاة بعناية، تغطي نحو 100 موضوع مختلف، من علوم الصواريخ إلى الأساطير وعلم وظائف الأعضاء، على أن يتطلب كل سؤال مستوى معرفة يعادل درجة الدكتوراه.

وقبل عامين فقط، لم يتمكن نظام ChatGPT التابع لشركة OpenAI من تسجيل أكثر من 3% في هذا الاختبار، كما لم تحقق أنظمة “غوغل” وAnthropic نتائج أفضل بكثير، وهو ما اعتُبر حينها دليلاً على وجود فجوة كبيرة بين الذكاء الاصطناعي وأفضل الخبراء البشريين.

لكن هذا الواقع بدأ يتغير سريعًا، إذ سجل نظام Gemini التابع لـ”غوغل” في الشهر الماضي نسبة 45.9%، بعدما كان قد حقق 18.8% فقط قبل أشهر من ذلك، فيما وصل نظام Claude AI من شركة Anthropic إلى 34.2%.

وقال كالفن تشانغ، رئيس الأبحاث في شركة Scale المسؤولة عن الاختبار، إن الهدف كان تصميم امتحان لا يستطيع حله إلا عدد محدود جدًا من الخبراء حول العالم، لكنه أشار إلى أن التطور الذي حققته نماذج اللغة خلال السنوات الأخيرة كان لافتًا للغاية.

من جانبها، قالت كيت أولشيفسكا، مديرة المنتج في Google DeepMind، إن الوصول إلى العلامة الكاملة قد يحدث بسرعة كبيرة إذا كان هذا هو الهدف الأساسي للمطورين.

ويُنظر إلى تحقيق 100% في هذا الاختبار على أنه محطة مهمة، لأن مبتكريه وصفوه بأنه “آخر اختبار أكاديمي مغلق من نوعه”، ما يعني أن تجاوز الذكاء الاصطناعي له سيدفع الباحثين مستقبلاً إلى ابتكار اختبارات بأسئلة لا يعرف البشر أنفسهم إجاباتها.

وقد جرى تطوير الاختبار بالتعاون مع “مركز سلامة الذكاء الاصطناعي”، وهو منظمة غير ربحية، بهدف قياس عمق المعرفة وقدرات التفكير لدى الأنظمة الذكية. وفي أيلول 2024، أطلق القائمون عليه دعوة عالمية لتقديم الأسئلة، مع جائزة بلغت 500 ألف دولار.

وشارك خبراء من نحو 50 دولة، وقدموا قرابة 70 ألف سؤال، قبل أن يتم تقليصها إلى 13 ألفًا بعد استبعاد الأسئلة التي تمكنت الأنظمة الحالية من الإجابة عنها، ثم اختيار 2500 سؤال فقط في المرحلة النهائية.

ويشبه بعض الخبراء هذا التقدم بما حدث عام 1997 عندما نجح حاسوب IBM “ديب بلو” في هزيمة بطل العالم في الشطرنج غاري كاسباروف، كما يلفتون إلى أن اختبارات أخرى مثل MMLU، الذي طُرح عام 2020، أصبحت سهلة نسبيًا على الأنظمة بعد أن تجاوزت نتائجها فيه 90%.

ورغم هذا التقدم، يرى باحثون أن هناك مجالات لا تزال تمنح البشر أفضلية واضحة، خصوصًا في التخصصات العملية مثل الجراحة، وفي المهارات التي تعتمد على الحكم السليم والإبداع واتخاذ القرار.

:شارك الخبر