اختبار «First Proof» يكشف حدود الذكاء الاصطناعي في مواجهة الإبداع الرياضي البشري

أظهرت نتائج تجربة علمية دولية حديثة، حملت اسم «First Proof»، أن أنظمة الذكاء الاصطناعي لا تزال بعيدة عن منافسة العقل البشري في القدرة على حل المسائل الرياضية التي تتطلب مستويات عالية من الإبداع والتحليل العميق. وقد كشف هذا الاختبار عن فجوة واضحة بين الأداء البشري وقدرات النماذج الذكية في هذا المجال.

ووفقاً لما ذكره موقع Scientific American الأمريكي المتخصص في العلوم والتكنولوجيا، فقد انطلق الاختبار في الخامس من شباط، وتضمن تحدياً للنماذج الذكية لإيجاد براهين أصلية لعشر مسائل رياضية معقدة في غضون أسبوع واحد. كان الهدف الأساسي من هذا التحدي هو قياس مدى قدرة الذكاء الاصطناعي على إنتاج تفكير رياضي مبتكر، بدلاً من الاكتفاء بتطبيق الأساليب والمعادلات المعروفة مسبقاً.

تضمنت المسائل المطروحة ما يُعرف بـ«الليمات» الرياضية، وهي خطوات تمهيدية أساسية تُستخدم للوصول إلى نتائج رياضية أكبر وأكثر تعقيداً. وعادةً ما تُقدم هذه الليمات لطلبة الدراسات العليا المتميزين لاختبار قدراتهم التحليلية والإبداعية.

من جانبه، أوضح الأستاذ محمد أبو زيد، أستاذ الرياضيات في جامعة ستانفورد وأحد المشاركين في إعداد الاختبار، أن الغاية من هذه التجربة كانت تتمثل في تقييم التفكير الحقيقي للنماذج الذكية وقدرتها على بناء برهان رياضي متماسك ومنطقي بشكل مستقل.

بعد انتهاء المهلة المحددة، كشفت النتائج أن الذكاء الاصطناعي تمكن من تقديم حلين صحيحين فقط من أصل عشرة مسائل. أما بقية الإجابات، فبالرغم من أنها بدت مقنعة من حيث الصياغة اللغوية، إلا أنها احتوت على ثغرات منطقية واضحة أو أفكار غير مكتملة. كما تبين أن بعض هذه الحلول استند إلى براهين رياضية معروفة وموجودة مسبقاً، مما يقلل من جانب الابتكار المطلوب.

أشار الباحثون إلى أنه على الرغم من التطور الكبير الذي يشهده الذكاء الاصطناعي وقدرته على الاقتراب من بعض الحلول المعقدة، فإنه لا يزال غير قادر على استبدال الباحثين البشريين في المجالات التي تتطلب إبداعاً رياضياً خالصاً. ومع ذلك، أكدوا على إمكانية توظيفه مستقبلاً كأداة مساعدة داعمة وفعالة للعمل البحثي، مما يعزز من قدرات الباحثين بدلاً من استبدالهم.

وقد تولى تنفيذ اختبار «First Proof» فريق علمي مكون من أحد عشر عالماً في الرياضيات من جامعات ومؤسسات أكاديمية دولية مرموقة. ضم الفريق أسماء بارزة مثل الأستاذ محمد أبو زيد، ومارتن هايرر، ودانيال سبيلمان، وأندرو ج. بلومبرغ، ونيهيل سريفاستافا. وقد أشرف هذا الفريق على إعداد المسائل الرياضية المعقدة وتقييم الحلول المقدمة من نماذج الذكاء الاصطناعي بدقة، بهدف قياس قدرتها على إنتاج براهين رياضية أصلية ومبتكرة.