14 فبراير 2026
4 دقيقة قراءة
أضفنا على جوجلأضف SciAm
لقد حصل الذكاء الاصطناعي للتو على أصعب اختبار رياضيات له حتى الآن. النتائج مختلطة
قدم الخبراء للذكاء الاصطناعي 10 مسائل رياضية يجب حلها في أسبوع. لقد بذل كل من OpenAI والباحثين والهواة قصارى جهدهم

الأرشيف المؤقت / مساهم عبر Getty Images
ويبدو أن الحكم يكمن في أن الذكاء الاصطناعي ليس على وشك أن يحل محل علماء الرياضيات.
هذه هي النتيجة المباشرة من تحدي “البرهان الأول” – والذي ربما يكون أقوى اختبار حتى الآن لقدرة نماذج اللغات الكبيرة (LLMs) على إجراء أبحاث رياضية. تم إجراء الاختبار من قبل 11 من كبار علماء الرياضيات في 5 فبراير، وتم إصدار نتائج الاختبار في وقت مبكر من صباح يوم عيد الحب. من السابق لأوانه أن نحدد بشكل قاطع عدد المسائل الرياضية العشرة التي تم تضمينها في التحدي والتي تم حلها بواسطة الذكاء الاصطناعي دون مساعدة بشرية. ولكن هناك شيء واحد واضح: لم يقترب أي من طلاب LLM من حلها جميعًا.
قدم علماء الرياضيات الذين ابتكروا First Proof 10 “lemmas” للذكاء الاصطناعي، وهو مصطلح رياضي يشير إلى النظريات البسيطة التي تمهد الطريق إلى نتيجة أكبر. هذه المسائل هي مخزون عالم الرياضيات العامل، وهي نوع من المسائل الصغيرة التي قد يسلمها المرء لطالب دراسات عليا موهوب. استهدف علماء الرياضيات حل المشكلات التي تتطلب بعض الأصالة لحلها، وليس مجرد مزيج من التقنيات القياسية، وفقًا لمحمد أبو زيد، أستاذ الرياضيات في جامعة ستانفورد وعضو فريق البرهان الأول.
حول دعم الصحافة العلمية
إذا كنت تستمتع بهذا المقال، ففكر في دعم صحافتنا الحائزة على جوائز من خلال الاشتراك. من خلال شراء اشتراك، فإنك تساعد على ضمان مستقبل القصص المؤثرة حول الاكتشافات والأفكار التي تشكل عالمنا اليوم.
التحدي، بينما يسلط الضوء على قيود الذكاء الاصطناعي، يسلط الضوء أيضًا على ثقافة فرعية ناشئة متحمسة للذكاء الاصطناعي داخل مجتمع الرياضيات. كانت لوحات المناقشة عبر الإنترنت وحسابات وسائل التواصل الاجتماعي المخصصة للرياضيات مليئة بالأدلة المزعومة من كبار علماء الرياضيات والطلاب الجامعيين المارقين على حد سواء. وقد سلط ذلك الضوء على مدى جدية الشركات الناشئة في مجال الذكاء الاصطناعي، بما في ذلك شركة OpenAI التي تصنع ChatGPT، في مواجهة التحدي المتمثل في تدريس ماجستير في القانون للقيام بالرياضيات.
يقول أبو زيد: “لم نتوقع أن يكون هناك هذا القدر من النشاط”. “لم نتوقع أن تأخذ شركات الذكاء الاصطناعي الأمر على محمل الجد وتضع هذا القدر من العمل فيه.”
كشف فريق First Proof عن حلول التحديات العشرة في وقت مبكر من يوم السبت، ونشروا تجاربهم الخاصة في محاولة حث حاملي الماجستير في القانون على حل المشكلات. ووجدوا أن الذكاء الاصطناعي يمكنه تقديم أدلة موثوقة لكل مشكلة، ولكن اثنين فقط كانا صحيحين، وهما المسألتان التاسعة والعاشرة. وتبين أن الدليل الذي كان مطابقًا تقريبًا للمسألة التاسعة موجود بالفعل. كانت المشكلة الأولى أيضًا “ملوثة” – حيث تمت أرشفة رسم تخطيطي للدليل من الموقع الإلكتروني لمؤلفه وعضو الفريق والحائز على ميدالية فيلدز لعام 2014، مارتن هيرير – لكن ما زال حاملو ماجستير إدارة الأعمال فشلوا في سد الثغرات.
يقول أبو زيد إن أسلوب الإثبات الذي توصل إليه حاملو شهادة الماجستير في القانون كان مفاجئًا بشكل خاص. ويقول: “إن الحلول الصحيحة التي رأيتها من أنظمة الذكاء الاصطناعي، لها نكهة رياضيات القرن التاسع عشر”. “لكننا نحاول بناء رياضيات القرن الحادي والعشرين.”
لا يبدو أن التقديمات الخارجية كانت أفضل بكثير. يبدو أن بعض التقديمات تستخدم درجات متفاوتة من المدخلات البشرية، ويبدو أن العديد منها كان نتيجة حوارات استمرت أسبوعًا تم فحصها من قبل علماء الرياضيات. والأهم من ذلك، أن قواعد البرهان الأول لا تسمح بإدخال أو حث رياضي بشري.
“بمجرد أن يكون هناك بشر، كيف يمكننا أن نحكم على مدى أهمية الإنسان ومدى الذكاء الاصطناعي؟” يقول لورين ويليامز، أستاذ دوايت باركر روبنسون للرياضيات في جامعة هارفارد وأحد علماء الرياضيات الذين أنشأوا الدليل الأول.
نشرت OpenAI عملها يوم السبت، نتيجة لسباق سريع لمدة أسبوع باستخدام أحدث نماذج الذكاء الاصطناعي الداخلية الخاصة بها والتي تعمل مع “تعليقات الخبراء” من علماء الرياضيات البشريين. قال كبير العلماء في الشركة جاكوب باتشوكي في منشور على وسائل التواصل الاجتماعي إنهم يعتقدون أن ستة من حلولهم العشرة “لديها فرصة كبيرة لأن تكون صحيحة”. وقد أشار علماء الرياضيات إلى وجود ثغرات محتملة في واحدة على الأقل من تلك الستة بالفعل.
وبصرف النظر عن مقدار المساعدة البشرية التي قدمتها أنظمة الذكاء الاصطناعي، يبدو أن الجزء الأكبر من التقديمات كان عبارة عن الكثير من الهراء المقنع للغاية. وقبل أن ينتهي التحدي، كان الخبراء قد شككوا بالفعل في عدد من الحلول المزعومة التي بدت في البداية ذات مصداقية.
سوف تستغرق الطلبات أيامًا حتى يتمكن الخبراء من فحصها بشكل صحيح. والحكم على ما إذا كان الدليل “أصليًا” حقًا أصعب من الحكم على صحته. يقول دانييل ليت، عالم الرياضيات في جامعة تورنتو، والذي لم يكن جزءًا من فريق First Proof: «لا يوجد شيء في الرياضيات لم يسبق له مثيل على الإطلاق».
يقول أبو زيد: “نحن نفكر في هذا كتجربة. وكان هدفنا هو الحصول على ردود الفعل”. يكتب الفريق أنهم يخططون لجولة ثانية مع ضوابط أكثر صرامة، وأنه سيتم إصدار المزيد من التفاصيل في 14 مارس.
بالنسبة لبعض علماء الرياضيات الذين كانوا يتتبعون تقدم الذكاء الاصطناعي، فإن النتائج الفاترة تتوافق مع توقعاتهم. يقول ليت: “لقد توقعت وجود حلين أو ثلاثة حلول صحيحة بشكل لا لبس فيه من النماذج المتاحة للجمهور”. “عشرة كان من شأنه أن يكون مفاجئا للغاية بالنسبة لي.”
ومع ذلك، حتى الحصول على بعض الحلول الصالحة للمشاكل على مستوى البحث من الذكاء الاصطناعي كان من المحتمل أن يكون مستحيلاً قبل بضعة أشهر فقط. يقول سكوت أرمسترونج، عالم الرياضيات بجامعة السوربون في فرنسا: «لقد سمعت بالفعل من زملائي أنهم في حالة صدمة». “هذه الأدوات قادمة لتغيير الرياضيات، وهذا يحدث الآن.”
ولكن بالنسبة للآخرين الذين يتابعون إنجازات الذكاء الاصطناعي عن كثب، لم يكن هذا عرضًا رائعًا.
يقول كيفين باريتو، وهو طالب جامعي في جامعة كامبريدج، والذي لم يكن جزءًا من فريق First Proof: “يبدو أن النماذج واجهت صعوبات”. وقد استخدم مؤخرًا الذكاء الاصطناعي لحل إحدى مسائل إردودبلاك، وهي عدد من التحديات التي طرحها عالم الرياضيات المجري بول إردبلاك. “لأكون صادقًا، نعم، أشعر بخيبة أمل إلى حد ما”.
حان الوقت للدفاع عن العلم
إذا استمتعت بهذا المقال، أود أن أطلب دعمكم. العلمية الأمريكية لقد عمل كمدافع عن العلوم والصناعة لمدة 180 عامًا، وربما تكون اللحظة الحالية هي اللحظة الأكثر أهمية في تاريخ القرنين.
لقد كنت العلمية الأمريكية مشترك منذ أن كان عمري 12 عامًا، وقد ساعد ذلك في تشكيل الطريقة التي أنظر بها إلى العالم. SciAm يثقفني ويسعدني دائمًا، ويلهمني شعورًا بالرهبة تجاه عالمنا الواسع والجميل. وآمل أن يفعل ذلك بالنسبة لك أيضا.
إذا كنت الاشتراك في العلمية الأمريكيةأنت تساعد في ضمان أن تغطيتنا تركز على البحث والاكتشاف الهادف؛ وأن لدينا الموارد اللازمة للإبلاغ عن القرارات التي تهدد المختبرات في جميع أنحاء الولايات المتحدة؛ وأننا ندعم العلماء الناشئين والعاملين على حد سواء في وقت لا يتم فيه الاعتراف بقيمة العلم نفسه في كثير من الأحيان.
وفي المقابل، تحصل على الأخبار الأساسية، ملفات بودكاست آسرة، ورسوم بيانية رائعة، لا يمكنك تفويت النشرات الإخبارية ومقاطع الفيديو التي يجب مشاهدتها، ألعاب التحدي، وأفضل الكتابة والتقارير في عالم العلوم. يمكنك حتى إهداء شخص ما الاشتراك.
لم يكن هناك وقت أكثر أهمية بالنسبة لنا للوقوف وإظهار أهمية العلم. آمل أن تدعمونا في تلك المهمة.

التعليقات