في إحدى الأمسيات الخاملة في أكتوبر الماضي، مارس مهتاب ساوني هواية قديمة. بدأ في تصفح موقع erdosproblems.com، وهو سجل محدث يضم 1179 تخمينًا تركها عالم الرياضيات غريب الأطوار الذي لا يعرف الكلل في القرن العشرين بول إردودلاك.
كان ساوني، عالم الرياضيات في جامعة كولومبيا، مهتمًا دائمًا بمسائل إيردوبلاك، والتي تتراوح من الفضول البسيط إلى المشكلات المركزية المفتوحة في نظرية الأعداد والتوافقيات.
لقد واجه المشكلة رقم 339، التي بدت واضحة للغاية بحيث لا يمكن أن تظل “مفتوحة” بعد ما يقرب من عقدين من وفاة إيرودلاك. لقد رأى تخمينات مماثلة من قبل. “كان هناك عدد من المشاكل التي بدا عليها هذا النوع أيضاً يقول ساوني: “يمكن الوصول إليه بسهولة. في الماضي، كان يلجأ إلى Google. وبعد ذلك، في نهاية المطاف، مع ما يكفي من البحث، سأجد إشارة إلى الحل”.
حول دعم الصحافة العلمية
إذا كنت تستمتع بهذا المقال، ففكر في دعم صحافتنا الحائزة على جوائز من خلال الاشتراك. من خلال شراء اشتراك، فإنك تساعد على ضمان مستقبل القصص المؤثرة حول الاكتشافات والأفكار التي تشكل عالمنا اليوم.
ولكن في الآونة الأخيرة كان يستخدم ChatGPT كوسيلة جديدة للتحقق من الأدبيات. يقول ساوني: “قررت توصيله، ثم أخبرني بوجود مرجع”.
سارت الأمور بشكل جيد لدرجة أنه تواصل مع زميله عالم الرياضيات، مارك سيلك، الذي كان قد حصل مؤخرًا على إجازة من منصبه الأكاديمي للعمل في شركة OpenAI. لقد حثوا معًا ChatGPT على البحث عن الحلول المفقودة لتسعة مشاكل أخرى لإردودبلاك، بالإضافة إلى حلول جزئية لـ 11 مشكلة أخرى.
ومنذ ذلك الحين، ارتفع نشاط الموقع بشكل كبير. ووفقا لصفحة ويب بدأها عالم الرياضيات تيرينس تاو، ساعدت أدوات الذكاء الاصطناعي في نقل حوالي 100 مسألة من مسائل إردود إلى العمود “المحلول” منذ أكتوبر/تشرين الأول. وكان الجزء الأكبر من هذه المساعدة بمثابة نوع من البحث المعزز في الأدبيات، كما كان الحال مع النجاح الأولي الذي حققه ساوني. ولكن في كثير من الحالات، قام طلاب ماجستير العلوم بتجميع نظريات موجودة – غالبًا في حوار مع علماء الرياضيات – لتشكيل حلول جديدة أو محسنة لهذه المشاكل المتخصصة. في حالتين على الأقل، كان ماجستير القانون قادرًا على إنشاء دليل أصلي وصالح لإثبات لم يتم حله مطلقًا، مع القليل من المدخلات من الإنسان.
إن قصة مشاكل إردودبلاك هي مجرد جزء من التغيير الجذري الذي حدث خلال الأشهر القليلة الماضية. أصبحت LLMs منقطعة النظير في قدرتها على البحث وتجميع الأدبيات حول أي موضوع رياضي، مهما كان مقصورًا على فئة معينة. يمكنهم أيضًا توجيه علماء الرياضيات العاملين، ومساعدتهم على رسم مسار لإثبات نتيجة أكبر وإثبات أجزاء صغيرة منها لتوفير الوقت. غالبًا ما تكون هذه المساعدة مضللة ومليئة بالثغرات التي تتطلب عيونًا خبيرة لفحصها. لكن علماء الرياضيات يمكنهم رؤية إمكاناتها.
يقول أندرو ساذرلاند، عالم الرياضيات في معهد ماساتشوستس للتكنولوجيا: «إنهم الآن مساعدون بحثيون مفيدون». “إن علماء الرياضيات الذين كانت تجربتهم الوحيدة مع ماجستير إدارة الأعمال هي النماذج السابقة لا يقدرون ذلك تمامًا بعد.”
لا يزال الذكاء الاصطناعي بعيدًا عن القدرة على حل المشكلات المفتوحة الكبرى في الرياضيات، ناهيك عن استبدال علماء الرياضيات. على الرغم من المخاوف واسعة النطاق التي أعرب عنها طلاب الدراسات العليا أثناء استراحات تناول القهوة في المؤتمرات وفي لوحات الرسائل عبر الإنترنت، لم تنشر أي مجلة رياضية كبرى دليلاً تمت مراجعته من قبل النظراء يشير إلى استخدام ماجستير في القانون. لكن هذا، على الأقل، يمكن أن يتغير هذا العام.
تقييم حالة الأشياء
تعد مشاكل Erdő”معيارًا” مفيدًا في ماجستير إدارة الأعمال نظرًا لوجود الكثير منها. وقد أثبتوا أنهم عرض مميز لقوة التكنولوجيا المزدهرة كمحرك بحث رياضي.
يقول ساذرلاند: “إن مشاكل إردوغ تتناسب نوعًا ما مع فئة خاصة بها”. “في معظمها، إنها مشكلات فردية لن يكون لحلها بالضرورة أي آثار أوسع نطاقًا.” ونتيجة لهذا فإن حل مشكلة إردود الأكثر غموضاً يشكل إنجازاً غالباً ما يمر دون أن يلاحظه أحد. نادرًا ما يستحق تقديمه إلى مجلة، ونادرًا ما يتم الاستشهاد به في الأعمال اللاحقة.
لا شيء من هذا يهم LLM. ويمكنه بسهولة اكتشاف أوراق ما قبل الطباعة غير المعروفة حتى للخبراء، وهي أدلة لا تشير في بعض الأحيان إلى أوراق إردودبلاك على الإطلاق. عثر فريق Gemini من Google على ملاحظة مرتجلة في ورقة بحثية تعود إلى عام 1981 والتي حلت دون قصد مشكلة Erdódblak رقم 1089. ولكن الأمر الأكثر إثارة للدهشة هو قدرة حاملي الماجستير في القانون على تقديم اقتراحات رياضية ذات معنى.
يقول ساذرلاند: “أعتقد أنه من الخطأ القول إنه مجرد محرك بحث”. “لقد أجريت تفاعلاً واحدًا أو اثنين حيث وجهتني في الواقع إلى نتيجة سمحت لي بإثبات شيء ما كنت عالقًا فيه.”
لقد حفزت تجارب مماثلة الفريق وراء First Proof، وهي محاولة جديدة لاختبار مهارات الذكاء الاصطناعي في الرياضيات. اختار أحد عشر من كبار علماء الرياضيات أجزاء منفصلة من البراهين التي أكملوها ولكن لم يتم نشرها بعد، وطرحوها كتحدي للذكاء الاصطناعي يوم الخميس الماضي. وتغطي المشاكل مجموعة واسعة من المجالات وتختلف في التعقيد. يقول دانييل ليت، عالم الرياضيات في جامعة تورونتو: «إن النظام الذي يمكنه حل جميع هذه المشكلات سيكون مفيدًا جدًا لعالم رياضيات محترف».
يمنح الفريق حاملي الماجستير في القانون مهلة حتى يوم الجمعة لتقديم أدلة على المشكلات العشرة. تم اختيار المهلة الزمنية البالغة أسبوعًا واحدًا بعناية، وفقًا للورين ويليامز، عالمة الرياضيات بجامعة هارفارد والعضوة في فريق First Proof. لقد استغرق الأمر وقتًا أقل مما استغرقته هي ومؤلفها المشارك لإثبات مشكلتها، لذلك من المحتمل ألا يكون وقتًا كافيًا لعلماء الرياضيات من البشر دون مساعدة الذكاء الاصطناعي.
بحلول يوم الاثنين، امتلأت رسائل البريد الإلكتروني وصفحات وسائل التواصل الاجتماعي الخاصة بوليامز ومعاونيها بالحلول المزعومة. وتقول: “هناك الكثير من الإثارة، وهو أمر رائع حقًا”. وسرعان ما استقطب خادم Discord الذي يستضيف مناقشات حول التحدي مئات الأعضاء، والعديد منهم يحمل أدلة مزعومة من ChatGPT وغيره من حاملي شهادات LLM.
لقد نشأت بالفعل مشاكل مألوفة. كان المقصود من First Proof أن يكون أكثر من مجرد بحث في الأدبيات، حيث اختبر الفريق أسئلته على ماجستير إدارة الأعمال للتأكد من عدم وجود إجابات في بيانات التدريب الخاصة بهم. ولكن سرعان ما ظهر حل عبر الإنترنت لمشكلة من مارتن هيرير، الحائز على ميدالية فيلدز لعام 2014، وهي أعلى وسام شرف في الرياضيات، وأحد أعضاء فريق First Proof. عندما اختار المشكلة، كان قد أغفل دليلاً جزئيًا في أحشاء موقعه الشخصي على الإنترنت والذي تم أرشفته بواسطة Wayback Machine.
والمتسابقون الذين يفتقرون إلى خبرة الفريق في هذه المجالات الرياضية المحددة ليسوا متأكدين مما يجب فعله مع طوفان الادعاءات الواثقة التي يستمر طلاب LLM في إطلاقها – فالأمر متروك لفريق First Proof للتحقق من كل إرسال. يقول ويليامز: “يمثل التحقق مشكلة لأنه سيتوصل إلى حل في 90 بالمائة من الحالات”. “سوف يكتب شيئًا ويبدو واثقًا بشأنه.”
لقد ألقى ليت نظرة سريعة على العديد من “الأدلة” المتداولة هذا الأسبوع ووجدها زائفة إلى حد كبير – على الرغم من أنه رأى القليل منها قد يكون صحيحًا. ويقول: “من المثير للإعجاب للغاية أن تكون النماذج قادرة في بعض الأحيان على توليد إجابات صحيحة لبعض المشكلات”. “لكنهم يولدون كمية هائلة من القمامة.” وحتى بحلول يوم السبت، قد لا يكون من الواضح ما إذا كانت شهادات LLM قد فازت أم خسرت.
سنة محورية
بغض النظر عن نتيجة البرهان الأول، فقد جلب الشهر الماضي العديد من الدلائل على أن ماجستير إدارة الأعمال سيكون قريبًا جزءًا من صناديق أدوات العديد من علماء الرياضيات.
في شهر يناير، نشر رافي فاكيل، الرئيس الحالي لجمعية الرياضيات الأمريكية، طبعة أولية مع اثنين من علماء الرياضيات الآخرين وباحثين من جوجل، تعاونوا فيها على حل مسألة رياضية تؤثر على بحثه. يوثق المؤلفون كيف ساعدتهم شهادة LLM من Google في الوصول إلى الدليل. يقول فاكيل، الذي أراد أن “يكوّن فكرة عن الكيفية التي ينبغي لعلماء الرياضيات أن يمارسوا بها الرياضيات خلال خمس سنوات”: “لقد قادتنا هذه التجربة حقًا إلى أفكار جديدة”.
ومع ذلك، لا يزال يتعين على حاملي شهادة الماجستير في القانون المساهمة بدليل من شأنه أن يثير ضجة إذا جاء من إنسان. يقول ليت: “لقد تم المبالغة في تقدير كل نتيجة فردية إلى حد كبير من قبل زوايا معينة من الإنترنت”. ويأمل كارلو باجانو، الذي تعاون مع فريق DeepMind التابع لشركة Google للعمل على العديد من مشكلات Erdódb باستخدام Gemini في الأبحاث المنشورة كطبعة أولية، في الحصول على معيار أكثر جوهرية. ويقول: “إن مشاكل عائلة إردود ليست كبيرة إلى حد ما”. “من المهم أن نفعل ذلك أيضًا بشأن المشكلات التي نعلم أنها ذات أهمية أوسع.”
لكن العديد من علماء الرياضيات توقعوا أن يكون عام 2026 هو العام الذي يتم فيه اجتياز نتائج من هذا النوع، والتي يكون فيها الذكاء الاصطناعي مساهمًا معلنًا، لأول مرة من خلال مراجعة النظراء في مجلات الرياضيات الكبرى.
يقول ساوني: “أعتقد أن هذا سيغير الموضوع”. “وهذا شيء مثير حقًا.” ونظرًا لهذا التغيير، حصلت ساوني على إجازة أكاديمية من جامعة كولومبيا للعمل في شركة OpenAI. بدأ باجانو هذا الأسبوع منصبًا مشتركًا في Google DeepMind. ويقول: “من الواضح أن هذا سيغير الطريقة التي نمارس بها الرياضيات، لذا من الأفضل أن نبدأ مبكرًا وليس متأخرًا”.

التعليقات