- فاز نموذج o3 الخاص بـ OpenAI بدورة بوكر مدتها خمسة أيام ضمت تسعة روبوتات دردشة تعمل بالذكاء الاصطناعي
- فاز نموذج o3 بلعب اللعبة الأكثر اتساقًا
- تعامل معظم عارضي اللغات المتميزين مع لعبة البوكر بشكل جيد، لكنهم واجهوا صعوبات في الخداع والموضع والرياضيات الأساسية
في مواجهة رقمية لا مثيل لها على الإطلاق، قضى تسعة من أقوى عارضي اللغات الكبيرة في العالم خمسة أيام في مباراة بوكر عالية المخاطر.
OpenAI's o3، Anthropic's Claude Sonnet 4.5، X.ai's Grok، Google's Gemini 2.5 Pro، Meta's Llama 4، DeepSeek R1، Kimi K2 من Moonshot AI، Magistral من Mistral AI، وZ.AI's GLM 4.6 لعبت آلاف توزيعات الورق من Texas Hold 'em بلا حدود بسعر 10 دولارات و20 دولارًا بطاولات بقيمة 100000 دولار. تمويل كل منهما.
عندما انسحب نموذج O3 الخاص بـ OpenAI من لعبة بوكر استمرت أسبوعًا بأكثر من 36.691 دولارًا، لم يكن هناك أي جائزة، فقط حقوق التفاخر.
تم تشغيل لعبة PokerBattle.ai التجريبية بالكامل بواسطة الذكاء الاصطناعي مع إصدار نفس المطالبة الأولية لكل لاعب. لقد كانت استراتيجية محضة، إذا كانت الإستراتيجية هي ما تسميه آلاف القرارات الصغيرة التي اتخذتها الآلات التي لا تفهم حقًا الفوز أو الخسارة أو مدى إذلال الفوز بالتعادل السبعة.
بالنسبة إلى حيلة تقنية، كان الأمر معبرًا بشكل غير عادي. لم تكن أنظمة الذكاء الاصطناعي الأفضل أداءً تقوم بالخداع والمراهنة فحسب، بل كانت تتكيف، وتشكل خصومها، وتتعلم في الوقت الفعلي كيفية التعامل مع الغموض. على الرغم من أنهم لم يلعبوا لعبة البوكر بشكل لا تشوبه شائبة، إلا أنهم اقتربوا بشكل مثير للإعجاب من محاكاة قرارات اللاعبين المتمرسين.
سرعان ما أظهرت لعبة OpenAI's o3 أنها تتمتع بأعلى توزيع ورق، حيث أسقطت ثلاثة من أكبر خمسة مراهنات والتزمت بنظرية ما قبل التقليب. واحتل كلود من Anthropic وGrok من X.com المراكز الثلاثة الأولى بأرباح كبيرة بلغت 33,641 دولارًا و28,796 دولارًا على التوالي.
في هذه الأثناء، فقدت اللاما مجموعتها الكاملة واشتعلت النيران مبكرًا. هبطت بقية الحزمة في مكان ما بينهما، حيث حققت شركة Gemini من Google أرباحًا متواضعة وهبطت رقائق Kimi K2 من Moonshot إلى 86.030 دولارًا.
القمار الذكاء الاصطناعي
لطالما كان البوكر أحد أفضل نظائره لاختبار الذكاء الاصطناعي للأغراض العامة. على عكس لعبة الشطرنج أو لعبة Go، التي تعتمد على معلومات مثالية، تتطلب لعبة البوكر من اللاعبين التفكير في حالة عدم اليقين. إنها مرآة لعملية صنع القرار في العالم الحقيقي في كل شيء بدءًا من مفاوضات الأعمال وحتى الإستراتيجية العسكرية، والآن، على ما يبدو، تطوير برامج الدردشة الآلية.
كانت إحدى الوجبات السريعة المتسقة من البطولة هي أن الروبوتات كانت في كثير من الأحيان عدوانية للغاية. فضل معظمهم الاستراتيجيات التي تعتمد على العمل الثقيل، حتى في المواقف التي كان من الممكن أن يكون فيها الاستسلام أكثر حكمة. لقد حاولوا الفوز بمجموعات كبيرة أكثر من محاولتهم تجنب خسارتها. وكانوا فظيعين في الخداع، ليس لأنهم لم يحاولوا، ولكن لأن خدعهم غالبًا ما كانت تنبع من سوء قراءة الأيدي، وليس من الخداع الذكي.
ومع ذلك، أصبحت أدوات الذكاء الاصطناعي أكثر ذكاءً بطرق تتجاوز بكثير الذكاء على المستوى السطحي. إنهم لا يكررون ما قرأوه فحسب؛ إنهم يصدرون أحكامًا احتمالية تحت الضغط ويتعلمون قراءة الغرفة. إنه أيضًا تذكير بأنه حتى النماذج القوية لا تزال بها عيوب. إن إساءة قراءة المواقف، واستخلاص استنتاجات هشة، ونسيان “موقفهم” الخاص ليست مجرد مشكلة بوكر.
قد لا تجلس أبدًا أمام نموذج لغة في غرفة بوكر حقيقية، ولكن من المحتمل أنك ستتفاعل مع نموذج يحاول اتخاذ القرارات المهمة. كانت هذه اللعبة مجرد لمحة عما يمكن أن يبدو عليه الأمر.
اتبع TechRadar على أخبار جوجل و أضفنا كمصدر مفضل للحصول على أخبار الخبراء والمراجعات والآراء في خلاصاتك. تأكد من النقر على زر المتابعة!
وبالطبع يمكنك أيضًا اتبع TechRadar على TikTok للحصول على الأخبار والمراجعات وفتح الصناديق في شكل فيديو، والحصول على تحديثات منتظمة منا على واتساب أيضاً.

أفضل أجهزة الكمبيوتر المحمولة للأعمال لجميع الميزانيات

التعليقات