التخطي إلى المحتوى

تعمل شركة OpenAI على تقليص حجم أحدث نماذجها للوصول إلى هدف مختلف واستجابات أسرع وتكاليف أقل بكثير. تم تصميم GPT-5.4 mini وnano الجديد للمطورين الذين يهتمون أكثر بالاستجابة بدلاً من الضغط على كل جزء أخير من قوة التفكير.

كلا النموذجين متاحان ابتداءً من اليوم. يعمل GPT-5.4 mini بسرعة تزيد عن ضعف سرعة سابقه مع البقاء قريبًا من GPT-5.4 الكامل وفقًا للمعايير الرئيسية. يأخذ GPT-5.4 nano هذا الأمر إلى أبعد من ذلك، مع التركيز على المهام الأبسط مثل التصنيف واستخراج البيانات حيث تكون الكفاءة أكثر أهمية.

يناسب هذا النهج التطبيقات التي تشكل فيها السرعة التجربة. يعتمد مساعدو البرمجة، ووكلاء الخلفية، وأدوات الرؤية في الوقت الفعلي على ردود الفعل السريعة، وفي هذه الحالات، غالبًا ما يقدم نموذج أصغر قليلاً نتيجة إجمالية أفضل.

مقدار الأداء الذي تخسره بالفعل

فجوة الأداء بين النماذج أضيق مما قد تتوقعه. حصل GPT-5.4 mini على نسبة 54.4 بالمائة في SWE-Bench Pro، مقارنة بـ 57.7 بالمائة للنموذج الكامل. في OSWorld-Verified، يصل الإصدار المصغر إلى 72.1 بالمائة بينما يصل الإصدار الأكبر إلى 75 بالمائة، مما يجعل الفارق ضئيلًا بين المهام.

تنخفض التكاليف بشكل أكبر بكثير. يبلغ سعر GPT-5.4 mini 0.75 دولارًا أمريكيًا لكل مليون رمز إدخال و4.50 دولارًا أمريكيًا لكل مليون رمز إخراج، في حين يأتي سعر nano بسعر 0.20 دولارًا أمريكيًا و1.25 دولارًا أمريكيًا. يدعم كلا النموذجين إدخالات النص والصور، واستخدام الأدوات، واستدعاء الوظائف، ونافذة سياق رمزية تبلغ 400000 رمز، وبالتالي فإن السعر المنخفض لا يجرد القدرات الأساسية.

في Codex، يستخدم النموذج المصغر 30 بالمائة فقط من حصة GPT-5.4. يتيح ذلك للمطورين تحويل أعمال الترميز الروتينية إلى مستوى أرخص مع حفظ النموذج الكامل للاستدلال الأصعب.

عندما تقوم النماذج الأصغر برفع الأحمال الثقيلة

تعمل OpenAI أيضًا على دفع سير عمل متعدد النماذج. بدلاً من الاعتماد على نظام واحد، يمكن للمطورين تقسيم العمل عبر المستويات، ودمج نموذج أكبر للتخطيط مع نماذج أصغر للتعامل مع التنفيذ.

يعكس هذا الإعداد عدد التطبيقات الحقيقية التي تعمل بالفعل. يمكن لأحد النماذج مراجعة قاعدة التعليمات البرمجية أو اتخاذ قرار بشأن التغييرات، بينما يقوم نموذج آخر بمعالجة البيانات أو الخطوات المتكررة. يتعامل النموذج الأصغر مع العمل المتوقع، بينما يركز النموذج الأكبر على الحكم والتنسيق.

وتشير ردود الفعل المبكرة إلى أن هذا المزيج فعال. أفاد Hebbia CTO Aabhas Sharma أن GPT-5.4 mini يطابق النماذج المنافسة أو يتفوق عليها في العديد من المهام بتكلفة أقل، وفي بعض الحالات يقدم نتائج شاملة أقوى من GPT-5.4 الكامل.

ماذا تستخدم ومتى

GPT-5.4 mini متاح الآن عبر API وCodex وChatGPT. يمكن لمستخدمي Free and Go الوصول إليه من خلال خيار Thinking، بينما قد يراه مستخدمون آخرون كبديل عندما يصلون إلى حدود GPT-5.4 Thinking.

يقتصر نموذج النانو حاليًا على واجهة برمجة التطبيقات (API)، ويستهدف الفرق التي تقوم بأعباء عمل كبيرة الحجم حيث يكون التحكم في التكلفة أمرًا بالغ الأهمية. كلا النموذجين متاحان اليوم مع توفر الوثائق الكاملة.

بالنسبة للمطورين الذين يقومون ببناء ميزات الذكاء الاصطناعي في الوقت الفعلي، فإن التحول واضح. أصبحت النماذج الأصغر حجمًا الآن قادرة بما يكفي على التعامل مع حصة أكبر من العمل اليومي، مما يجعل اختيار التوازن الصحيح بين السرعة والتكلفة والقدرة قرارًا عمليًا بشكل متزايد.

Fonte

التعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *