إذا قمت بترميز تطبيقات Android باستخدام الذكاء الاصطناعي، فإن معيار Google الجديد يجعل من السهل اختيار النموذج المناسب

بالنسبة لمطوري تطبيقات Android الذين يعتمدون على الذكاء الاصطناعي في البرمجة، قد يكون اختيار النموذج المناسب أمرًا صعبًا. لم يتم تصميم جميع النماذج بنفس الطريقة، والعديد منها لم يتم تدريبه خصيصًا على سير عمل تطوير Android. ولمعالجة هذه المشكلة، طرحت Google معيارًا جديدًا لمساعدة المطورين على فهم مدى جودة أداء نماذج الذكاء الاصطناعي المختلفة في مهام برمجة Android في العالم الحقيقي.

تم تصميم المعيار الجديد الذي يطلق عليه اسم Android Bench لتقييم مدى جودة تعامل نماذج اللغات الكبيرة (LLMs) مع مهام تطوير Android النموذجية. توضح Google أن المعيار يقوم بتقييم النماذج باستخدام مهام العالم الحقيقي من المشاريع العامة على GitHub ويطلب من النماذج إعادة إنشاء طلبات السحب الفعلية وحل المشكلات المشابهة لما يواجهه المطورون أثناء إنشاء تطبيقات Android. يتم بعد ذلك التحقق من النتائج لمعرفة ما إذا كانت ستحل المشكلة بالفعل.

قد يبدو اختيار أفضل نموذج ✨ للذكاء الاصطناعي لمهمتك مرهقًا عندما يكون هناك الكثير من الخيارات، ولهذا السبب تتطلع الصناعة إلى معايير LLM للحصول على إرشادات.

تكمن مشكلة مطوري Android في أن هذه المعايير غير مرجحة لتقييم أنواع المهام التي… pic.twitter.com/nz7Uxnc6l2

— مشعل الرحمن (@MishaalRahman) 5 مارس 2026

بعبارات أبسط، يتحقق المعيار مما إذا كانت التعليمات البرمجية التي تم إنشاؤها بواسطة نماذج الذكاء الاصطناعي تعمل على حل المشكلة حقًا بدلاً من مجرد الظهور بشكل صحيح على السطح. يساعد هذا Google في قياس مدى فائدة النماذج المختلفة عندما يتعلق الأمر بحل مشكلات تطوير Android الحقيقية.

مع الإصدار الأول من Android Bench، خططت Google “لقياس أداء النموذج فقط وعدم التركيز على استخدام الوكيل أو الأداة”. تسلط النتائج الضوء على فجوة واسعة، حيث أكملت النماذج بنجاح ما بين 16% و72% من المهام المرجعية. وتقول الشركة إن نشر هذه النتائج من شأنه أن يسهل على المطورين مقارنة النماذج واختيار النماذج القادرة بالفعل على التعامل مع مشكلات ترميز Android الحقيقية.

بالإضافة إلى توجيه المطورين، يمكن للمعيار أيضًا أن يدفع شركات الذكاء الاصطناعي إلى تحسين فهم نماذجها لتطوير Android. لدعم هذا الجهد، نشرت Google منهجية Android Bench ومجموعة البيانات وإطار الاختبار على GitHub. وبمرور الوقت، يمكن أن يؤدي ذلك إلى أدوات الذكاء الاصطناعي المجهزة بشكل أفضل للتنقل في قواعد تعليمات Android المعقدة ومساعدة المطورين على إنشاء التطبيقات وإصلاحها بشكل أكثر فعالية.

Fonte

إذا قمت بترميز تطبيقات Android باستخدام الذكاء الاصطناعي، فإن معيار Google الجديد يجعل من السهل اختيار النموذج المناسب

يلمح Valve إلى تأخير Steam Machine … لكن الحبكة تزداد سماكة

“يومان بشحنة واحدة”: لماذا أثارتني شهرين مع OnePlus 15R متحمسًا بشأن بطارية “Glacier” الخاصة بـ 15T

حقق فريق Texas A&M فوزًا 6-3 على أوكلاند في المباراة الأولى برأسين مزدوجين

أليكس أوفيتشكين يصف تجارة كابيتالز مع د جون كارلسون منذ فترة طويلة بأنها “أصعب يوم في مسيرتي”

“يمكنهم اختيار ثلاثة جوانب”: جلين فيليبس النيوزيلندي يتحدث عن عمق الهند قبل نهائي كأس العالم T20

MSI تكشف عن جهاز كمبيوتر يشبه جراد البحر مع شاشة تعمل باللمس مقاس 13.3 بوصة وبطاقة RTX 5080X وتصميم ملتوي يتحدى كل الأعراف

التعليقات

اترك تعليقاً إلغاء الرد

يلمح Valve إلى تأخير Steam Machine … لكن الحبكة تزداد سماكة

“يومان بشحنة واحدة”: لماذا أثارتني شهرين مع OnePlus 15R متحمسًا بشأن بطارية “Glacier” الخاصة بـ 15T

حقق فريق Texas A&M فوزًا 6-3 على أوكلاند في المباراة الأولى برأسين مزدوجين

أليكس أوفيتشكين يصف تجارة كابيتالز مع د جون كارلسون منذ فترة طويلة بأنها “أصعب يوم في مسيرتي”

“يمكنهم اختيار ثلاثة جوانب”: جلين فيليبس النيوزيلندي يتحدث عن عمق الهند قبل نهائي كأس العالم T20

MSI تكشف عن جهاز كمبيوتر يشبه جراد البحر مع شاشة تعمل باللمس مقاس 13.3 بوصة وبطاقة RTX 5080X وتصميم ملتوي يتحدى كل الأعراف

باريس سان جيرمان يهدر نقاطاً في سباق اللقب بعد خسارته 3-1 على أرضه أمام موناكو، مما يفتح الباب أمام لانس لتقليص الفارق

هل سيتصل Proba-3 بالمنزل؟ القمر الصناعي الأوروبي لكسوف الشمس يصبح مظلمًا

لن ينتهي جهاز Xbox، ولكنه يحتاج إلى هذه التغييرات الثلاثة للعودة إلى المجد

أفضل 3 محضرات طعام صغيرة – مفارم صغيرة الحجم تم اختبارها والتوصية بها من قبل خبير تكنولوجيا المطبخ