اتهمت شركة أنثروبيك يوم الاثنين ثلاثة مطورين صينيين بارزين لنماذج الذكاء الاصطناعي الحدودية باستخدام التقطير على نطاق واسع لتحسين نماذجهم الخاصة باستخدام قدرات كلود من شركة أنثروبيك. في المجمل، قامت DeepSeek وMoonshot وMiniMax بإجراء 16 مليون عملية تبادل باستخدام 24000 حساب احتيالي.
التقطير هو أسلوب للتعلم الآلي يتم فيه تدريب نموذج أصغر أو أقل قدرة على مخرجات نموذج أقوى بدلاً من استخدام البيانات الفعلية للتدريب. يمكنها توفير الوقت، وإنشاء نماذج أرخص وأكثر تخصصًا، واستخراج القدرات من المنافسين، و/أو تقليل متطلبات قدرات الأجهزة. في حين أن التقطير هو أسلوب مشروع بشكل عام، إلا أنه عندما يقوم بذلك كيان مقره الصين ويفرض قيودًا شديدة، فإنه ينتهك ضوابط التصدير الأمريكية واتفاقية ترخيص المستخدم النهائي مع شركة أنثروبيك.
كيف تستخدم الشركات الصينية التقطير من نماذج الذكاء الاصطناعي الأمريكية
وفقًا لشركة Anthropic، اتبع الجناة نفس النمط: استخدموا الخدمات التجارية التي تعيد بيع الوصول إلى النماذج الحدودية وقاموا ببناء ما تسميه الشركة شبكات “hydracluster” – مجموعات كبيرة من الحسابات التي تنشر حركة المرور عبر واجهة برمجة تطبيقات Anthropic وسحب الطرف الثالث.
وفي إحدى الحالات، زُعم أن إعداد وكيل واحد كان يتحكم في أكثر من 20000 حساب احتيالي في وقت واحد. ولتجنب رفع الإشارات، فقد خلطت حركة الاستخراج مع طلبات الاستخدام العادية. ومع ذلك، فقد برزت أنماطها الفورية: أحجام كبيرة جدًا، تركز بشدة على قدرات محددة، ومتكررة للغاية. وكان هذا السلوك متسقًا مع نموذج التدريب، ولكنه بالتأكيد لم يكن تفاعلًا نموذجيًا مع المستخدم النهائي.
أنتجت DeepSeek وحدها أكثر من 150 ألف عملية تبادل استهدفت مهام التفكير، والدرجات المستندة إلى معايير التقييم المناسبة لنماذج مكافأة التعلم المعزز، وإعادة كتابة الاستعلامات الحساسة سياسيًا بشكل آمن تحت الرقابة، وفقًا لـ Anthropic. لاحظت الأنثروبيك أيضًا المطالبات المصممة لإنتاج تفكير داخلي خطوة بخطوة، وبالتالي الكشف عن بيانات التدريب على تسلسل الأفكار.
وشكلت شركة Moonshot، المعروفة بنماذجها من طراز Kimi، أكثر من 3.4 مليون عملية تبادل، وفقًا لشركة Anthropic. وشملت مجالات تركيزها التفكير الفاعل، واستخدام الأدوات، والترميز، وتحليل البيانات، ووكلاء استخدام الكمبيوتر، ورؤية الكمبيوتر. يُزعم أن Moonshot استخدمت مئات الحسابات الاحتيالية التي تغطي مسارات وصول متعددة وحاولت لاحقًا استخراج وإعادة بناء آثار استدلال كلود.
أجرت MiniMax أكبر حملة تضم أكثر من 13 مليون بورصة استهدفت البرمجة والتنسيق الوكيل. وتقول شركة Anthropic إنها رصدت هذه العملية بينما كانت لا تزال مستمرة، حيث كانت MiniMax تقوم بتدريب نموذجها الذي كان من المقرر إطلاقه في المستقبل، وهو ما يوفر للشركة الأمريكية رؤية فريدة لدورة حياة عملية الاستخراج. بعد أن قدمت Anthropic نموذجًا جديدًا لكلود، زُعم أن MiniMax أعادت توجيه ما يقرب من نصف حركة المرور الخاصة بها خلال 24 ساعة للحصول على القدرات من أحدث طراز.
رد الأنثروبي
ولمحاربة محاولات التقطير المستقبلية، تقول شركة أنثروبيك إنها تعمل على تعزيز الدفاعات لجعل تنفيذ عملية التقطير على نطاق واسع أكثر صعوبة وأسهل في اكتشافها. قامت الشركة بنشر المصنفات وأنظمة البصمات السلوكية لتحديد أنماط الاستخراج في حركة مرور واجهة برمجة التطبيقات، بما في ذلك استنباط سلسلة الأفكار والنشاط المنسق متعدد الحسابات. تشارك الشركة أيضًا المؤشرات الفنية لعملية التقطير واسعة النطاق مع مختبرات الذكاء الاصطناعي الأخرى ومقدمي الخدمات السحابية والسلطات، بالإضافة إلى تشديد التحقق من الحسابات التعليمية والبحثية وحسابات بدء التشغيل التي غالبًا ما تُستخدم لإنشاء وصول احتيالي. وبالتوازي مع ذلك، تعمل على تطوير ضمانات على مستوى المنتج وواجهة برمجة التطبيقات والنموذج لتقليل فائدة مخرجات التدريب غير المشروع دون الإضرار بالمستخدمين الشرعيين. وفي الوقت نفسه، تعترف الشركة بأن مواجهة الهجمات على هذا النطاق تتطلب إجراءات منسقة على مستوى الصناعة والسياسة.
يتبع أجهزة توم على أخبار جوجل، أو أضفنا كمصدر مفضل، للحصول على آخر الأخبار والتحليلات والمراجعات في خلاصاتك.

التعليقات