التخطي إلى المحتوى

في أي مركز بيانات، سواء كان ذلك مخصصًا للذكاء الاصطناعي أم لا، فإن وجود اتصال شبكي سريع عبر العقد لا يقل أهمية عن سرعة العقد نفسها. عند القيام بأعمال الذكاء الاصطناعي، يتم توجيه المطورين إلى مكتبات الشبكات الخاصة بالبائعين مثل NCCL من Nvidia أو RCCL من AMD. الآن، في ورقة بحثية جديدة، اقترحت مجموعة من العلماء الكوريين الجنوبيين مكتبة جديدة تسمى HetCCL، وهو نهج غير محدد للبائع يسمح للمجموعات المكونة من وحدات معالجة الرسومات من كلا البائعين بالعمل كوحدة واحدة.

على الرغم من أنه يمكن استخدامه ببساطة للتواصل بين وحدات معالجة الرسومات المتعددة في إعداد واحد، إلا أن مركز البيانات المشترك غالبًا ما ينتهي به الأمر باستخدام الوصول المباشر للذاكرة عن بعد (RDMA) للسماح للتطبيقات بتمرير البيانات إلى وحدة معالجة الرسومات في مكان آخر في الشبكة. فكر في إرسال حزم الشبكة مباشرة إلى ذاكرة الجهاز (في هذه الحالة GPU VRAM)، بدلاً من المرور عبر برنامج التشغيل، ومكدس TCP/IP، وطبقة شبكة نظام التشغيل، وحرق طن متري من دورات وحدة المعالجة المركزية في هذه العملية.

Fonte

التعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *