أعلنت Microsoft لأول مرة عن DirectStorage للكمبيوتر الشخصي في عام 2020، وكانت Forspoken أول لعبة تدعمها رسميًا في أوائل عام 2023. ومع ذلك، لم نشاهد مجموعة DirectStorage الكاملة قيد التنفيذ إلا بعد إصدار Ratchet & Clank: Rift Apart في وقت لاحق من ذلك العام. Ratchet & Clank: Rift Apart كان أول عنوان يتم شحنه مع ضغط GDeflate ودعم إلغاء ضغط وحدة معالجة الرسومات للأصول – وهي مهمة كانت في السابق من مسؤولية وحدة المعالجة المركزية.
من الناحية النظرية، كان من المفترض أن يسهل ذلك تدفقًا أكثر سلاسة للأصول مع أداء أكثر سلاسة، حيث تهدف الميزة إلى تقليل عنق الزجاجة في وحدة المعالجة المركزية المرتبط بإلغاء ضغط الأصول أثناء اللعب. من الناحية العملية، حدث العكس، خاصة على وحدات معالجة الرسوميات Nvidia.
ما هو التخزين المباشر؟
يهدف DirectStorage على الكمبيوتر الشخصي إلى توفير العديد من فوائد تقنية التخزين السريع المستخدمة في PS5 وXbox Series X|S. والغرض منه هو السماح للألعاب بالاستفادة الكاملة من محركات أقراص NVMe SSD مع الحد الأدنى من حمل وحدة المعالجة المركزية، مما يسمح بتقليل أوقات التحميل، وتدفق أسرع للأصول، وعوالم أكبر وأكثر كثافة في الألعاب. أضاف DirectStorage 1.1 أيضًا دعمًا لإلغاء ضغط وحدة معالجة الرسومات، والذي من شأنه أن يحول عبء إلغاء ضغط أصول اللعبة من وحدة المعالجة المركزية إلى وحدة معالجة الرسومات. يؤدي هذا إلى تضخيم كمية البيانات التي يمكن نقلها عبر SSD -> RAM -> خط أنابيب VRAM.
يستمر المقال أدناه
على عكس وحدات المعالجة المركزية، تحتوي وحدات معالجة الرسومات على آلاف النوى، كما أنها فعالة جدًا في أداء المهام المتكررة بالتوازي. GDeflate هو نظام ضغط متوازي للبيانات تم تحسينه خصيصًا لإلغاء ضغط وحدة معالجة الرسومات.
يحتوي GDeflate على مستويين من التوازي. أولاً، يتم تقسيم تدفق البيانات الأصلي إلى مربعات بحجم 64 كيلو بايت، ويتم ضغطها في كل مرة بشكل منفصل. إذا قامت وحدة المعالجة المركزية بإلغاء الضغط، فيمكن فك ضغط كل مربع بخيط مختلف. إذا قامت وحدة معالجة الرسومات بإلغاء الضغط، فيمكن فك ضغط كل بلاطة بواسطة مجموعة سلاسل رسائل واحدة. ثانيًا، يتم ترتيب البيانات داخل التجانب بحيث يمكن للعديد من الممرات داخل مجموعة الخيوط فك ضغط هذا التجانب بالتوازي. لا يؤدي إلغاء ضغط وحدة معالجة الرسومات إلى حفظ دورات وحدة المعالجة المركزية فحسب، بل يحفظ أيضًا النطاق الترددي للاتصال البيني للنظام والمساحة الموجودة على القرص حيث تظل البيانات مضغوطة حتى تصل إلى VRAM.
تتمثل إحدى فوائد نقل البيانات بمعدل أسرع عبر هذا المسار في أنك، من الناحية النظرية، ستحتاج إلى الاحتفاظ ببيانات أقل في ذاكرة النظام في أي وقت، وهو ما قد يكون مفيدًا للغاية نظرًا للارتفاع الكبير في أسعار DDR. سيكون هذا صحيحًا بشكل خاص إذا بدأ مطورو الألعاب في الاعتماد بشكل أكبر على النطاق الترددي العالي لتخزين NVMe. فائدة أخرى، والتي تظهر بشكل خاص في Ratchet & Clank، هي أن الأنسجة يتم تحميلها بشكل أسرع مع تمكين DirectStorage. كما ترون أعلاه، مع تعطيله، تحصل على أنسجة ضبابية حتى يتم تحميل الأنسجة ذات الدقة الأعلى.
ما هي المشكلة؟
عندما تم إطلاق لعبة Ratchet & Clank: Rift Apart، أبلغ العديد من المستخدمين أن تعطيل DirectStorage عن طريق إزالة ملفات dstorage.dll من مجلد اللعبة (وبالتالي الرجوع إلى إلغاء ضغط وحدة المعالجة المركزية) أدى إلى أداء أفضل – لا سيما فيما يتعلق بإطار زمني أكثر استقرارًا. أثرت المشكلة بشكل أساسي على وحدات معالجة الرسومات Nvidia، بما في ذلك 4090 و3090.
في أوائل عام 2025، تم إصدار Marvel's Spider-Man 2 على الكمبيوتر الشخصي مع دعم DirectStorage وإلغاء الضغط GPU. مرة أخرى، كانت هناك تقارير عن تحسن الأداء عند تعطيل DirectStorage والعودة إلى إلغاء ضغط وحدة المعالجة المركزية على وحدات معالجة الرسومات NVIDIA. عند الاختبار على 4090، رأيت زيادات بنسبة 18-25% في أدنى مستوياتها بنسبة 1% في Spider-Man 2 عند تعطيل DirectStorage، اعتمادًا على الدقة. كافحت وحدات معالجة الرسومات هذه للتعامل مع مهام العرض وإلغاء الضغط في وقت واحد.
هل تعاني وحدات معالجة الرسومات Blackwell من هذه المشكلة؟
تم إجراء اختباراتي الأولية على 5090، لكنني فوجئت بسرور عندما رأيت أن ترك DirectStorage لم يعد يمكّن من أداء ضعيف. ومع ذلك، فإن 5090 هو وحش مطلق، لذلك لم يكن هذا بالضرورة علامة على أن بنية بلاكويل أكثر ملاءمة للتعامل مع تخفيف ضغط وحدة معالجة الرسومات. لتحقيق ذلك، نحتاج إلى اختبار المزيد من وحدات معالجة الرسومات Blackwell عبر المكدس. لاحظ أن وحدات معالجة الرسوميات AMD Radeon لم تواجه هذه المشكلة مطلقًا، لذلك سنختبر بطاقات Nvidia فقط في هذه المقالة.
نظام الاختبار
- ايه ام دي رايزن 7 9800X3D
- ذاكرة G.SKILL Flare X5 DDR5 بسرعة 6200 ميجاهرتز CL30 سعة 64 جيجابايت (2 × 32 جيجابايت)
- كروكيال T700 Gen5 SSD
- اسوس روج ستريكس B850-F جيمنج واي فاي
- مبرد كورسير نوتيلوس 360 RS AIO
كما ترون في كل من Spider-Man 2 وRatchet & Clank، فإن RTX 5090 لا يتخطى أي إيقاع مع تمكين إلغاء الضغط DirectStorage/GPU بأي دقة. في الواقع، نرى الآن بعض المكاسب في متوسط معدل الإطارات وانخفاض 1% في بعض الحالات.
أدناه نختبر RTX 5070 في نفس الألعاب وبنفس الإعدادات بدقة 1080p و 1440p.
وبالمثل، يشهد RTX 5070 بعض المكاسب الجيدة عند أدنى مستوياته بنسبة 1٪ مع تمكين DirectStorage. عند دقة 1440 بكسل، يزيد حمل وحدة معالجة الرسومات في جميع أنحاء معيار Spider-Man 2 عن 98%، لذلك نحن مرتبطون بوحدة معالجة الرسومات، ومع ذلك لا يواجه جهاز 5070 أي مشكلات في عرض الأصول وفك ضغطها في وقت واحد أثناء اللعب.
الآن لاختبار أكبر. هل يمكن لـ RTX 5060 الحفاظ على نفس مستوى الأداء عندما يتعين عليه عرض الأصول وفك ضغطها أثناء التنقل؟
في الواقع، يمكن ذلك. عند دقة 1080 بكسل، يزيد حمل وحدة معالجة الرسومات خلال التشغيل المعياري للعبة Spider-Man 2 عن 98%، مما يعني أنه حتى عندما تكون مرتبطة بوحدة معالجة الرسومات، فإن RTX 5060 لا يفقد أي أداء عندما يتم تكليفه بفك ضغط الأصول أثناء اللعب.
على النقيض من ذلك، يمكنك أن ترى أدناه كيف يتعامل RTX 4060 مع إلغاء ضغط وحدة معالجة الرسومات.
يمكن أن يكون تدهور الأداء كبيرًا جدًا من حيث أدنى مستوياته بنسبة 1%، وهو ما يشير إلى مدى سلاسة واستقرار اللعبة عند اجتياز عالم اللعبة. على النقيض من RTX 5060، فإن 4060 يواجه صعوبة عندما يتم تكليفه بفك ضغط الأصول.
ومع ذلك، يعمل إلغاء الضغط باستخدام GPU على النحو المنشود في السلسلة 40 من منظور تدفق النسيج. يتم تحميل الأنسجة في الوقت المحدد، تمامًا كما يحدث في السلسلة 50.
ربما تكون النتيجة الأكثر إثارة للاهتمام هي ما نراه على جهاز كمبيوتر محمول 4060.
مواصفات الكمبيوتر المحمول
- لابتوب آر تي إكس 4060
- إنتل كور i7-13620H
- SSD Gen4
- 16 جيجابايت DDR5
كما ترون، حتى في النظام الذي يحتوي على وحدة معالجة مركزية ذات نهاية منخفضة، ما زلنا نواجه انخفاضًا في الأداء عند نقل مهمة إلغاء الضغط من وحدة المعالجة المركزية إلى وحدة معالجة الرسومات على بطاقة RTX من الجيل السابق. وينطبق هذا حتى عند دقة 720 بكسل عندما نكون مرتبطين بوحدة المعالجة المركزية (يبلغ حمل وحدة معالجة الرسومات في Spider-Man 2 عبر المعيار 76٪).
من خلال الاختبارات، من الواضح أن وحدات معالجة الرسومات Blackwell عبر المكدس لا تواجه أي تدهور في الأداء – بدءًا من 5090 وصولاً إلى 5060. وفي الوقت نفسه، لا تزال وحدات معالجة الرسومات من الجيل السابق تعاني من إلغاء ضغط وحدة معالجة الرسومات، على الأقل تلك التي تم اختبارها هنا.
لماذا تتعامل وحدات معالجة الرسومات Blackwell مع عملية إلغاء ضغط وحدة معالجة الرسومات بشكل أفضل؟
لقد اختبرنا فقط مجموعة محدودة من الأجهزة والسيناريوهات، ولكن نتائجنا تظهر بعض الاتجاهات الواضحة. ليس من الواضح تمامًا سبب تعامل سلسلة RTX 50 مع تخفيف ضغط وحدة معالجة الرسومات بشكل أفضل من سابقاتها. تحتوي وحدات معالجة الرسومات الخاصة بمركز بيانات Blackwell على كتلة مخصصة لتخفيف الضغط، ولكن لا يوجد شيء في ورقة عمل Blackwell الخاصة بالمستهلك يشير إلى أن وحدات معالجة الرسومات الخاصة بالمستهلك تحتوي على مثل هذه الكتلة.
أحد التفسيرات المحتملة هو إضافة جدولة محسنة في بنية بلاكويل. على الرغم من اسمه – معالج إدارة الذكاء الاصطناعي (AMP) – يمكن استخدام برنامج الجدولة لتحسين أي أحمال عمل غير متزامنة تعمل في وقت واحد مع أعباء عمل الرسومات الأخرى، وليس فقط المهام المتعلقة بالذكاء الاصطناعي. يتم تنفيذ AMP باستخدام معالج RISC-V مخصص، وهو ليس شيئًا جديدًا بالنسبة لوحدات معالجة الرسومات NVIDIA، حيث تتميز بطاقات RTX منذ تورينج بمعالجات نظام GPU المستندة إلى RISC-V. ما يبدو جديدًا هو حقيقة أنه تم تصميمه خصيصًا لـ Windows Hardware-Accelerated GPU Scheduling (HAGS)، والذي يسمح لوحدة معالجة الرسومات بالتعامل مع الذاكرة الخاصة بها بشكل أكثر كفاءة دون الحاجة إلى الاعتماد على وحدة المعالجة المركزية.
وفقًا للمستند التقني، يتطابق AMP مع النموذج المعماري لـ Microsoft الذي يصف نواة الجدولة القابلة للتكوين على وحدة معالجة الرسومات من خلال HAGS. يبدو أن AMP أكثر ذكاءً وأكثر كفاءة من برامج الجدولة من الجيل السابق، وقد تكون الجدولة الأسرع والأكثر كفاءة لأحمال العمل غير المتزامنة التي تسهلها هي ما نشهده مع إلغاء ضغط وحدة معالجة الرسومات على وحدات معالجة الرسومات Blackwell.














التعليقات