مسكن / نظام تشغيل الهاتف المحمول / تقنية nvidia gpu Boost 2.0. بطاقات الفيديو. Ansel Game Screenshot منصة

تقنية nvidia gpu Boost 2.0. بطاقات الفيديو. Ansel Game Screenshot منصة

GPU Boost 2.0

مع بطاقة الرسومات NVIDIA GeForce GTX 680 ، لدينا ميزة جديدة مهمة: GPU Boost. وتذهب بطاقة NVIDIA GeForce GTX Titan الجديدة خطوة أخرى إلى الأمام من خلال توسيع هذه الميزة إلى GPU Boost 2.0. ركز الإصدار الأول من GPU Boost 1.0 على الحد الأقصى لاستهلاك الطاقة الذي تم تحقيقه في الألعاب الحديثة الأكثر تطلبًا. في الوقت نفسه ، لم تلعب درجة حرارة وحدة معالجة الرسومات دورًا خاصًا ، إلا إذا اقتربت من العتبة الحرجة. تم تحديد الحد الأقصى لتردد الساعة بناءً على الجهد النسبي. كان العيب واضحًا تمامًا: لم يتمكن GPU Boost 1.0 من منع المواقف التي ترتفع فيها درجة الحرارة بشكل مفرط ، حتى في الفولتية غير الحرجة.

NVIDIA GeForce GTX Titan - GPU Boost 2.0

قامت GeForce GTX Titan بالفعل بتقييم معلمتين: الجهد ودرجة الحرارة. أي أن الجهد النسبي (Vref) محدد بالفعل على أساس هاتين المعلمتين. بالطبع ، سيظل الاعتماد على وحدات معالجة الرسومات الفردية ، نظرًا لوجود تباين في إنتاج الرقائق ، لذلك ستكون كل بطاقة فيديو مختلفة عن أي بطاقة أخرى. لكن NVIDIA تشير إلى أنه من الناحية الفنية ، فإن إضافة درجة الحرارة تسمح بزيادة رفع تردد التشغيل بمعدل 3-7 بالمائة. يمكن نظريًا نقل تقنية GPU Boost 2.0 إلى بطاقات الرسومات الأقدم ، ولكن من غير المرجح أن يحدث هذا.

NVIDIA GeForce GTX Titan - GPU Boost 2.0

دعنا نلقي نظرة فاحصة على GPU Boost 2.0. تدعم الأدوات المساعدة مثل EVGA Precision Tool أو MSI Afterburner GPU Boost 2.0. استخدمنا أداة الدقة EVGA في الإصدار 4.0.

NVIDIA GeForce GTX Titan - GPU Boost 2.0

تدرك GPU Boost 2.0 درجة الحرارة ، وفي درجات الحرارة المنخفضة ، يمكن للتقنية زيادة الأداء بشكل أكبر. يتم ضبط درجة الحرارة المستهدفة (Ttarget) على 80 درجة مئوية افتراضيًا.

NVIDIA GeForce GTX Titan - GPU Boost 2.0

تحتوي تقنية GPU Boost 2.0 على جميع الميزات المألوفة لدينا من الجيل الأول من التكنولوجيا ، ولكن في نفس الوقت تجعل من الممكن أيضًا ضبط جهد أعلى ، وبالتالي ترددات أعلى على مدار الساعة. بالنسبة لكسر السرعة ، من الممكن تغيير الإعدادات. يمكنك تمكين الجهد الزائد لوحدة معالجة الرسومات ، لكن كن على دراية بالتخفيض المحتمل في عمر بطاقة الرسومات.

NVIDIA GeForce GTX Titan - GPU Boost 2.0

يمكن أن يرفع Overclockers Vref و Vmax (OverVoltaging). أراد العديد من المستخدمين هذا على GK104 ، لكن NVIDIA لم تمنح مثل هذه الفرصة للمستخدمين أو الشركات المصنعة. وتعد بطاقة الفيديو المصنفة EVGA GTX 680 التي اختبرناها (الاختبار والمراجعة) مجرد مثال رائع. مع بطاقة الفيديو هذه ، توفر وحدة EVGA Evbot الخاصة للمستخدمين التحكم في الفولتية. لكن NVIDIA طلبت بشكل عاجل من EVGA إزالة الأجهزة الإضافية من بطاقات الرسومات الخاصة بها. في حالة GPU Boost 2.0 و OverVoltaging ، اتخذت NVIDIA نفسها خطوة في هذا الاتجاه. لذلك يمكن لمصنعي بطاقات الرسومات إصدار العديد من طرز GeForce GTX Titan ، مثل الإصدارات القياسية وإصدارات المصنع التي تم رفع تردد التشغيل عنها. يتم تنشيط OverVoltaging من خلال مفتاح VBIOS (أي بشكل صريح للمستخدم حتى يكون على دراية بالعواقب المحتملة).

معاملالمعنى
اسم رمز رقاقةGP104
تكنولوجيا الإنتاج16nm FinFET
عدد الترانزستورات7.2 مليار
منطقة جوهرية314 مم²
هندسة عامة
دعم أجهزة DirectX
ناقل الذاكرة
1607 (1733) ميجا هرتز
كتل الحوسبة20 دفق المعالجات المتعددة بما في ذلك 2560 IEEE 754-2008 ALUs القياسي ذي الفاصلة العائمة ؛
كتل التركيب160 وحدة معالجة وترشيح نسيج مع دعم مكونات FP16 و FP32 في القوام ودعم الترشيح ثلاثي الخطوط ومتباين الخواص لجميع تنسيقات النسيج
دعم المراقبة
مواصفات الجرافيكس المرجعية GeForce GTX 1080
معاملالمعنى
التردد الأساسي1607 (1733) ميجا هرتز
2560
عدد الكتل النسيجية160
عدد كتل المزج64
تردد الذاكرة الفعال10000 (4 × 2500) ميجاهرتز
نوع الذاكرةGDDR5X
ناقل الذاكرة256 بت
حجم الذاكرة8 جيجا
320 جيجا بايت / ثانية
حوالي 9 تيرافلوب
103 جيجابكسل / ثانية
257 جيجاتكسيلس / ثانية
إطار العجلةPCI Express 3.0
موصلات
استهلاك الطاقةحتى 180 واط
المزيد من الطعامموصل واحد من 8 سنون
2
السعر الموصى به599-699 دولارًا (الولايات المتحدة) ، 54990 روبل روسي (روسيا)

تلقى الطراز الجديد من بطاقة الفيديو GeForce GTX 1080 اسمًا منطقيًا للحل الأول لسلسلة GeForce الجديدة - وهو يختلف عن سابقه المباشر فقط في شكل جيل متغير. لا تحل الحداثة محل الحلول المتطورة في الخط الحالي للشركة فحسب ، بل أصبحت أيضًا الرائد في السلسلة الجديدة لبعض الوقت ، حتى تم إصدار Titan X على وحدات معالجة رسومات أكثر قوة. يوجد أدناه في التسلسل الهرمي أيضًا النموذج الذي تم الإعلان عنه بالفعل GeForce GTX 1070 ، استنادًا إلى نسخة مجردة من شريحة GP104 ، والتي سننظر فيها أدناه.

الأسعار المقترحة لبطاقة الرسومات الجديدة من Nvidia هي 599 دولارًا و 699 دولارًا للإصدار العادي وإصدار المؤسسين (انظر أدناه) ، على التوالي ، وهي صفقة جيدة نظرًا لأن GTX 1080 لا يتقدم فقط على GTX 980 Ti ، ولكن أيضًا على Titan X. اليوم المنتج الجديد هو الحل الأفضل من حيث الأداء في سوق بطاقات الفيديو أحادية الشريحة دون أي أسئلة ، وفي نفس الوقت هو أرخص من أقوى بطاقات الفيديو من الجيل السابق. حتى الآن ، لا يوجد منافس لبطاقة GeForce GTX 1080 من AMD ، لذلك تمكنت Nvidia من تحديد السعر الذي يناسبها.

تعتمد بطاقة الفيديو المعنية على شريحة GP104 ، التي تحتوي على ناقل ذاكرة 256 بت ، لكن النوع الجديد من ذاكرة GDDR5X يعمل بتردد فعال للغاية يبلغ 10 جيجاهرتز ، مما يعطي عرض نطاق ترددي مرتفع يبلغ 320 جيجابايت / ثانية - وهو ما يعادل تقريبًا GTX 980 Ti مع ناقل 384 بت. حجم الذاكرة المثبتة على بطاقة الفيديو مع مثل هذا الناقل يمكن أن يكون 4 أو 8 جيجا بايت ، ولكن سيكون من الحماقة تعيين كمية أصغر لمثل هذا الحل القوي في الظروف الحديثة ، لذلك حصلت GTX 1080 على 8 جيجا بايت من الذاكرة ، و هذا المبلغ يكفي لتشغيل أي تطبيقات ثلاثية الأبعاد بأي إعدادات جودة لعدة سنوات قادمة.

تختلف GeForce GTX 1080 PCB بشكل مفهوم تمامًا عن PCBs السابقة للشركة. تبلغ قيمة استهلاك الطاقة النموذجي للعناصر الجديدة 180 واط - أعلى قليلاً من GTX 980 ، ولكنها أقل بشكل ملحوظ من Titan X الأقل قوة و GTX 980 Ti. تحتوي اللوحة المرجعية على مجموعة الموصلات المعتادة لتوصيل أجهزة إخراج الصور: منفذ DVI مزدوج الارتباط ومنفذ HDMI وثلاثة منافذ DisplayPort.

تصميم مرجع إصدار المؤسسين

حتى مع الإعلان عن GeForce GTX 1080 في أوائل شهر مايو ، تم الإعلان عن إصدار خاص من بطاقة الفيديو يسمى Founders Edition ، والذي يتميز بسعر أعلى من بطاقات الفيديو العادية من شركاء الشركة. في الواقع ، هذا الإصدار هو التصميم المرجعي للبطاقة ونظام التبريد ، ويتم إنتاجه بواسطة Nvidia نفسها. يمكن أن يكون لديك مواقف مختلفة تجاه مثل هذه الخيارات لبطاقات الفيديو ، لكن التصميم المرجعي الذي طوره مهندسو الشركة وتم تصنيعه باستخدام مكونات عالية الجودة له معجبوه.

ولكن ما إذا كانوا سيدفعون عدة آلاف روبل أكثر مقابل بطاقة فيديو من Nvidia نفسها ، فهذا سؤال لا يمكن إلا للممارسة الإجابة عليه. على أي حال ، في البداية ستكون بطاقات الفيديو المرجعية من Nvidia التي ستظهر للبيع بسعر أعلى ، وليس هناك الكثير للاختيار من بينها - يحدث هذا مع كل إعلان ، لكن المرجع GeForce GTX 1080 مختلف في ذلك من المخطط أن يتم بيعه بهذا الشكل طوال حياته.حتى إطلاق حلول الجيل التالي.

تعتقد Nvidia أن هذه النسخة لها مزاياها حتى على أفضل أعمال الشركاء. على سبيل المثال ، يجعل التصميم ذو الفتحتين للمبرد من السهل تجميع كل من أجهزة الكمبيوتر المخصصة للألعاب بعامل شكل صغير نسبيًا وأنظمة الفيديو متعددة الشرائح القائمة على بطاقة الفيديو القوية هذه (على الرغم من وضع التشغيل المكون من ثلاث وأربع شرائح لا أوصت به الشركة). تتميز GeForce GTX 1080 Founders Edition ببعض المزايا في شكل مبرد فعال يستخدم غرفة تبخير ومروحة تدفع الهواء الساخن خارج العلبة - وهذا هو أول حل من نوعه من Nvidia يستهلك أقل من 250 واط من الطاقة.

مقارنة بتصاميم المنتجات المرجعية السابقة للشركة ، تمت ترقية دائرة الطاقة من أربع مراحل إلى خمس مراحل. تتحدث Nvidia أيضًا عن المكونات المحسّنة التي يعتمد عليها المنتج الجديد ، كما تم تقليل الضوضاء الكهربائية لتحسين استقرار الجهد وإمكانية رفع تردد التشغيل. نتيجة لجميع التحسينات ، زادت كفاءة الطاقة للوحة المرجعية بنسبة 6٪ مقارنةً بالبطاقة GeForce GTX 980.

ولكي تختلف عن الموديلات "العادية" من GeForce GTX 1080 ظاهريًا ، تم تطوير تصميم غير عادي للهيكل "المفروم" لإصدار Founders Edition. ومع ذلك ، ربما أدى ذلك أيضًا إلى تعقيد شكل غرفة التبخر والمبرد (انظر الصورة) ، والتي ربما كانت أحد أسباب دفع 100 دولار إضافية لمثل هذا الإصدار الخاص. نكرر أنه في بداية المبيعات ، لن يكون للمشترين الكثير من الخيارات ، ولكن في المستقبل سيكون من الممكن اختيار كل من الحل بتصميمهم الخاص من أحد شركاء الشركة ، وتنفيذ Nvidia نفسها.

جيل جديد من معمارية باسكال الرسومية

تعد بطاقة الفيديو GeForce GTX 1080 أول حل للشركة يعتمد على شريحة GP104 ، والتي تنتمي إلى الجيل الجديد من بنية رسومات Nvidia's Pascal. على الرغم من أن البنية الجديدة تعتمد على الحلول التي تم التوصل إليها في Maxwell ، إلا أن لها أيضًا اختلافات وظيفية مهمة ، والتي سنكتب عنها لاحقًا. كان التغيير الرئيسي من وجهة نظر عالمية هو الجديد العملية التكنولوجيةالذي صنعت عليه وحدة معالجة الرسومات الجديدة.

أتاح استخدام تقنية المعالجة FinFET 16 نانومتر في إنتاج معالجات الرسومات GP104 في مصانع الشركة التايوانية TSMC زيادة تعقيد الشريحة بشكل كبير مع الحفاظ على مساحة وتكلفة منخفضة نسبيًا. قارن بين عدد الترانزستورات ومساحة رقاقات GP104 و GM204 - فهي قريبة من المنطقة (شريحة الحداثة أصغر ماديًا) ، لكن شريحة معمارية باسكال تحتوي على عدد أكبر بكثير من الترانزستورات ، وبالتالي ، وحدات التنفيذ ، بما في ذلك تلك التي توفر وظائف جديدة.

من وجهة نظر معمارية ، فإن لعبة Pascal الأولى تشبه إلى حد بعيد الحلول المماثلة لهندسة Maxwell ، على الرغم من وجود بعض الاختلافات. مثل Maxwell ، سيكون لمعالجات Pascal المعمارية تكوينات مختلفة لمجموعات معالجة الرسومات (GPCs) ، والمعالجات المتعددة المتدفقة (SMs) ، ووحدات التحكم في الذاكرة. تعد المعالجات SM متعددة المعالجات المتوازية للغاية والتي تقوم بجدولة وتشغيل الاعوجاج (الاعوجاج ، مجموعات من 32 تدفقات تعليمات) على نوى CUDA ووحدات التنفيذ الأخرى في المعالجات المتعددة. يمكنك العثور على معلومات مفصلة حول تصميم كل هذه الكتل في مراجعاتنا لحلول Nvidia السابقة.

يتم إقران كل من المعالجات المتعددة SM مع محرك PolyMorph ، الذي يتعامل مع عينات النسيج ، والتغطية بالفسيفساء ، والتحويل ، وإعداد سمات الرأس ، وتصحيح المنظور. على عكس الحلول السابقة للشركة ، يحتوي محرك PolyMorph في شريحة GP104 أيضًا على كتلة متعددة الإسقاطات المتزامنة الجديدة ، والتي سنناقشها أدناه. الجمع بين المعالجات SM ومحرك واحد متعدد الأشكال يسمى تقليديًا TPC - Texture Processor Cluster for Nvidia.

في المجموع ، تحتوي شريحة GP104 في GeForce GTX 1080 على أربع مجموعات GPC و 20 SM معالجات متعددة ، بالإضافة إلى ثمانية وحدات تحكم في الذاكرة مدمجة مع 64 ROPs. تحتوي كل مجموعة GPC على محرك تنقيط مخصص وتتضمن خمسة SMs. يتكون كل متعدد المعالجات بدوره من 128 نواة CUDA ، وملف تسجيل 256 كيلوبايت ، وذاكرة مشتركة 96 كيلوبايت ، وذاكرة تخزين مؤقت سعة 48 كيلوبايت L1 ، وثماني وحدات نسيج TMU. أي ، في المجموع ، يحتوي GP104 على 2560 نواة CUDA و 160 وحدة TMU.

أيضًا ، يحتوي معالج الرسومات الذي يعتمد عليه GeForce GTX 1080 على ثمانية وحدات تحكم ذاكرة 32 بت (على عكس 64 بت المستخدمة سابقًا) ، مما يمنحنا ناقل ذاكرة نهائي 256 بت. ثمانية ROPs و 256 كيلوبايت من ذاكرة التخزين المؤقت L2 مرتبطة بكل من وحدات التحكم في الذاكرة. أي ، في المجموع ، تحتوي شريحة GP104 على 64 ROPs و 2048 كيلوبايت من ذاكرة التخزين المؤقت L2.

بفضل التحسينات المعمارية وتقنية المعالجة الجديدة ، أصبحت Pascal المخصصة للألعاب هي وحدة معالجة الرسومات الأكثر كفاءة في استخدام الطاقة على الإطلاق. علاوة على ذلك ، هناك مساهمة في ذلك من واحدة من أكثر العمليات التكنولوجية تقدمًا 16 نانومتر FinFET ، ومن التحسينات المعمارية التي تم إجراؤها في باسكال ، مقارنة بماكسويل. تمكنت Nvidia من زيادة سرعة الساعة أكثر مما توقعت عند الانتقال إلى تقنية عملية جديدة. يعمل GP104 بتردد أعلى من GM204 الافتراضي المصنوع باستخدام عملية 16 نانومتر. للقيام بذلك ، كان على مهندسي Nvidia التحقق بعناية وتحسين جميع الاختناقات في الحلول السابقة التي تمنع رفع تردد التشغيل فوق حد معين. نتيجة لذلك ، تعمل GeForce GTX 1080 الجديدة بسرعات ساعة أعلى بنسبة 40٪ من GeForce GTX 980. ولكن هذا ليس كل ما يتعلق بتغييرات ساعة GPU.

تقنية GPU Boost 3.0

كما نعلم جيدًا من بطاقات رسومات Nvidia السابقة ، فإنهم يستخدمون تقنية GPU Boost في وحدات معالجة الرسومات الخاصة بهم ، المصممة لزيادة سرعة ساعة تشغيل وحدة معالجة الرسومات في الأوضاع التي لم تصل فيها بعد إلى استهلاك الطاقة والحدود الحرارية. على مر السنين ، خضعت هذه الخوارزمية للعديد من التغييرات ، والجيل الثالث من هذه التقنية مستخدم بالفعل في شريحة فيديو معمارية باسكال - GPU Boost 3.0 ، والذي يتمثل ابتكاره الرئيسي في إعداد أدق للترددات التوربينية ، اعتمادًا على الجهد.

إذا كنت تتذكر كيف يعمل الإصدارات السابقةتم إصلاح الفرق بين التردد الأساسي (قيمة التردد الدنيا المضمونة التي لا تقل وحدة معالجة الرسومات دونها ، على الأقل في الألعاب) وتردد التوربو. وهذا يعني أن تردد التوربو كان دائمًا عند كمية معينة منميغا هرتز فوق القاعدة. قدم GPU Boost 3.0 القدرة على ضبط إزاحة تردد التربو لكل جهد على حدة. أسهل طريقة لفهم ذلك هي من خلال الرسم التوضيحي:

على اليسار يوجد GPU Boost من الإصدار الثاني ، على اليمين - الثالث ، الذي ظهر في باسكال. لم يسمح الاختلاف الثابت بين الترددات الأساسية والتربوية بالكشف عن الإمكانات الكاملة لوحدة معالجة الرسومات ، وفي بعض الحالات ، يمكن أن تعمل وحدات معالجة الرسومات للأجيال السابقة بشكل أسرع على ضبط الجهد، لكن الزيادة الثابتة في تردد التوربو لم تسمح بذلك. في GPU Boost 3.0 ، ظهرت هذه الميزة ، ويمكن ضبط تردد التوربو لكل من قيم الجهد الفردية ، مما يؤدي إلى الضغط تمامًا على كل العصير من وحدة معالجة الرسومات.

يلزم وجود أدوات مساعدة يدوية لإدارة زيادة تردد التشغيل وضبط منحنى تردد التوربو. Nvidia نفسها لا تفعل ذلك ، ولكنها تساعد شركائها على إنشاء مثل هذه المرافق لتسهيل رفع تردد التشغيل (ضمن حدود معقولة ، بالطبع). على سبيل المثال ، جديد وظائفتم الكشف عن GPU Boost 3.0 بالفعل في EVGA Precision XOC ، والذي يتضمن ماسحًا خاصًا لرفع تردد التشغيل يقوم تلقائيًا باكتشاف وتعيين الفرق غير الخطي بين التردد الأساسي وتردد التوربو عند الفولتية المختلفة عن طريق تشغيل اختبار أداء واستقرار مدمجين. نتيجة لذلك ، يحصل المستخدم على منحنى تردد توربو يطابق تمامًا إمكانيات شريحة معينة. والتي ، علاوة على ذلك ، يمكن تعديلها بأي شكل من الأشكال الوضع اليدوي.

كما ترى في لقطة شاشة الأداة المساعدة ، بالإضافة إلى معلومات حول وحدة معالجة الرسومات والنظام ، هناك أيضًا إعدادات لرفع تردد التشغيل: Power Target (يحدد استهلاك الطاقة النموذجي أثناء رفع تردد التشغيل ، كنسبة مئوية من المعيار) ، GPU Temp Target (الحد الأقصى لدرجة الحرارة الأساسية المسموح بها) ، إزاحة ساعة وحدة معالجة الرسومات (تجاوز التردد الأساسي لجميع قيم الجهد) ، إزاحة الذاكرة (تجاوز تردد ذاكرة الفيديو على القيمة الافتراضية) ، الجهد الزائد (فرصة إضافية لزيادة الجهد).

تتضمن الأداة المساعدة Precision XOC ثلاثة أوضاع لرفع تردد التشغيل: أساسي وخطي ويدوي. في الوضع الرئيسي ، يمكنك تعيين قيمة واحدة لرفع تردد التشغيل (تردد توربو ثابت) فوق القيمة الأساسية ، كما كان الحال مع وحدات معالجة الرسومات السابقة. يتيح لك الوضع الخطي ضبط منحدر التردد من الحد الأدنى إلى قيم الجهد القصوى لوحدة معالجة الرسومات. حسنًا ، في الوضع اليدوي ، يمكنك تعيين قيم تردد وحدة معالجة الرسومات الفريدة لكل نقطة جهد على الرسم البياني.

تتضمن الأداة أيضًا ماسحًا ضوئيًا خاصًا لرفع تردد التشغيل تلقائيًا. يمكنك إما تعيين مستويات التردد الخاصة بك أو السماح لـ Precision XOC بفحص وحدة معالجة الرسومات في جميع الفولتية والعثور على الترددات الأكثر ثباتًا لكل نقطة على منحنى الجهد والتردد تلقائيًا. أثناء عملية المسح ، تعمل تقنية Precision XOC على زيادة تردد وحدة معالجة الرسومات (GPU) بشكل تدريجي وتتحقق من تشغيلها للتأكد من ثباتها أو عيوبها ، مما يؤدي إلى إنشاء منحنى مثالي للتردد والجهد يكون فريدًا لكل شريحة محددة.

يمكن تخصيص هذا الماسح الضوئي وفقًا لمتطلباتك الخاصة عن طريق تعيين الفاصل الزمني لاختبار كل قيمة جهد ، والحد الأدنى والأقصى للتردد المطلوب اختباره ، وخطوته. من الواضح أنه من أجل تحقيق نتائج مستقرة ، سيكون من الأفضل تحديد خطوة صغيرة ومدة اختبار مناسبة. أثناء الاختبار ، يمكن ملاحظة التشغيل غير المستقر لبرنامج تشغيل الفيديو والنظام ، ولكن إذا لم يتجمد الماسح الضوئي ، فسوف يستعيد التشغيل ويستمر في العثور على الترددات المثلى.

نوع جديد من ذاكرة الفيديو GDDR5X وضغط محسّن

إذن القوة GPUزاد بشكل ملحوظ ، وبقي ناقل الذاكرة 256 بت فقط - هل سيحد عرض النطاق الترددي للذاكرة من الأداء العام وما الذي يمكن فعله حيال ذلك؟ يبدو أن الجيل الثاني الواعد من HBM لا يزال مكلفًا للغاية في التصنيع ، لذلك كان لابد من البحث عن خيارات أخرى. منذ إدخال ذاكرة GDDR5 في عام 2009 ، كان مهندسو Nvidia يستكشفون إمكانيات استخدام أنواع جديدة من الذاكرة. نتيجة لذلك ، جاءت التطورات لإدخال معيار ذاكرة جديد GDDR5X - المعيار الأكثر تعقيدًا وتقدماً حتى الآن ، مما يوفر معدل نقل يبلغ 10 جيجابت في الثانية.

تقدم Nvidia مثالًا مثيرًا للاهتمام عن مدى سرعة هذا. تنقضي 100 بيكو ثانية فقط بين البتات المرسلة - خلال هذا الوقت ، سوف ينتقل شعاع من الضوء مسافة بوصة واحدة فقط (حوالي 2.5 سم). وعند استخدام ذاكرة GDDR5X ، يتعين على دوائر استقبال البيانات اختيار قيمة البتة المرسلة في أقل من نصف هذا الوقت قبل إرسال الثانية - وهذا فقط لفهم ما وصلت إليه التكنولوجيا الحديثة.

يتطلب تحقيق هذه السرعة تطوير بنية نظام إدخال / إخراج جديدة تطلبت عدة سنوات من التطوير المشترك مع الشركات المصنعة لشرائح الذاكرة. بالإضافة إلى زيادة معدل نقل البيانات ، زادت كفاءة الطاقة أيضًا - تستخدم رقائق ذاكرة GDDR5X جهدًا منخفضًا يبلغ 1.35 فولت ويتم تصنيعها باستخدام تقنيات جديدة ، مما يعطي نفس استهلاك الطاقة بتردد أعلى بنسبة 43٪.

اضطر مهندسو الشركة إلى إعادة صياغة خطوط نقل البيانات بين نواة وحدة معالجة الرسومات وشرائح الذاكرة ، مع إيلاء المزيد من الاهتمام لمنع فقدان الإشارة وتدهور الإشارة على طول الطريق من الذاكرة إلى وحدة معالجة الرسومات والعكس. لذلك ، في الرسم التوضيحي أعلاه ، تظهر الإشارة الملتقطة على أنها "عين" متناظرة كبيرة ، مما يشير إلى التحسين الجيد للدائرة بأكملها والسهولة النسبية لالتقاط البيانات من الإشارة. علاوة على ذلك ، لم تؤد التغييرات الموضحة أعلاه إلى إمكانية استخدام GDDR5X بتردد 10 جيجاهرتز فحسب ، بل يجب أن تساعد أيضًا في الحصول على نطاق ترددي عالي للذاكرة على المنتجات المستقبلية باستخدام ذاكرة GDDR5 الأكثر شيوعًا.

حسنًا ، لقد حصلنا على زيادة بنسبة 40٪ في عرض النطاق الترددي للذاكرة من استخدام الذاكرة الجديدة. لكن ألا يكفي ذلك؟ لزيادة كفاءة عرض النطاق الترددي للذاكرة ، واصلت Nvidia تحسين ضغط البيانات المتقدم الذي تم تقديمه في البنى السابقة. يستخدم النظام الفرعي للذاكرة في GeForce GTX 1080 العديد من تقنيات ضغط البيانات الجديدة المحسنة بدون فقدان البيانات المصممة لتقليل متطلبات النطاق الترددي - وهو بالفعل الجيل الرابع من الضغط على الشريحة.

تجلب خوارزميات ضغط البيانات في الذاكرة العديد من الجوانب الإيجابية في وقت واحد. يقلل الضغط من كمية البيانات المكتوبة في الذاكرة ، وينطبق الشيء نفسه على البيانات المنقولة من ذاكرة الفيديو إلى ذاكرة التخزين المؤقت L2 ، مما يحسن من كفاءة استخدام ذاكرة التخزين المؤقت L2 ، نظرًا لأن التجانب المضغوط (كتلة من عدة بكسلات حافظة إطارات) لها حجم أصغر من واحد غير مضغوط. كما أنه يقلل من كمية البيانات المرسلة بين نقاط مختلفة ، مثل وحدة نسيج TMU ومخزن الإطارات.

يستخدم خط أنابيب ضغط البيانات في وحدة معالجة الرسومات عدة خوارزميات ، والتي يتم تحديدها اعتمادًا على "قابلية ضغط" البيانات - يتم تحديد أفضل خوارزمية متاحة لها. واحدة من أهمها هي خوارزمية دلتا لضغط الألوان. تقوم طريقة الضغط هذه بترميز البيانات على أنها الفرق بين القيم المتتالية بدلاً من البيانات نفسها. تحسب وحدة معالجة الرسومات الاختلاف في قيم اللون بين وحدات البكسل في كتلة (تجانب) وتخزن الكتلة على أنها لون متوسط ​​للكتلة بأكملها بالإضافة إلى بيانات عن الفرق في القيم لكل بكسل. بالنسبة لبيانات الرسوم ، عادةً ما تكون هذه الطريقة مناسبة تمامًا ، نظرًا لأن اللون داخل المربعات الصغيرة لجميع وحدات البكسل لا يختلف كثيرًا في كثير من الأحيان.

تدعم GP104 GPU في GeForce GTX 1080 خوارزميات ضغط أكثر من رقائق Maxwell السابقة. وهكذا ، أصبحت خوارزمية الضغط 2: 1 أكثر كفاءة ، وبالإضافة إلى ذلك ، ظهرت خوارزميتان جديدتان: وضع ضغط 4: 1 ، مناسب للحالات التي يكون فيها الاختلاف في قيمة لون وحدات البكسل للكتلة كبيرًا جدًا. صغير ، ووضع 8: 1 ، والذي يجمع بين ضغط ثابت 4: 1 من كتل 2 × 2 بكسل مع ضغط دلتا 2x بين الكتل. عندما لا يكون الضغط ممكنًا على الإطلاق ، لا يتم استخدامه.

ومع ذلك ، في الواقع ، يحدث هذا الأخير بشكل غير منتظم. يمكن ملاحظة ذلك من خلال لقطات الشاشة النموذجية للعبة Project CARS ، والتي استشهدت بها Nvidia لتوضيح زيادة نسبة الضغط في باسكال. في الرسوم التوضيحية ، كانت مربعات الإطار المؤقت التي يمكن لوحدة معالجة الرسومات ضغطها مظللة باللون الأرجواني ، وتلك التي لا يمكن ضغطها دون فقد اللون ظلت باللون الأصلي (أعلى - ماكسويل ، أسفل - باسكال).

كما ترى ، فإن خوارزميات الضغط الجديدة في GP104 تعمل حقًا بشكل أفضل مما كانت عليه في Maxwell. على الرغم من أن العمارة القديمة كانت قادرة أيضًا على ضغط معظم البلاط في المشهد ، إلا أن الكثير من الحشائش والأشجار حول الحواف ، وكذلك أجزاء السيارة ، لا تخضع لخوارزميات الضغط القديمة. ولكن مع تضمين تقنيات جديدة في باسكال ، ظل عدد قليل جدًا من مناطق الصورة غير مضغوطة - ومن الواضح أن الكفاءة المحسنة.

نتيجة للتحسينات في ضغط البيانات ، تستطيع GeForce GTX 1080 تقليل كمية البيانات المرسلة لكل إطار بشكل كبير. بالأرقام ، يوفر الضغط المحسّن 20٪ إضافية من عرض النطاق الترددي الفعال للذاكرة. بالإضافة إلى زيادة عرض النطاق الترددي لذاكرة GeForce GTX 1080 بأكثر من 40٪ بالنسبة إلى GTX 980 من استخدام ذاكرة GDDR5X ، كل هذا معًا يعطي زيادة بنسبة 70٪ في عرض النطاق الترددي الفعال للذاكرة مقارنة بطراز الجيل السابق.

دعم حساب Async

تستخدم معظم الألعاب الحديثة حسابات معقدة بالإضافة إلى الرسومات. على سبيل المثال ، يمكن إجراء الحسابات عند حساب سلوك الأجسام المادية ليس قبل أو بعد الحسابات الرسومية ، ولكن في نفس الوقت معها ، لأنها لا ترتبط ببعضها البعض ولا تعتمد على بعضها البعض في نفس الإطار. مثال آخر هو المعالجة اللاحقة للإطارات التي تم عرضها بالفعل ومعالجة البيانات الصوتية ، والتي يمكن إجراؤها أيضًا بالتوازي مع العرض.

مثال واضح آخر على هذه الوظيفة هو تقنية Asynchronous Time Warp المستخدمة في أنظمة الواقع الافتراضي لتغيير الإطار الذي تم تقديمه وفقًا لحركة رأس اللاعب قبل تقديمه مباشرةً ، مما يؤدي إلى مقاطعة عرض الإطار التالي. يسمح هذا التحميل غير المتزامن لقدرات وحدة معالجة الرسومات بزيادة كفاءة استخدام وحدات التنفيذ الخاصة بها.

تخلق أحمال العمل هذه سيناريوهين جديدين لاستخدام وحدة معالجة الرسومات. يتضمن أولها الأحمال المتداخلة ، نظرًا لأن العديد من أنواع المهام لا تستخدم إمكانات وحدات معالجة الرسومات بشكل كامل ، وبعض الموارد خاملة. في مثل هذه الحالات ، يمكنك ببساطة تشغيل مهمتين مختلفتين على نفس وحدة معالجة الرسومات ، وفصل وحدات التنفيذ الخاصة بها للحصول على المزيد استخدام فعال- على سبيل المثال ، تأثيرات PhysX التي تعمل بالتزامن مع عرض الإطارات ثلاثية الأبعاد.

لتحسين أداء هذا السيناريو ، قدمت معمارية باسكال موازنة تحميل ديناميكية. في بنية Maxwell السابقة ، تم تنفيذ أحمال العمل المتداخلة كتوزيع ثابت لموارد وحدة معالجة الرسومات بين الرسومات والحساب. هذا النهج فعال بشرط أن التوازن بين عبء العمل يتوافق تقريبًا مع تقسيم الموارد وتشغيل المهام بالتساوي في الوقت المناسب. إذا استغرقت العمليات الحسابية غير الرسومية وقتًا أطول من العمليات الحسابية ، وكان كلاهما في انتظار الانتهاء من العمل المشترك ، فسيكون جزء من وحدة معالجة الرسومات خاملاً للوقت المتبقي ، مما سيؤدي إلى انخفاض في الأداء العام وإلغاء جميع الفوائد. من ناحية أخرى ، تتيح لك موازنة الحمل الديناميكي للأجهزة استخدام موارد GPU التي تم تحريرها بمجرد توفرها - من أجل الفهم ، سنقدم توضيحًا.

هناك أيضًا مهام ذات أهمية زمنية ، وهذا هو السيناريو الثاني للحوسبة غير المتزامنة. على سبيل المثال ، يجب أن يكتمل تنفيذ خوارزمية تشوه الوقت غير المتزامن في الواقع الافتراضي قبل المسح وإلا سيتم تجاهل الإطار. في مثل هذه الحالة ، يجب أن تدعم وحدة معالجة الرسومات (GPU) مقاطعة المهام بسرعة كبيرة والتبديل إلى مهمة أخرى من أجل القيام بمهمة أقل أهمية من التنفيذ على وحدة معالجة الرسومات ، وتحرير مواردها للمهام الحرجة - وهذا ما يسمى الاستباق.

يمكن أن يحتوي أمر تجسيد واحد من محرك اللعبة على المئات من استدعاءات السحب ، وتحتوي كل مكالمة سحب بدورها على مئات من المثلثات المعروضة ، كل منها يحتوي على مئات من وحدات البكسل ليتم حسابها ورسمها. يستخدم نهج GPU التقليدي مقاطعة المهام عالية المستوى فقط ، ويجب أن ينتظر خط أنابيب الرسومات حتى يكتمل كل هذا العمل قبل تبديل المهام ، مما يؤدي إلى زمن انتقال مرتفع للغاية.

لإصلاح ذلك ، أدخلت بنية باسكال أولاً القدرة على مقاطعة مهمة على مستوى البكسل - Pixel Level Preemption. يمكن لوحدات تنفيذ Pascal GPU مراقبة تقدم مهام العرض باستمرار ، وعند طلب مقاطعة ، يمكنهم إيقاف التنفيذ ، وحفظ السياق لإكماله لاحقًا عن طريق التبديل بسرعة إلى مهمة أخرى.

تعمل المقاطعة والتبديل على مستوى الخيط لعمليات الحوسبة بشكل مشابه لمقاطعة مستوى البكسل لحساب الرسومات. تتكون أعباء العمل الحسابية من شبكات متعددة ، كل منها يحتوي على خيوط متعددة. عند تلقي طلب مقاطعة ، تنهي مؤشرات الترابط التي تعمل على المعالجات المتعددة تنفيذها. تقوم الكتل الأخرى بحفظ حالتها الخاصة للاستمرار من نفس النقطة في المستقبل ، وتتحول وحدة معالجة الرسومات إلى مهمة أخرى. تستغرق عملية تبديل المهام بأكملها أقل من 100 ميكروثانية بعد خروج خيوط التشغيل.

بالنسبة لأحمال عمل الألعاب ، فإن الجمع بين المقاطعات على مستوى البكسل للرسومات والمقاطعات على مستوى الخيط لمهام الحوسبة يمنح وحدات معالجة الرسومات الخاصة بمعمارية Pascal القدرة على التبديل بسرعة بين المهام بأقل ضياع للوقت. وبالنسبة لمهام الحوسبة على CUDA ، من الممكن أيضًا المقاطعة بأقل قدر من التفصيل - على مستوى التعليمات. في هذا الوضع ، تتوقف جميع سلاسل الرسائل عن التنفيذ مرة واحدة ، وتتحول فورًا إلى مهمة أخرى. يتطلب هذا الأسلوب حفظ المزيد من المعلومات حول حالة جميع سجلات كل مؤشر ترابط ، ولكن في بعض حالات الحسابات غير الرسومية يكون ذلك مبررًا تمامًا.

تمت إضافة استخدام المقاطعات السريعة وتبديل المهام في المهام الرسومية والحسابية إلى بنية باسكال بحيث يمكن مقاطعة المهام الرسومية وغير الرسومية على مستوى التعليمات الفردية ، بدلاً من الخيوط بأكملها ، كما كان الحال مع Maxwell و Kepler . يمكن لهذه التقنيات تحسين التنفيذ غير المتزامن لأحمال عمل GPU المختلفة وتحسين الاستجابة عند تشغيل مهام متعددة في نفس الوقت. في حدث Nvidia ، أظهروا عرضًا لعمل الحسابات غير المتزامنة باستخدام مثال حساب التأثيرات الفيزيائية. إذا كان الأداء بدون الحسابات غير المتزامنة عند مستوى 77-79 إطارًا في الثانية ، فعند تضمين هذه الميزات ، زاد معدل الإطارات إلى 93-94 إطارًا في الثانية.

لقد قدمنا ​​بالفعل مثالاً على أحد إمكانيات استخدام هذه الوظيفة في الألعاب في شكل تشويه زمني غير متزامن في الواقع الافتراضي. يوضح الرسم التوضيحي تشغيل هذه التقنية بمقاطعة تقليدية (وقائية) وسريعة. في الحالة الأولى ، تتم محاولة تنفيذ عملية تشويه الوقت غير المتزامن في وقت متأخر قدر الإمكان ، ولكن قبل بدء تحديث الصورة على الشاشة. ولكن يجب أن يتم تنفيذ عمل الخوارزمية في وحدة معالجة الرسومات قبل بضعة أجزاء من الثانية ، لأنه بدون مقاطعة سريعة لا توجد طريقة لتنفيذ العمل بدقة في الوقت المناسب ، وتكون وحدة معالجة الرسومات خامدة لبعض الوقت.

في حالة الانقطاع الدقيق على مستوى البكسل والخيط (كما هو موضح على اليمين) ، توفر هذه الإمكانية دقة أكبر في تحديد لحظة الانقطاع ، ويمكن بدء التواء الوقت غير المتزامن لاحقًا بثقة في إكمال العمل قبل يبدأ تحديث المعلومات على الشاشة. وخاملاً لبعض الوقت في الحالة الأولى ، يمكن تحميل وحدة معالجة الرسومات ببعض الأعمال الرسومية الإضافية.

تقنية الإسقاط المتعدد المتزامن

يدعم GP104 GPU الجديد الآن تكنولوجيا جديدةمتعدد الإسقاط (متعدد الإسقاطات في وقت واحد - SMP) ، والذي يسمح لوحدة معالجة الرسومات تقديم البيانات على أنظمة التصوير الحديثة بشكل أكثر كفاءة. يسمح SMP لشريحة الفيديو بعرض البيانات في وقت واحد في العديد من الإسقاطات ، الأمر الذي يتطلب إدخال كتلة أجهزة جديدة في وحدة معالجة الرسومات كجزء من محرك PolyMorph في نهاية خط الأنابيب الهندسي قبل كتلة التنقيط. هذه الكتلة مسؤولة عن العمل مع الإسقاطات المتعددة لتيار هندسي واحد.

يعالج المحرك متعدد الإسقاط البيانات الهندسية في وقت واحد لـ 16 إسقاطًا تم تكوينه مسبقًا تجمع بين نقطة العرض (الكاميرات) ، ويمكن تدوير هذه الإسقاطات أو إمالتها بشكل مستقل. نظرًا لأن كل هندسة بدائية يمكن أن تظهر في وقت واحد في إسقاطات متعددة ، فإن محرك SMP يوفر هذه الوظيفة ، مما يسمح للتطبيق بتوجيه شريحة الفيديو لتكرار الهندسة حتى 32 مرة (16 إسقاطًا في مركزي عرض) دون معالجة إضافية.

يتم تسريع عملية المعالجة بالكامل من خلال الأجهزة ، وبما أن الإرسال المتعدد يعمل بعد المحرك الهندسي ، فإنه لا يحتاج إلى تكرار جميع مراحل المعالجة الهندسية عدة مرات. تعتبر الموارد المحفوظة مهمة عندما تكون سرعة العرض محدودة بأداء المعالجة الهندسية ، مثل التغطية بالفسيفساء ، عندما يتم تنفيذ نفس العمل الهندسي عدة مرات لكل إسقاط. وفقًا لذلك ، في حالة الذروة ، يمكن أن يقلل الإسقاط المتعدد من الحاجة إلى المعالجة الهندسية بما يصل إلى 32 مرة.

لكن لماذا كل هذا ضروري؟ هناك العديد من الأمثلة الجيدة حيث يمكن أن تكون تقنية الإسقاط المتعدد مفيدة. على سبيل المثال ، نظام متعدد الشاشات يتكون من ثلاث شاشات مثبتة بزاوية مع بعضها البعض قريبة بدرجة كافية من المستخدم (تكوين محيطي). في حالة نموذجية ، يتم تقديم المشهد في إسقاط واحد ، مما يؤدي إلى تشوهات هندسية وتصيير هندسي غير صحيح. الطريقة الصحيحة هي ثلاثة إسقاطات مختلفة لكل من الشاشات ، وفقًا للزاوية التي توجد بها.

باستخدام بطاقة فيديو على شريحة بهندسة باسكال ، يمكن القيام بذلك في مسار هندسي واحد ، مع تحديد ثلاثة إسقاطات مختلفة ، كل منها لشاشة مختلفة. وبالتالي ، سيكون المستخدم قادرًا على تغيير الزاوية التي توجد بها الشاشات لبعضها البعض ليس فقط ماديًا ، ولكن أيضًا افتراضيًا - من خلال تدوير الإسقاطات للشاشات الجانبية من أجل الحصول على المنظور الصحيح في المشهد ثلاثي الأبعاد باستخدام زاوية عرض أوسع بشكل ملحوظ (FOV). صحيح ، هناك قيود هنا - لمثل هذا الدعم ، يجب أن يكون التطبيق قادرًا على عرض المشهد بمجال رؤية واسع واستخدام استدعاءات SMP API الخاصة لتعيينه. وهذا يعني أنه لا يمكنك القيام بذلك في كل لعبة ، فأنت بحاجة إلى دعم خاص.

على أي حال ، انتهت أيام الإسقاط الفردي على شاشة مسطحة واحدة ، وهناك الآن العديد من تكوينات الشاشات المتعددة والشاشات المنحنية التي يمكنها أيضًا استخدام هذه التقنية. ناهيك عن أنظمة الواقع الافتراضي التي تستخدم عدسات خاصة بين الشاشات وعين المستخدم ، والتي تتطلب تقنيات جديدة لإسقاط صورة ثلاثية الأبعاد في صورة ثنائية الأبعاد. لا يزال العديد من هذه التقنيات والتقنيات في مرحلة التطوير المبكر ، والشيء الرئيسي هو أن وحدات معالجة الرسومات القديمة لا يمكنها استخدام أكثر من إسقاط مستوٍ بشكل فعال. إنها تتطلب تصاريح عرض متعددة ، ومعالجة متعددة لنفس الشكل الهندسي ، وما إلى ذلك.

تتمتع رقائق Maxwell بدعم Multi-Resolution محدود للمساعدة في زيادة الكفاءة ، لكن SMP الخاص بـ Pascal يمكنه فعل المزيد. كان بإمكان ماكسويل تدوير الإسقاط بمقدار 90 درجة لرسم خرائط المكعب أو دقة عرض مختلفة ، لكن هذا كان مفيدًا فقط في نطاق محدود من التطبيقات مثل VXGI.

تشمل الاحتمالات الأخرى لاستخدام SMP التقديم بدقة مختلفة وعرض ستريو أحادي التمرير. على سبيل المثال ، يمكن استخدام العرض بدقة مختلفة (تظليل متعدد الدقة) في الألعاب لتحسين الأداء. عند التطبيق ، يتم استخدام دقة أعلى في وسط الإطار ، وفي المحيط يتم تقليلها للحصول على سرعة عرض أسرع.

يتم استخدام عرض الاستريو أحادي التمرير في VR ، وقد تمت إضافته بالفعل إلى حزمة VRWorks ويستخدم ميزة الإسقاط المتعدد لتقليل مقدار العمل الهندسي المطلوب في عرض VR. في حالة استخدام هذه الميزة ، تقوم وحدة معالجة الرسومات GeForce GTX 1080 بمعالجة هندسة المشهد مرة واحدة فقط ، مما ينتج عنه عرضين لكل عين في وقت واحد ، مما يقلل الحمل الهندسي على وحدة معالجة الرسومات بمقدار النصف ، كما يقلل أيضًا من الخسائر من السائق ونظام التشغيل.

هناك تقنية أكثر تقدمًا لتحسين كفاءة عرض الواقع الافتراضي وهي تظليل العدسة المتطابق ، والذي يستخدم إسقاطات متعددة لمحاكاة التشوهات الهندسية المطلوبة في عرض الواقع الافتراضي. تستخدم هذه الطريقة الإسقاط المتعدد لعرض مشهد ثلاثي الأبعاد على سطح يقترب من السطح المعدل للعدسة عند تقديمه لإخراج سماعة رأس VR ، مما يؤدي إلى تجنب العديد من وحدات البكسل الإضافية على الأطراف التي سيتم تجاهلها. أسهل طريقة لفهم جوهر الطريقة هي عن طريق التوضيح - تُستخدم أربعة إسقاطات موسعة قليلاً أمام كل عين (في باسكال ، يمكنك استخدام 16 إسقاطًا لكل عين - لمحاكاة العدسة المنحنية بشكل أكثر دقة) بدلاً من واحدة:

يمكن أن يؤدي هذا النهج إلى توفير كبير في الأداء. على سبيل المثال ، تبلغ صورة Oculus Rift النموذجية لكل عين 1.1 ميغا بكسل. ولكن نظرًا للاختلاف في الإسقاطات ، فإن الصورة الأصلية تبلغ 2.1 ميجا بكسل - 86٪ أكثر من اللازم! يسمح استخدام الإسقاط المتعدد ، المنفذ في معمارية باسكال ، بتقليل دقة الصورة المقدمة إلى 1.4 ميجابكسل ، والحصول على توفير 1.5 ضعف في سرعة معالجة البكسل ، وكذلك توفير عرض النطاق الترددي للذاكرة.

وإلى جانب التوفير المزدوج في سرعة المعالجة الهندسية بسبب عرض الاستريو أحادي التمرير ، فإن معالج الرسوميات GeForce GTX 1080 قادر على توفير زيادة كبيرة في أداء عرض الواقع الافتراضي ، وهو أمر يتطلب الكثير من سرعة المعالجة الهندسية ، وأكثر من ذلك. معالجة البكسل.

تحسينات في إخراج الفيديو وكتل المعالجة

بالإضافة إلى الأداء والوظائف الجديدة المتعلقة بالعرض ثلاثي الأبعاد ، من الضروري الحفاظ على مستوى جيد من إخراج الصورة ، بالإضافة إلى فك تشفير الفيديو وترميزه. ولم يخيب أول معالج رسومي للهندسة المعمارية Pascal الآمال - فهو يدعم جميع المعايير الحديثة بهذا المعنى ، بما في ذلك فك تشفير الأجهزة بتنسيق HEVC ، وهو أمر ضروري لعرض مقاطع فيديو 4K على جهاز كمبيوتر. أيضًا ، سيتمكن مالكو بطاقات الرسومات GeForce GTX 1080 في المستقبل قريبًا من الاستمتاع ببث مقاطع فيديو بدقة 4K من Netflix ومقدمي الخدمات الآخرين على أنظمتهم.

من حيث إخراج الشاشة ، تدعم GeForce GTX 1080 HDMI 2.0b مع HDCP 2.2 بالإضافة إلى DisplayPort. حتى الآن ، تم اعتماد إصدار DP 1.2 ، لكن وحدة معالجة الرسومات جاهزة للحصول على الشهادة للإصدارات الأحدث من المعيار: DP 1.3 Ready و DP 1.4 Ready. يسمح هذا الأخير بعرض شاشات 4K عند 120 هرتز ، وشاشات 5K و 8K عند 60 هرتز باستخدام زوج من كبلات DisplayPort 1.3. إذا كان الحد الأقصى للدقة المدعومة بالنسبة إلى GTX 980 هو 5120 × 3200 عند 60 هرتز ، فقد نما طراز GTX 1080 الجديد إلى 7680 × 4320 عند نفس 60 هرتز. يحتوي المرجع GeForce GTX 1080 على ثلاثة مخارج DisplayPort ، أحدهما HDMI 2.0b والآخر رقمي Dual-Link DVI.

تلقى الطراز الجديد لبطاقة فيديو Nvidia أيضًا كتلة محسّنة لفك تشفير بيانات الفيديو وتشفيرها. وبالتالي ، تتوافق شريحة GP104 مع المعايير العالية لـ PlayReady 3.0 (SL3000) لتشغيل الفيديو ، مما يتيح لك التأكد من أن تشغيل محتوى عالي الجودة من مزودين معروفين مثل Netflix سيكون بأعلى جودة وكفاءة في استخدام الطاقة . ترد تفاصيل حول دعم تنسيقات الفيديو المختلفة أثناء التشفير وفك التشفير في الجدول ، ويختلف المنتج الجديد بوضوح عن الحلول السابقة للأفضل:

ولكن الشيء الجديد الأكثر إثارة للاهتمام هو دعم ما يسمى بشاشات النطاق الديناميكي العالي (HDR) ، والتي توشك على الانتشار في السوق. تُعرض أجهزة التلفزيون للبيع في وقت مبكر من عام 2016 (مع توقع بيع أربعة ملايين جهاز تلفزيون بتقنية HDR في عام واحد فقط) ، والشاشات العام المقبل. يُعد HDR أكبر تقدم في تقنية العرض منذ سنوات ، حيث يقدم ضعف درجات الألوان (75٪ من الطيف المرئي مقابل 33٪ لـ RGB) ، وشاشات أكثر سطوعًا (1000 شمعة / المتر المربع) مع تباين أعلى (10000: 1) وألوان غنية.

إن ظهور القدرة على تشغيل المحتوى مع اختلاف أكبر في السطوع والألوان الأكثر ثراءً وتشبعًا سيجعل الصورة على الشاشة أقرب إلى الواقع ، وسيصبح اللون الأسود أعمق ، وسيظهر الضوء الساطع ، تمامًا كما هو الحال في العالم الحقيقي . وفقًا لذلك ، سيرى المستخدمون مزيدًا من التفاصيل في المناطق الساطعة والمظلمة من الصور مقارنةً بالشاشات وأجهزة التلفزيون القياسية.

لدعم شاشات HDR ، تحتوي GeForce GTX 1080 على كل ما تحتاجه - إخراج ألوان 12 بت ، ودعم معايير BT.2020 و SMPTE 2084 ، وإخراج HDMI 2.0b 10/12-bit 4K HDR. ماكسويل. بالإضافة إلى ذلك ، أضاف Pascal دعمًا لفك تشفير تنسيق HEVC بدقة 4K عند 60 هرتز ولون 10 أو 12 بت ، والذي يستخدم لفيديو HDR ، بالإضافة إلى ترميز نفس التنسيق بنفس المعلمات ، ولكن فقط في 10 -bit لتسجيل أو دفق فيديو HDR. أيضًا ، الجديد جاهز لتوحيد DisplayPort 1.4 لنقل بيانات HDR عبر هذا الموصل.

بالمناسبة ، قد تكون هناك حاجة إلى ترميز فيديو HDR في المستقبل من أجل نقل هذه البيانات من جهاز كمبيوتر منزلي إلى وحدة تحكم ألعاب SHIELD يمكنها تشغيل HEVC 10 بت. أي ، سيتمكن المستخدم من بث اللعبة من جهاز كمبيوتر بتنسيق HDR. انتظر ، أين يمكنني الحصول على ألعاب بهذا الدعم؟ تعمل Nvidia باستمرار مع مطوري الألعاب لتنفيذ هذا الدعم ، وتمريرهم كل ما يحتاجون إليه (دعم برنامج التشغيل ، ونماذج التعليمات البرمجية ، وما إلى ذلك) لعرض صور HDR المتوافقة مع شاشات العرض الحالية بشكل صحيح.

في وقت إصدار بطاقة الفيديو ، تدعم GeForce GTX 1080 ، ألعاب مثل Obduction و The Witness و Lawbreakers و Rise of the Tomb Raider و Paragon و Talos Principle و Shadow Warrior 2 لإخراج HDR. لكن هذه القائمة هي من المتوقع أن يتم تجديده في المستقبل القريب.

التغييرات على عرض SLI متعدد الشرائح

كانت هناك أيضًا بعض التغييرات المتعلقة بتقنية عرض الشرائح المتعددة SLI الخاصة ، على الرغم من عدم توقع أحد ذلك. يتم استخدام SLI من قبل عشاق ألعاب الكمبيوتر لدفع الأداء إلى أقصى الحدود عن طريق تشغيل أقوى بطاقات الرسوم أحادية الشريحة جنبًا إلى جنب ، أو للحصول على معدلات إطارات عالية جدًا عن طريق قصر أنفسهم على اثنين من الحلول متوسطة المدى التي تكون أحيانًا أرخص من واحد على أعلى مستوى (قرار مثير للجدل ، لكنهم يفعلون ذلك). مع شاشات 4K ، لا يملك اللاعبون أي خيارات أخرى تقريبًا سوى تثبيت بضع بطاقات فيديو ، نظرًا لأنه لا يمكن في كثير من الأحيان توفير لعبة مريحة بأقصى إعدادات في مثل هذه الظروف حتى أفضل الموديلات.

أحد المكونات الهامة نفيديا SLIهي جسور تربط بطاقات الفيديو بنظام فرعي مشترك للفيديو وتعمل على التنظيم قناة رقميةلنقل البيانات بينهما. تتميز بطاقات رسومات GeForce تقليديًا بموصلات SLI مزدوجة ، والتي تعمل على الاتصال بين بطاقتين أو أربع بطاقات رسومات في تكوينات 3-Way و 4-Way SLI. كان يجب توصيل كل بطاقة من بطاقات الفيديو بكل منها ، نظرًا لأن جميع وحدات معالجة الرسومات ترسل الإطارات التي قدمتها إلى وحدة معالجة الرسومات الرئيسية ، وهذا هو سبب الحاجة إلى واجهتين في كل لوحة.

بدءًا من GeForce GTX 1080 ، تحتوي جميع بطاقات رسومات Nvidia القائمة على بنية Pascal على واجهتين SLI مرتبطتين معًا لزيادة أداء نقل البيانات بين بطاقات الرسومات ، ويعمل وضع SLI الجديد ثنائي القناة على تحسين الأداء والراحة عند عرض المعلومات المرئية على شاشات عالية الدقة أو أنظمة متعددة الشاشات.

لهذا الوضع ، هناك حاجة أيضًا إلى جسور جديدة تسمى SLI HB. أنها تجمع بين زوج من بطاقات الفيديو GeForce GTX 1080 عبر قناتين SLI في وقت واحد ، على الرغم من أن بطاقات الفيديو الجديدة متوافقة أيضًا مع الجسور القديمة. للحصول على دقة 1920 × 1080 و 2560 × 1440 بكسل بمعدل تحديث 60 هرتز ، يمكن استخدام الجسور القياسية ، ولكن في الأوضاع الأكثر تطلبًا (أنظمة 4K و 5 K وأنظمة الشاشات المتعددة) ، ستوفر الجسور الجديدة فقط نتائج أفضل من حيث المصطلحات من التغيير السلس للإطار ، على الرغم من أن القديم سيعمل ، ولكنه أسوأ إلى حد ما.

أيضًا ، عند استخدام جسور SLI HB ، تعمل واجهة بيانات GeForce GTX 1080 بسرعة 650 ميجاهرتز ، مقارنة بـ 400 ميجاهرتز لجسور SLI التقليدية على وحدات معالجة الرسومات الأقدم. علاوة على ذلك ، بالنسبة لبعض الجسور القديمة الصعبة ، يتوفر أيضًا معدل نقل بيانات أعلى مع شرائح الفيديو الخاصة بهندسة باسكال. مع زيادة معدل نقل البيانات بين وحدة معالجة الرسومات عبر واجهة SLI مضاعفة مع زيادة تكرار التشغيل ، يتم أيضًا توفير عرض أكثر سلاسة للإطارات على الشاشة ، مقارنة بالحلول السابقة:

وتجدر الإشارة أيضًا إلى أن دعم العرض متعدد الشرائح في DirectX 12 يختلف إلى حد ما عما كان مألوفًا من قبل. في احدث اصدارواجهة برمجة تطبيقات الرسومات ، قامت Microsoft بإجراء العديد من التغييرات المتعلقة بتشغيل أنظمة الفيديو هذه. هناك نوعان من خيارات GPU المتعددة المتاحة لمطوري البرامج في DX12: مهايئ العرض المتعدد (MDA) ومحول العرض المرتبط (LDA).

علاوة على ذلك ، يحتوي وضع LDA على شكلين: LDA الضمني (الذي تستخدمه Nvidia لـ SLI) و Explicit LDA (عندما يتولى مطور اللعبة مهمة إدارة العرض متعدد الشرائح. تم تنفيذ وضعي MDA و LDA الصريح للتو في DirectX 12 في لمنح مطوري الألعاب مزيدًا من الحرية والفرص عند استخدام أنظمة الفيديو متعددة الشرائح ، ويظهر الفرق بين الأوضاع بوضوح في الجدول التالي:

في وضع LDA ، يمكن توصيل ذاكرة كل وحدة معالجة رسومات بذاكرة أخرى وعرضها بحجم إجمالي كبير ، بالطبع ، مع كل قيود الأداء عند أخذ البيانات من ذاكرة "خارجية". في وضع MDA ، تعمل ذاكرة كل وحدة معالجة رسومات بشكل منفصل ، ولا تستطيع وحدات معالجة الرسومات المختلفة الوصول مباشرة إلى البيانات من ذاكرة وحدة معالجة رسومات أخرى. تم تصميم وضع LDA للأنظمة متعددة الشرائح ذات الأداء المماثل ، في حين أن وضع MDA أقل تقييدًا ويمكنه العمل مع وحدات معالجة الرسومات المنفصلة والمتكاملة أو الحلول المنفصلة مع شرائح من جهات تصنيع مختلفة. لكن هذا الوضع يتطلب أيضًا مزيدًا من الاهتمام والعمل من المطورين عند برمجة التعاون حتى تتمكن وحدات معالجة الرسومات من التواصل مع بعضها البعض.

افتراضيًا ، يدعم نظام SLI المستند إلى GeForce GTX 1080 وحدتي GPU فقط ، كما تم إهمال تكوينات GPU الثلاثة والأربعة رسميًا ، حيث أصبحت الألعاب الحديثة أكثر صعوبة في تحقيق مكاسب الأداء من إضافة وحدة معالجة الرسومات الثالثة والرابعة. على سبيل المثال ، تعتمد العديد من الألعاب على قدرات المعالج المركزي للنظام عند تشغيل أنظمة الفيديو متعددة الشرائح ، وتستخدم الألعاب الجديدة بشكل متزايد تقنيات زمنية (مؤقتة) تستخدم البيانات من الإطارات السابقة ، والتي يكون فيها التشغيل الفعال للعديد من وحدات معالجة الرسومات في وقت واحد ببساطة مستحيل.

ومع ذلك ، لا يزال تشغيل الأنظمة في أنظمة أخرى متعددة الشرائح (غير SLI) ممكنًا ، مثل أوضاع MDA أو LDA Explicit في DirectX 12 أو نظام SLI ثنائي الشريحة مع وحدة معالجة رسومات ثالثة مخصصة للتأثيرات الفيزيائية فيزكس. ولكن ماذا عن السجلات في المعايير ، هل تخلت Nvidia عنها حقًا تمامًا؟ لا ، بالطبع لا ، ولكن نظرًا لأن مثل هذه الأنظمة مطلوبة في العالم من قِبل عدد قليل تقريبًا من المستخدمين ، فقد تم اختراع مفتاح متحمس خاص لهؤلاء المتحمسين للغاية ، والذي يمكن تنزيله من موقع Nvidia الإلكتروني وإلغاء تأمين هذه الميزة. للقيام بذلك ، تحتاج أولاً إلى الحصول على معرف GPU فريد من خلال تشغيل تطبيق خاص ، ثم طلب مفتاح Enthusiast Key على موقع الويب ، وبعد تنزيله ، قم بتثبيت المفتاح في النظام ، وبالتالي فتح 3-Way و 4-Way تكوينات SLI.

تقنية Fast Sync

حدثت بعض التغييرات في تقنيات المزامنة عند عرض المعلومات على الشاشة. بالنظر إلى المستقبل ، لا يوجد شيء جديد في G-Sync ، ولا تدعم تقنية Adaptive Sync. لكن Nvidia قررت تحسين سلاسة الإخراج والمزامنة للألعاب التي تظهر بشكل كبير أداء عاليعندما يتجاوز معدل الإطارات بشكل ملحوظ معدل تحديث الشاشة. هذا مهم بشكل خاص للألعاب التي تتطلب أدنى زمن انتقال واستجابة سريعة ، والتي هي معارك ومسابقات متعددة اللاعبين.

يعد Fast Sync بديلاً جديدًا للمزامنة الرأسية التي لا تحتوي على عناصر مرئية مثل تمزيق الصورة وغير مرتبطة بمعدل تحديث ثابت ، مما يزيد من زمن الوصول. ما هي مشكلة المزامنة الرأسية في ألعاب مثل Counter-Strike: Global Offensive؟ تعمل هذه اللعبة على وحدات معالجة الرسومات الحديثة القوية بعدة مئات من الإطارات في الثانية ، ويكون للاعب خيار تمكين v-sync أم لا.

في الألعاب متعددة اللاعبين ، غالبًا ما يلاحق المستخدمون الحد الأدنى من التأخير وإيقاف تشغيل VSync ، مما يؤدي إلى ظهور تمزق واضح في الصورة ، وهو أمر مزعج للغاية حتى مع معدلات الإطارات العالية. ومع ذلك ، إذا قمت بتشغيل v-sync ، فسيواجه اللاعب زيادة كبيرة في التأخيرات بين أفعاله والصورة على الشاشة ، عندما يتباطأ خط أنابيب الرسومات إلى معدل تحديث الشاشة.

هذه هي الطريقة التي يعمل بها خط الأنابيب التقليدي. لكن Nvidia قررت فصل عملية تقديم وعرض الصورة على الشاشة باستخدام تقنية Fast Sync. هذا يسمح لك بالمتابعة قدر الإمكان كفاءة العملبالنسبة للجزء من وحدة معالجة الرسومات (GPU) الذي يعرض الإطارات بأقصى سرعة ، يتم تخزين هذه الإطارات في مخزن مؤقت خاص بآخر عرض.

تتيح لك هذه الطريقة تغيير طريقة العرض والاستفادة بشكل أفضل من وضعي VSync On و VSync Off ، والحصول على زمن انتقال منخفض ، ولكن بدون عيوب الصورة. باستخدام Fast Sync ، لا يوجد تحكم في تدفق الإطار ، ويعمل محرك اللعبة في وضع إيقاف المزامنة ولا يُطلب منه الانتظار لرسم المرحلة التالية ، لذلك تكون فترات الاستجابة منخفضة تقريبًا مثل وضع VSync Off. ولكن نظرًا لأن Fast Sync يحدد بشكل مستقل مخزنًا مؤقتًا للعرض على الشاشة ويعرض الإطار بالكامل ، فلا توجد فواصل للصورة أيضًا.

تستخدم Fast Sync ثلاثة مخازن مؤقتة مختلفة ، يعمل أول اثنان منها بشكل مشابه للتخزين المؤقت المزدوج في خط أنابيب كلاسيكي. المخزن المؤقت الأساسي (Front Buffer - FB) عبارة عن مخزن مؤقت ، يتم عرض المعلومات منه على الشاشة ، وهو إطار تم تقديمه بالكامل. المخزن الخلفي (Back Buffer - BB) هو المخزن المؤقت الذي يتلقى المعلومات عند التقديم.

عند استخدام المزامنة الرأسية في ظروف معدل الإطارات المرتفع ، تنتظر اللعبة حتى يتم الوصول إلى الفاصل الزمني للتحديث من أجل تبديل المخزن المؤقت الأساسي بالمخزن المؤقت الثانوي لعرض صورة إطار واحد على الشاشة. يؤدي هذا إلى إبطاء العملية وإضافة مخازن إضافية ، كما هو الحال في الطريقة التقليدية التخزين المؤقت الثلاثيسوف يضيف تأخير فقط.

باستخدام Fast Sync ، تتم إضافة مخزن مؤقت ثالث تم عرضه (LRB) ، والذي يستخدم لتخزين جميع الإطارات التي تم عرضها للتو في المخزن المؤقت الثانوي. يتحدث اسم المخزن المؤقت عن نفسه ، فهو يحتوي على نسخة من آخر إطار تم تقديمه بالكامل. وعندما يحين الوقت لتحديث المخزن المؤقت الأساسي ، يتم نسخ هذا المخزن المؤقت LRB إلى الأساسي بالكامل ، وليس في أجزاء ، كما هو الحال من الثانوية مع تعطيل التزامن الرأسي. نظرًا لأن نسخ المعلومات من المخازن المؤقتة غير فعال ، يتم ببساطة تبديلها (أو إعادة تسميتها ، حيث سيكون من السهل فهمها) ، والمنطق الجديد لمبادلة المخازن المؤقتة ، الذي تم تقديمه في GP104 ، يدير هذه العملية.

من الناحية العملية ، لا يزال تضمين طريقة المزامنة الجديدة Fast Sync يوفر تأخيرًا أكبر قليلاً مقارنةً بالمزامنة الرأسية المعطلة تمامًا - في المتوسط ​​8 مللي ثانية أكثر ، لكنها تعرض الإطارات على الشاشة بالكامل ، دون عيوب غير سارة على الشاشة التي تمزق الصورة. يمكن تمكين الطريقة الجديدة من إعدادات رسومات لوحة تحكم Nvidia في قسم التحكم في المزامنة الرأسية. ومع ذلك ، تظل القيمة الافتراضية هي التحكم في التطبيق ، ولا تحتاج ببساطة إلى تمكين Fast Sync في جميع التطبيقات ثلاثية الأبعاد ، فمن الأفضل اختيار هذه الطريقة خصيصًا للألعاب ذات الإطارات المرتفعة FPS.

تقنية الواقع الافتراضي Nvidia VRWorks

لقد تطرقنا إلى الموضوع الساخن الخاص بـ VR أكثر من مرة في هذه المقالة ، ولكن الأمر يتعلق في الغالب بتعزيز الإطارات وضمان زمن انتقال منخفض ، وهو أمر مهم جدًا للواقع الافتراضي. كل هذا مهم للغاية وهناك تقدم بالفعل ، ولكن حتى الآن لا تبدو ألعاب الواقع الافتراضي مثيرة للإعجاب مثل أفضل الألعاب ثلاثية الأبعاد "العادية" الحديثة. يحدث هذا ليس فقط لأن مطوري الألعاب الرائدين لم يشاركوا بعد بشكل خاص في تطبيقات الواقع الافتراضي ، ولكن أيضًا لأن الواقع الافتراضي أكثر طلبًا على معدل الإطارات ، مما يمنع استخدام العديد من التقنيات المعتادة في مثل هذه الألعاب بسبب المتطلبات العالية.

من أجل تقليل الاختلاف في الجودة بين ألعاب الواقع الافتراضي والألعاب العادية ، قررت Nvidia إصدار حزمة كاملة من تقنيات VRWorks ذات الصلة ، والتي تضمنت عددًا كبيرًا من واجهات برمجة التطبيقات والمكتبات والمحركات والتقنيات التي يمكنها تحسين جودة وأداء كل من VR- تطبيقات. ما علاقة ذلك بالإعلان عن حل الألعاب الأول في باسكال؟ الأمر بسيط للغاية - تم إدخال بعض التقنيات فيه والتي تساعد على زيادة الإنتاجية وتحسين الجودة ، وقد كتبنا بالفعل عنها.

وعلى الرغم من أن الأمر لا يتعلق فقط بالرسومات ، إلا أننا سنتحدث قليلاً عنها أولاً. تشتمل مجموعة تقنيات VRWorks Graphics على التقنيات المذكورة سابقًا ، مثل تظليل العدسة المتوافق ، والذي يستخدم ميزة الإسقاط المتعدد التي ظهرت في GeForce GTX 1080. يتيح لك المنتج الجديد الحصول على زيادة في الأداء من 1.5 إلى 2 مرات فيما يتعلق إلى الحلول التي ليس لديها مثل هذا الدعم. ذكرنا أيضًا تقنيات أخرى ، مثل MultiRes Shading ، المصممة لتقديم درجات دقة مختلفة في وسط الإطار وعلى أطرافه.

ولكن الأمر الأكثر توقعًا هو الإعلان عن تقنية VRWorks Audio ، المصممة لحساب بيانات الصوت عالية الجودة في المشاهد ثلاثية الأبعاد ، وهو أمر مهم بشكل خاص في أنظمة الواقع الافتراضي. في المحركات التقليدية ، يتم حساب موضع مصادر الصوت في بيئة افتراضية بشكل صحيح تمامًا ، إذا أطلق العدو النار من اليمين ، فإن الصوت يكون أعلى من هذا الجانب من نظام الصوت ، ومثل هذا الحساب لا يتطلب الكثير من قوة الحوسبة .

لكن في الواقع ، لا تتجه الأصوات نحو اللاعب فحسب ، بل في جميع الاتجاهات وترتد عن مواد مختلفة ، على غرار كيفية ارتداد أشعة الضوء. وفي الواقع ، نسمع هذه الانعكاسات ، وإن لم تكن بنفس وضوح الموجات الصوتية المباشرة. عادة ما يتم محاكاة هذه الانعكاسات الصوتية غير المباشرة بتأثيرات تردد خاصة ، ولكن هذا نهج بدائي للغاية للمهمة.

يستخدم VRWorks Audio عرض موجة صوتية مشابهًا لتتبع الأشعة في العرض ، حيث يتم تتبع مسار أشعة الضوء إلى انعكاسات متعددة من كائنات في مشهد افتراضي. يحاكي VRWorks Audio أيضًا انتشار الموجات الصوتية في البيئة عند تتبع الموجات المباشرة والمنعكسة ، اعتمادًا على زاوية وقوعها وخصائص المواد العاكسة. في عملها ، تستخدم VRWorks Audio محرك تتبع الأشعة Nvidia OptiX عالي الأداء المعروف بمهام الرسومات. يمكن استخدام OptiX في مجموعة متنوعة من المهام ، مثل حساب الإضاءة غير المباشرة ورسم الخرائط ، والآن أيضًا لتتبع الموجات الصوتية في VRWorks Audio.

قامت Nvidia ببناء حساب دقيق للموجات الصوتية في العرض التوضيحي VR Funhouse ، والذي يستخدم عدة آلاف من الأشعة ويحسب ما يصل إلى 12 انعكاسًا من الكائنات. ولكي تتعلم مزايا التكنولوجيا باستخدام مثال واضح ، نقترح عليك مشاهدة مقطع فيديو عن تشغيل التكنولوجيا باللغة الروسية:

من المهم أن يختلف نهج Nvidia عن محركات الصوت التقليدية ، بما في ذلك طريقة تسريع الأجهزة من المنافس الرئيسي باستخدام كتلة خاصة في وحدة معالجة الرسومات. توفر كل هذه الطرق تحديدًا دقيقًا لمصادر الصوت فقط ، ولكنها لا تحسب انعكاسات الموجات الصوتية من الكائنات في مشهد ثلاثي الأبعاد ، على الرغم من إمكانية محاكاة ذلك باستخدام تأثير التردد. ومع ذلك ، يمكن أن يكون استخدام تقنية تتبع الأشعة أكثر واقعية ، حيث أن مثل هذا النهج فقط هو الذي سيوفر تقليدًا دقيقًا للأصوات المختلفة ، مع مراعاة حجم وشكل ومواد الكائنات الموجودة في المشهد. من الصعب تحديد ما إذا كانت هذه الدقة الحسابية مطلوبة للاعب نموذجي ، ولكن يمكننا أن نقول على وجه اليقين: في الواقع الافتراضي ، يمكن أن تضيف للمستخدمين الواقعية ذاتها التي لا تزال تفتقر إليها الألعاب التقليدية.

حسنًا ، يبقى أن نتحدث فقط عن تقنية VR SLI ، التي تعمل في كل من OpenGL و DirectX. مبدأها بسيط للغاية: سيعمل نظام الفيديو ثنائي GPU في تطبيق VR بطريقة يتم فيها تخصيص وحدة معالجة رسومات منفصلة لكل عين ، بدلاً من جعل AFR مألوفًا لتكوينات SLI. يعمل هذا على تحسين الأداء العام بشكل كبير ، وهو أمر مهم جدًا لأنظمة الواقع الافتراضي. من الناحية النظرية ، يمكن استخدام المزيد من وحدات معالجة الرسومات ، ولكن يجب أن يكون عددها زوجيًا.

كان هذا النهج مطلوبًا لأن AFR غير مناسب تمامًا للواقع الافتراضي ، حيث أنه بمساعدته ، سترسم وحدة معالجة الرسومات الأولى إطارًا متساويًا لكلتا العينين ، وستقوم الثانية بعرض إطار فردي ، مما لا يقلل من التأخيرات الحاسمة للافتراضية أنظمة الواقع. على الرغم من أن معدل الإطارات سيكون مرتفعًا جدًا. لذلك بمساعدة VR SLI ، يتم تقسيم العمل على كل إطار إلى وحدتي GPU - أحدهما يعمل على جزء من الإطار للعين اليسرى ، والثاني على اليمين ، ثم يتم دمج نصفي الإطار في الكل.

يؤدي تقسيم العمل مثل هذا بين زوج من وحدات معالجة الرسومات إلى زيادة الأداء بمقدار الضعفين ، مما يؤدي إلى معدلات إطارات أعلى وزمن انتقال أقل مقارنة بالأنظمة القائمة على بطاقة رسومات واحدة. صحيح أن استخدام VR SLI يتطلب دعمًا خاصًا من التطبيق لاستخدام طريقة القياس هذه. لكن تقنية VR SLI مدمجة بالفعل في تطبيقات VR التجريبية مثل Valve's The Lab و ILMxLAB's Trials on Tatooine ، وهذه مجرد البداية - تعد Nvidia بتطبيقات أخرى ستأتي قريبًا ، بالإضافة إلى تنفيذ التكنولوجيا في محركات الألعاب Unreal Engine 4 والوحدة وماكس بلاي.

Ansel Game Screenshot منصة

كان أحد الإعلانات الأكثر إثارة للاهتمام المتعلقة بالبرنامج هو إطلاق تقنية لالتقاط لقطات شاشة عالية الجودة في تطبيقات الألعاب ، والتي سميت على اسم أحد المصورين المشهورين - Ansel. لم تكن الألعاب منذ فترة طويلة مجرد ألعاب ، بل كانت أيضًا مكانًا لاستخدام الأيدي المرحة لمختلف الشخصيات الإبداعية. يقوم شخص ما بتغيير البرامج النصية للألعاب ، ويصدر شخص ما مجموعات نسيج عالية الجودة للألعاب ، ويقوم شخص ما بعمل لقطات شاشة جميلة.

قررت Nvidia مساعدة الأخير من خلال التقديم منصة جديدةلإنشاء (أي إنشاء ، لأن هذه ليست عملية سهلة) لقطات عالية الجودة من الألعاب. إنهم يعتقدون أن Ansel يمكن أن يساعد في إنشاء نوع جديد من الفن المعاصر. بعد كل شيء ، هناك بالفعل عدد غير قليل من الفنانين الذين يقضون معظم حياتهم على الكمبيوتر ، ويخلقون لقطات شاشة جميلة من الألعاب ، وما زالوا لا يملكون أداة مناسبة لذلك.

لا يسمح لك Ansel بالتقاط صورة في اللعبة فحسب ، بل يتيح لك تغييرها حسب حاجة المنشئ. باستخدام هذه التقنية ، يمكنك تحريك الكاميرا حول المشهد وتدويرها وإمالتها في أي اتجاه للحصول على التكوين المطلوب للإطار. على سبيل المثال ، في ألعاب مثل ألعاب إطلاق النار من منظور الشخص الأول ، يمكنك فقط تحريك اللاعب ، ولا يمكنك تغيير أي شيء آخر حقًا ، لذا فإن جميع لقطات الشاشة رتيبة جدًا. مع كاميرا مجانية في Ansel ، يمكنك الذهاب إلى أبعد من ذلك لعبة الكاميرا، أو اختيار الزاوية المطلوبة للحصول على صورة جيدة ، أو حتى التقاط صورة مجسمة كاملة بزاوية 360 درجة من النقطة المطلوبة ، وبدقة عالية لعرضها لاحقًا في خوذة VR.

يعمل Ansel بكل بساطة - بمساعدة مكتبة خاصة من Nvidia ، تم تضمين هذه المنصة في رمز اللعبة. للقيام بذلك ، يحتاج المطور فقط إلى إضافة جزء صغير من التعليمات البرمجية إلى مشروعه للسماح لبرنامج تشغيل الفيديو Nvidia باعتراض بيانات المخزن المؤقت والتظليل. هناك القليل جدًا من العمل الذي يتعين القيام به ، حيث يستغرق إدخال Ansel اللعبة أقل من يوم واحد للتنفيذ. لذا ، فإن إدراج هذه الميزة في The Witness استغرق حوالي 40 سطرًا من التعليمات البرمجية ، وفي The Witcher 3 - حوالي 150 سطرًا من التعليمات البرمجية.

سيأتي Ansel مع حزمة تطوير مفتوحة - SDK. الشيء الرئيسي هو أن المستخدم يتلقى معه مجموعة قياسية من الإعدادات التي تسمح له بتغيير موضع الكاميرا وزاويةها ، وإضافة تأثيرات ، وما إلى ذلك. تعمل منصة Ansel على النحو التالي: فهي توقف اللعبة مؤقتًا ، وتقوم بتشغيل الكاميرا المجانية ويسمح لك بتغيير الإطار إلى العرض المطلوب عن طريق تسجيل النتيجة في شكل لقطة شاشة عادية ، أو صورة بزاوية 360 درجة ، أو زوج استريو ، أو مجرد بانوراما عالية الدقة.

التحذير الوحيد هو أنه لن تتلقى جميع الألعاب دعمًا لجميع ميزات منصة لقطة شاشة لعبة Ansel. لا يرغب بعض مطوري الألعاب ، لسبب أو لآخر ، في تضمين كاميرا مجانية تمامًا في ألعابهم - على سبيل المثال ، بسبب إمكانية استخدام الغشاشين لهذه الوظيفة. أو يريدون الحد من التغيير في زاوية الرؤية لنفس السبب - بحيث لا يحصل أي شخص على ميزة غير عادلة. حسنًا ، أو حتى لا يرى المستخدمون النقوش البائسة في الخلفية. كل هذه الرغبات طبيعية تمامًا لمنشئي الألعاب.

واحدة من أكثر الميزات إثارة للاهتمام في Ansel هي إنشاء لقطات شاشة بدقة ضخمة. لا يهم أن اللعبة تدعم دقة تصل إلى 4K على سبيل المثال ، وشاشة المستخدم Full HD. باستخدام منصة لقطة الشاشة ، يمكنك التقاط صورة بجودة أعلى بكثير ، مقيدة بالأحرى بحجم محرك الأقراص وأدائه. تلتقط المنصة لقطات شاشة تصل إلى 4.5 جيجابكسل بسهولة ، مجمعة معًا من 3600 قطعة!

من الواضح أنه في مثل هذه الصور يمكنك رؤية كل التفاصيل ، حتى النص الموجود في الصحف ملقاة على مسافة بعيدة ، إذا كان هذا المستوى من التفاصيل منصوصًا عليه من حيث المبدأ في اللعبة - يمكن لـ Ansel أيضًا التحكم في مستوى التفاصيل ، ضبط المستوى الأقصى للحصول على أفضل جودة للصورة. ولكن لا يزال بإمكانك تمكين الاختزال الفائق. يتيح لك كل هذا إنشاء صور من الألعاب يمكنك طباعتها بأمان على لافتات كبيرة والتعامل مع جودتها بالهدوء.

ومن المثير للاهتمام ، أنه يتم استخدام رمز خاص مسرع للأجهزة يعتمد على CUDA لربط الصور الكبيرة. بعد كل شيء ، لا يمكن لأي بطاقة فيديو عرض صورة متعددة الجيجابيكسل ككل ، ولكن يمكنها القيام بذلك على شكل أجزاء ، والتي تحتاج فقط إلى دمجها لاحقًا ، مع مراعاة الاختلاف المحتمل في الإضاءة واللون وما إلى ذلك.

بعد خياطة مثل هذه الصور البانورامية ، يتم استخدام معالجة خاصة لاحقة للإطار بأكمله ، ويتم تسريعها أيضًا على وحدة معالجة الرسومات. وللتقاط الصور في نطاق ديناميكي أعلى ، يمكنك استخدام تنسيق صورة خاص - EXR ، وهو معيار مفتوح من Industrial Light and Magic ، يتم تسجيل قيم الألوان في كل قناة بتنسيق نقطة عائمة 16 بت (FP16).

يسمح لك هذا التنسيق بتغيير السطوع و النطاق الديناميكيالصور عن طريق المعالجة اللاحقة ، وإحضارها إلى الصورة الصحيحة لكل شاشة محددة بنفس الطريقة التي يتم بها مع تنسيقات RAW من الكاميرات. وللاستخدام اللاحق لمرشحات ما بعد المعالجة في برامج معالجة الصور ، فإن هذا التنسيق مفيد للغاية ، لأنه يحتوي على بيانات أكثر بكثير من تنسيقات الصور المعتادة.

لكن منصة Ansel نفسها تحتوي على الكثير من عوامل تصفية ما بعد المعالجة ، وهو أمر مهم بشكل خاص لأنه ليس فقط الوصول إلى الصورة النهائية ، ولكن أيضًا إلى جميع المخازن المؤقتة التي تستخدمها اللعبة عند العرض ، والتي يمكن استخدامها لتأثيرات مثيرة جدًا للاهتمام ، مثل عمق المجال. للقيام بذلك ، لدى Ansel واجهة برمجة تطبيقات خاصة لما بعد المعالجة ، ويمكن تضمين أي من التأثيرات في اللعبة مع دعم هذا النظام الأساسي.

تتضمن فلاتر Ansel اللاحقة: منحنيات اللون ، مساحة اللون ، التحول ، إزالة التشبع ، السطوع / التباين ، حبيبات الفيلم ، التوهج ، توهج العدسة ، الوهج المشوه ، التشويه ، الحرارة ، عين السمكة ، انحراف اللون ، رسم الخرائط النغمية ، أوساخ العدسة ، أعمدة الإنارة ، المقالة القصيرة ، تصحيح جاما ، الالتواء ، الشحذ ، كشف الحواف ، التمويه ، البني الداكن ، تقليل الضوضاء ، FXAA وغيرها.

بالنسبة لظهور دعم Ansel في الألعاب ، فسنضطر إلى الانتظار قليلاً حتى يقوم المطورون بتطبيقه واختباره. لكن Nvidia تعد بأن مثل هذا الدعم سيظهر قريبًا في ألعاب شهيرة مثل The Division و The Witness و Lawbreakers و The Witcher 3 و Paragon و Fortnite و Obduction و No Man's Sky و Unreal Tournament وغيرها.

سمحت تقنية المعالجة FinFET الجديدة 16 نانومتر وتحسينات البنية لبطاقة GeForce GTX 1080 القائمة على GP104 GPU بتحقيق سرعة ساعة عالية تصل إلى 1.6-1.7 جيجاهرتز حتى في الشكل المرجعي ، ويضمن الجيل الجديد التشغيل بأعلى ترددات ممكنة في الألعاب تقنيات GPU Boost. جنبًا إلى جنب مع زيادة عدد وحدات التنفيذ ، فإن هذه التحسينات لا تجعلها فقط بطاقة الرسومات أحادية الشريحة الأعلى أداءً على الإطلاق ، بل تجعلها أيضًا الحل الأكثر كفاءة في استخدام الطاقة في السوق.

تعد GeForce GTX 1080 أول بطاقة رسومات تتميز بذاكرة رسومات GDDR5X الجديدة ، وهي جيل جديد من الشرائح عالية السرعة التي تحقق معدلات بيانات عالية جدًا. في حالة GeForce GTX 1080 المعدلة ، يعمل هذا النوع من الذاكرة بتردد فعال يبلغ 10 جيجاهرتز. إلى جانب خوارزميات ضغط الإطارات المحسّنة ، أدى ذلك إلى زيادة 1.7 مرة في عرض النطاق الترددي الفعال لوحدة معالجة الرسومات هذه مقارنةً بسابقتها المباشرة ، GeForce GTX 980.

قررت Nvidia بحكمة عدم إطلاق بنية جديدة جذريًا على تقنية عملية جديدة تمامًا لنفسها ، حتى لا تواجه مشكلات غير ضرورية أثناء التطوير والإنتاج. بدلاً من ذلك ، قاموا بتحسين بنية Maxwell الجيدة بالفعل والفعالة للغاية من خلال إضافة بعض الميزات. نتيجة لذلك ، كل شيء على ما يرام مع إنتاج وحدات معالجة الرسومات الجديدة ، وفي حالة طراز GeForce GTX 1080 ، حقق المهندسون إمكانية تردد عالية جدًا - في الإصدارات التي تم رفع تردد التشغيل عنها من الشركاء ، من المتوقع أن يصل تردد وحدة معالجة الرسومات إلى 2 جيجاهرتز! أصبح هذا التردد المثير للإعجاب حقيقة واقعة بفضل العملية التقنية المثالية والعمل المضني لمهندسي Nvidia في تطوير وحدة معالجة الرسومات Pascal.

على الرغم من أن Pascal تابع مباشر لأعمال Maxwell ، وأن هذه البنى الرسومية لا تختلف اختلافًا كبيرًا عن بعضها البعض بشكل أساسي ، فقد أدخلت Nvidia العديد من التغييرات والتحسينات ، بما في ذلك إمكانات العرض ، ومحرك ترميز الفيديو وفك التشفير ، والتنفيذ غير المتزامن لأنواع مختلفة من الحسابات على وحدة معالجة الرسومات ، إجراء تغييرات على العرض متعدد الشرائح وتقديم طريقة مزامنة جديدة ، Fast Sync.

من المستحيل عدم إبراز تقنية العرض المتعدد المتزامن ، والتي تساعد على تحسين الأداء في أنظمة الواقع الافتراضي ، والحصول على عرض أكثر دقة للمشاهد على أنظمة الشاشات المتعددة ، وتقديم تقنيات جديدة لتحسين الأداء. لكن تطبيقات الواقع الافتراضي ستحصل على أكبر زيادة في السرعة عندما تدعم تقنية الإسقاط المتعدد ، مما يساعد على توفير موارد وحدة معالجة الرسومات بمقدار النصف عند معالجة البيانات الهندسية ومرة ​​ونصف في العمليات الحسابية لكل بكسل.

من بين تغييرات البرامج البحتة ، تبرز منصة إنشاء لقطات الشاشة في الألعاب المسماة Ansel - سيكون من المثير للاهتمام تجربتها عمليًا ليس فقط لأولئك الذين يلعبون كثيرًا ، ولكن أيضًا لأولئك الذين يهتمون ببساطة بالرسومات ثلاثية الأبعاد عالية الجودة. تتيح لك الجدة تطوير فن إنشاء لقطات الشاشة وتنقيحها إلى مستوى جديد. حسنًا ، مثل هذه الحزم لمطوري الألعاب مثل GameWorks و VRWorks ، تستمر Nvidia في التحسين خطوة بخطوة - لذلك ، في الأخير ، ظهرت إمكانية مثيرة للاهتمام لحساب صوت عالي الجودة ، مع الأخذ في الاعتبار انعكاسات عديدة للموجات الصوتية باستخدام أشعة الأجهزة اقتفاء أثر.

بشكل عام ، في شكل بطاقة فيديو Nvidia GeForce GTX 1080 ، دخلت الشركة الرائدة الحقيقية إلى السوق ، ولديها جميع الصفات اللازمة لذلك: الأداء العالي والوظائف الواسعة ، فضلاً عن دعم الميزات والخوارزميات الجديدة. سيتمكن المشترون الأوائل لبطاقة الفيديو هذه من تقدير العديد من الفوائد المذكورة على الفور ، وسيتم الكشف عن الاحتمالات الأخرى للحل بعد ذلك بقليل ، عندما يكون هناك دعم واسع من الخارج. البرمجيات. الشيء الرئيسي هو أن GeForce GTX 1080 تبين أنها سريعة وفعالة للغاية ، وكما نأمل حقًا ، تمكن مهندسو Nvidia من إصلاح بعض مناطق المشكلات (نفس الحسابات غير المتزامنة).

مسرع الرسومات GeForce GTX 1070

معاملالمعنى
اسم رمز رقاقةGP104
تكنولوجيا الإنتاج16nm FinFET
عدد الترانزستورات7.2 مليار
منطقة جوهرية314 مم²
هندسة عامةموحد ، مع مجموعة من المعالجات الشائعة لمعالجة التدفق لأنواع عديدة من البيانات: الرؤوس ، والبكسل ، وما إلى ذلك.
دعم أجهزة DirectXDirectX 12 ، مع دعم مستوى الميزة 12_1
ناقل الذاكرة256 بت: ثمانية وحدات تحكم مستقلة في الذاكرة 32 بت تدعم ذاكرة GDDR5 و GDDR5X
تردد وحدة معالجة الرسومات1506 (1683) ميجاهرتز
كتل الحوسبة15 معالجات متدفقة نشطة (من أصل 20 في الشريحة) ، بما في ذلك 1920 (من 2560) وحدة ALU قياسية لحسابات النقطة العائمة في إطار معيار IEEE 754-2008 ؛
كتل التركيب120 وحدة معالجة نسيج نشطة (من 160 في الرقاقة) مع دعم لمكونات FP16 و FP32 في القوام ودعم الترشيح ثلاثي الخطوط ومتباين الخواص لجميع تنسيقات النسيج
وحدات العمليات النقطية (ROPs)8 ROPs عريضة (64 بكسل) مع دعم لمختلف أوضاع الصقل ، بما في ذلك قابل للبرمجة وبتنسيق المخزن المؤقت للإطار FP16 أو FP32. تتكون الكتل من مجموعة من وحدات ALU القابلة للتكوين وهي مسؤولة عن توليد العمق والمقارنة والاختزال والمزج المتعدد
دعم المراقبةدعم متكامل لما يصل إلى أربع شاشات متصلة عبر Dual Link DVI و HDMI 2.0b و DisplayPort 1.2 (1.3 / 1.4 جاهز)

مواصفات الجرافيكس المرجعية للبطاقة GeForce GTX 1070
معاملالمعنى
التردد الأساسي1506 (1683) ميجاهرتز
عدد المعالجات العالمية1920
عدد الكتل النسيجية120
عدد كتل المزج64
تردد الذاكرة الفعال8000 (4 × 2000) ميجاهرتز
نوع الذاكرةGDDR5
ناقل الذاكرة256 بت
حجم الذاكرة8 جيجا
عرض النطاق الترددي للذاكرة256 جيجا بايت / ثانية
أداء الحوسبة (FP32)حوالي 6.5 تيرافلوب
الحد الأقصى لمعدل التعبئة النظري96 جيجابكسل / ثانية
معدل أخذ عينات النسيج النظري181 جيجا تكسيلس / ثانية
إطار العجلةPCI Express 3.0
موصلاتمنفذ DVI مزدوج الارتباط ومنفذ HDMI وثلاثة منافذ DisplayPort
استهلاك الطاقةما يصل إلى 150 واط
المزيد من الطعامموصل واحد من 8 سنون
عدد الفتحات المشغولة في هيكل النظام2
السعر الموصى به379-449 دولارًا (الولايات المتحدة) ، 34990 (روسيا)

تلقت بطاقة الفيديو GeForce GTX 1070 أيضًا اسمًا منطقيًا مشابهًا لنفس الحل من سلسلة GeForce السابقة. إنه يختلف عن سلفه المباشر GeForce GTX 970 فقط في شكل جيل متغير. تصبح الحداثة خطوة أقل من الحل الأفضل الحالي GeForce GTX 1080 في الخط الحالي للشركة ، والذي أصبح الرائد المؤقت للسلسلة الجديدة حتى إصدار حلول GPU أكثر قوة.

الأسعار الموصى بها لبطاقة الفيديو الأعلى الجديدة من Nvidia هي 379 دولارًا و 449 دولارًا لشركاء Nvidia و Founders Edition العاديين ، على التوالي. مقارنة بالنموذج الأعلى ، هذا جيد جدًا سعر جيدبالنظر إلى أن GTX 1070 متأخر بنحو 25٪ في أسوأ الحالات. وفي وقت الإعلان والإصدار ، أصبح GTX 1070 أفضل حل أداء في فئته. مثل GeForce GTX 1080 ، لا يوجد لدى GTX 1070 منافسين مباشرين من AMD ، ولا يمكن مقارنتها إلا بـ Radeon R9 390X و Fury.

قررت GP104 GPU في تعديل GeForce GTX 1070 ترك ناقل ذاكرة 256 بت كامل ، على الرغم من أنها لم تستخدم نوعًا جديدًا من ذاكرة GDDR5X ، ولكن GDDR5 سريع جدًا ، والذي يعمل بتردد عالي الفعالية يبلغ 8 جيجاهرتز. يمكن أن يكون حجم الذاكرة المثبتة على بطاقة الفيديو مع مثل هذا الناقل 4 أو 8 جيجابايت ، ولضمان أقصى أداء للحل الجديد في ظروف الإعدادات العالية ودقة العرض ، تم تجهيز طراز بطاقة الفيديو GeForce GTX 1070 أيضًا مع ذاكرة فيديو بسعة 8 جيجا بايت ، مثل شقيقتها الكبرى. هذا الحجم كافٍ لتشغيل أي تطبيقات ثلاثية الأبعاد بأقصى إعدادات الجودة لعدة سنوات.

إصدار المؤسسين للبطاقة GeForce GTX 1070

مع الإعلان عن GeForce GTX 1080 في أوائل شهر مايو ، تم الإعلان عن إصدار خاص من بطاقة الفيديو يسمى Founders Edition ، والذي يتميز بسعر أعلى من بطاقات الفيديو العادية من شركاء الشركة. الأمر نفسه ينطبق على الجدة. في هذه المقالة ، سنتحدث مرة أخرى عن إصدار خاص من بطاقة الفيديو GeForce GTX 1070 يسمى Founders Edition. كما في حالة الطراز الأقدم ، قررت Nvidia إصدار هذا الإصدار من بطاقة الفيديو المرجعية للشركة المصنعة بسعر أعلى. يزعمون أن العديد من اللاعبين والمتحمسين الذين يشترون بطاقات رسومات عالية الجودة باهظة الثمن يريدون منتجًا بمظهر وملمس "متميزين" مناسبين.

وفقًا لذلك ، سيتم إصدار بطاقة الفيديو GeForce GTX 1070 Founders Edition إلى السوق ، والتي تم تصميمها وتصنيعها بواسطة مهندسي Nvidia من مواد ومكونات متميزة ، مثل غطاء الألمنيوم GeForce GTX 1070 Founders Edition لهؤلاء المستخدمين. كلوحة خلفية منخفضة تغطي الجزء الخلفي من ثنائي الفينيل متعدد الكلور وتحظى بشعبية كبيرة بين المتحمسين.

كما ترون من صور اللوحة ، ورث GeForce GTX 1070 Founders Edition نفس التصميم الصناعي تمامًا من الإصدار المرجعي من GeForce GTX 1080 Founders Edition. يستخدم كلا الطرازين مروحة شعاعية تنفخ الهواء الساخن ، وهو أمر مفيد للغاية في كل من الحالات الصغيرة وتكوينات SLI متعددة الشرائح ذات المساحة المادية المحدودة. عن طريق نفخ الهواء الساخن بدلاً من تدويره داخل العلبة ، يمكنك تقليل الإجهاد الحراري ، وتحسين نتائج رفع تردد التشغيل ، وإطالة عمر مكونات النظام.

تحت غطاء نظام التبريد المرجعي GeForce GTX 1070 ، يوجد مشعاع من الألومنيوم على شكل خاص مع ثلاثة أنابيب حرارية نحاسية مدمجة تزيل الحرارة من وحدة معالجة الرسومات نفسها. تبدد الحرارة بعد ذلك بواسطة أنابيب الحرارة بواسطة مبدد حراري من الألمنيوم. حسنًا ، تم تصميم اللوحة المعدنية منخفضة المستوى الموجودة في الجزء الخلفي من اللوحة أيضًا لتوفير أداء حراري أفضل. كما أنه يتميز بقسم قابل للسحب لتحسين تدفق الهواء بين بطاقات رسومات متعددة في تكوينات SLI.

بالنسبة لنظام الطاقة الخاص باللوحة ، فإن GeForce GTX 1070 Founders Edition لديها نظام طاقة رباعي الطور مُحسَّن لإمداد طاقة مستقر. تدعي Nvidia أن استخدام المكونات الخاصة في GTX 1070 Founders Edition قد أدى إلى تحسين كفاءة الطاقة واستقرارها وموثوقيتها مقارنةً بـ GeForce GTX 970 ، مما يوفر أداءً أفضل لرفع تردد التشغيل. في الاختبارات الخاصة بالشركة ، تجاوزت وحدات معالجة الرسومات GeForce GTX 1070 بسهولة 1.9 جيجاهرتز ، وهو قريب من نتائج طراز GTX 1080 الأقدم.

ستتوفر بطاقة الرسومات Nvidia GeForce GTX 1070 في متاجر البيع بالتجزئة اعتبارًا من 10 يونيو. تختلف الأسعار الموصى بها لـ GeForce GTX 1070 Founders Edition وحلول الشركاء ، وهذا هو السؤال الرئيسي لهذا الإصدار الخاص. إذا قام شركاء Nvidia ببيع بطاقات الرسومات GeForce GTX 1070 الخاصة بهم بدءًا من 379 دولارًا (في سوق الولايات المتحدة) ، فإن تكلفة Founders Edition للتصميم المرجعي من Nvidia ستبلغ 449 دولارًا أمريكيًا. هل هناك العديد من المتحمسين المستعدين لدفع مبالغ زائدة مقابل المزايا المشكوك فيها للإصدار المرجعي ، دعنا نواجه الأمر؟ سيخبرنا الوقت ، لكننا نعتقد أن الرسوم المرجعية أكثر إثارة للاهتمام كخيار متاح للشراء في بداية المبيعات ، وبعد ذلك تم تخفيض نقطة شرائها (وحتى بسعر مرتفع!) إلى الصفر.

يبقى لإضافة ذلك لوحة الدوائر المطبوعةالمرجع GeForce GTX 1070 مشابه لبطاقة الفيديو الأقدم ، وكلاهما يختلف عن جهاز اللوحات السابقة للشركة. قيمة استهلاك الطاقة النموذجي للجدة هي 150 واط ، أي أقل قيمةبالنسبة إلى GTX 1080 بنسبة 20٪ تقريبًا وقريبًا من استهلاك الطاقة للجيل السابق GeForce GTX 970. تحتوي لوحة Nvidia المرجعية على مجموعة الموصلات المعتادة لتوصيل أجهزة إخراج الصورة: واحد DVI مزدوج الارتباط ومنفذ HDMI وثلاثة منافذ DisplayPort. علاوة على ذلك ، هناك دعم للجديد إصدارات HDMIو DisplayPort الذي كتبناه أعلاه في مراجعة طراز GTX 1080.

التغييرات المعمارية

تعتمد GeForce GTX 1070 على شريحة GP104 ، وهي الأولى من جيل جديد من بنية رسومات Nvidia's Pascal. استندت هذه البنية إلى الحلول التي تم تطويرها مرة أخرى في Maxwell ، ولكن لديها أيضًا بعض الاختلافات الوظيفية ، والتي كتبنا عنها بالتفصيل أعلاه - في الجزء المخصص لأفضل بطاقة فيديو GeForce GTX 1080.

كان التغيير الرئيسي في البنية الجديدة هو العملية التكنولوجية التي سيتم من خلالها تنفيذ جميع وحدات معالجة الرسومات الجديدة. أتاح استخدام عملية التصنيع FinFET مقاس 16 نانومتر في إنتاج GP104 زيادة تعقيد الشريحة بشكل كبير مع الحفاظ على مساحة وتكلفة منخفضة نسبيًا ، كما أن الشريحة الأولى من معمارية باسكال لديها عدد أكبر بكثير من التنفيذ الوحدات ، بما في ذلك تلك التي توفر وظائف جديدة ، مقارنة برقائق Maxwell ذات المواقع المماثلة.

تتشابه شريحة الفيديو GP104 في تصميمها مع حلول Maxwell المعمارية المماثلة ، ويمكنك العثور على معلومات مفصلة حول تصميم وحدات معالجة الرسومات الحديثة في مراجعاتنا لحلول Nvidia السابقة. مثل وحدات معالجة الرسومات السابقة ، سيكون لرقائق البنية الجديدة تكوين مختلف لمجموعة معالجة الرسومات (GPC) ، وتدفق المعالجات المتعددة (SM) ووحدات التحكم في الذاكرة ، وقد خضع GeForce GTX 1070 بالفعل لبعض التغييرات - تم قفل جزء من الشريحة و غير نشط (مظلل باللون الرمادي):

على الرغم من أن GP104 GPU يشتمل على أربع مجموعات GPC و 20 معالجات SM متعددة ، في إصدار GeForce GTX 1070 ، تلقى تعديلًا مُجردًا مع مجموعة GPC واحدة تم تعطيلها بواسطة الأجهزة. نظرًا لأن كل مجموعة GPC بها محرك تنقيط مخصص وتتضمن خمس وحدات SMs ، ويتكون كل معالج متعدد من 128 نواة CUDA وثمانية وحدات TMU ، و 1920 نواة CUDA و 120 وحدة TMU من 2560 معالجات دفق نشطة في هذا الإصدار من GP104 و 160 وحدة نسيج مادية.

يحتوي معالج الرسوميات الذي يعتمد عليه GeForce GTX 1070 على ثمانية وحدات تحكم في الذاكرة 32 بت ، مما يوفر ناقل ذاكرة نهائي 256 بت - تمامًا كما هو الحال في طراز GTX 1080 الأقدم. لم يتم قطع النظام الفرعي للذاكرة من أجل توفر ذاكرة ذات نطاق ترددي عالٍ بما يكفي بشرط استخدام ذاكرة GDDR5 في GeForce GTX 1070. تحتوي كل وحدة تحكم في الذاكرة على ثمانية ROPs و 256 كيلوبايت من ذاكرة التخزين المؤقت L2 ، لذلك تحتوي شريحة GP104 في هذا التعديل أيضًا على 64 ROPs و 2048 كيلوبايت من L2 مستوى ذاكرة التخزين المؤقت.

بفضل التحسينات المعمارية وتقنية المعالجة الجديدة ، أصبحت GP104 GPU أكثر وحدة معالجة رسومات غرافيك كفاءة في استخدام الطاقة في السوق. هذه اللحظة. تمكن مهندسو Nvidia من زيادة سرعة الساعة أكثر مما كانوا يتوقعون عند الانتقال إلى عملية جديدة ، حيث كان عليهم العمل بجد ، والتحقق بعناية وتحسين جميع الاختناقات في الحلول السابقة التي لم تسمح لهم بالعمل بتردد أعلى. وفقًا لذلك ، تعمل GeForce GTX 1070 أيضًا بتردد عالٍ جدًا ، أعلى بأكثر من 40٪ من القيمة المرجعية لـ GeForce GTX 970.

نظرًا لأن GeForce GTX 1070 هو ، في جوهره ، مجرد GTX 1080 أقل إنتاجية بقليل مع ذاكرة GDDR5 ، فهو يدعم تمامًا جميع التقنيات التي وصفناها في القسم السابق. لمزيد من التفاصيل حول بنية Pascal ، بالإضافة إلى التقنيات التي تدعمها ، مثل وحدات معالجة الإخراج والفيديو المحسّنة ، ودعم Async Compute ، وتقنية Simultaneous Multi-Projection ، والتغييرات في عرض شرائح SLI المتعددة ، ونوع Fast Sync الجديد التزامن ، يجدر القراءة مع قسم على GTX 1080.

ذاكرة GDDR5 عالية الأداء واستخدامها الفعال

لقد كتبنا أعلاه عن التغييرات في النظام الفرعي للذاكرة لوحدة معالجة الرسومات GP104 ، والتي تستند إليها طرازي GeForce GTX 1080 و GTX 1070 - تدعم وحدات التحكم في الذاكرة المضمنة في وحدة معالجة الرسومات هذه النوع الجديد من ذاكرة الفيديو GDDR5X ، والتي تم وصفها بالتفصيل في مراجعة GTX 1080 ، وكذلك ذاكرة GDDR5 القديمة الجيدة التي عرفناها منذ عدة سنوات حتى الآن.

من أجل عدم فقد الكثير من عرض النطاق الترددي للذاكرة في النموذج السفلي GTX 1070 مقارنةً بـ GTX 1080 الأقدم ، تم ترك جميع وحدات التحكم في الذاكرة الثمانية 32 بت نشطة فيه ، مما أدى إلى الحصول على واجهة ذاكرة فيديو مشتركة كاملة 256 بت. بالإضافة إلى ذلك ، تم تجهيز بطاقة الفيديو بأسرع ذاكرة GDDR5 متوفرة في السوق - بتردد تشغيل فعال يبلغ 8 جيجاهرتز. قدم كل هذا عرض نطاق ترددي للذاكرة يبلغ 256 جيجابايت / ثانية ، على عكس 320 جيجابايت / ثانية للحل الأقدم - تم قطع إمكانيات الحوسبة بنفس المقدار تقريبًا ، لذلك تم الحفاظ على الرصيد.

ضع في اعتبارك أنه في حين أن ذروة النطاق الترددي النظري مهمة لأداء وحدة معالجة الرسومات ، فإنك تحتاج إلى الانتباه إلى كفاءتها أيضًا. أثناء عملية العرض ، يمكن للعديد من الاختناقات المختلفة أن تحد من الأداء العام ، مما يمنع استخدام كل عرض النطاق الترددي للذاكرة المتاح. لتقليل هذه الاختناقات ، تستخدم وحدات معالجة الرسومات ضغط بيانات خاص بدون فقد البيانات لتحسين كفاءة قراءة البيانات وكتابتها.

تم إدخال الجيل الرابع من ضغط دلتا لمعلومات المخزن المؤقت بالفعل في بنية باسكال ، مما يسمح لوحدة معالجة الرسومات (GPU) باستخدام الإمكانات المتاحة لناقل ذاكرة الفيديو بكفاءة أكبر. يستخدم النظام الفرعي للذاكرة في GeForce GTX 1070 و GTX 1080 تقنيات قديمة محسنة والعديد من تقنيات ضغط البيانات الجديدة غير المفقودة المصممة لتقليل متطلبات النطاق الترددي. هذا يقلل من كمية البيانات المكتوبة في الذاكرة ، ويحسن كفاءة ذاكرة التخزين المؤقت L2 ، ويقلل من كمية البيانات المرسلة بين نقاط مختلفة على وحدة معالجة الرسومات ، مثل TMU ومخزن الإطارات.

GPU Boost 3.0 وميزات رفع تردد التشغيل

أعلن معظم شركاء Nvidia بالفعل عن حلول لزيادة سرعة المصنع استنادًا إلى GeForce GTX 1080 و GTX 1070. المرافق الخاصةلرفع تردد التشغيل ، مما يسمح لك باستخدام الوظيفة الجديدة لتقنية GPU Boost 3.0. أحد الأمثلة على هذه الأدوات هو EVGA Precision XOC ، والذي يتضمن ماسحًا تلقائيًا لتحديد منحنى الجهد إلى التردد - في هذا الوضع ، لكل جهد ، من خلال إجراء اختبار ثبات ، يتم العثور على تردد ثابت توفر عنده وحدة معالجة الرسومات تعزيز الأداء. ومع ذلك ، يمكن أيضًا تغيير هذا المنحنى يدويًا.

نحن نعرف تقنية GPU Boost جيدًا من بطاقات رسومات Nvidia السابقة. في وحدات معالجة الرسومات الخاصة بهم ، يستخدمون ميزة الأجهزة هذه ، والتي تم تصميمها لزيادة سرعة ساعة تشغيل وحدة معالجة الرسومات في أوضاع لم تصل فيها بعد إلى حدود استهلاك الطاقة وتبديد الحرارة. في وحدات معالجة الرسومات Pascal ، خضعت هذه الخوارزمية لعدة تغييرات ، أهمها ضبط دقيق لترددات التوربو ، اعتمادًا على الجهد.

إذا كان الفرق بين التردد الأساسي وتردد التوربو ثابتًا في وقت سابق ، فقد أصبح من الممكن في GPU Boost 3.0 ضبط إزاحة تردد التوربو لكل جهد على حدة. الآن يمكن ضبط تردد التوربو لكل من قيم الجهد الفردية ، مما يسمح لك بالضغط الكامل على جميع إمكانيات رفع تردد التشغيل خارج وحدة معالجة الرسومات. لقد كتبنا عن هذه الميزة بالتفصيل في مراجعة GeForce GTX 1080 ، ويمكنك استخدام أدوات EVGA Precision XOC و MSI Afterburner لهذا الغرض.

نظرًا لأن بعض التفاصيل قد تغيرت في منهجية رفع تردد التشغيل مع إصدار بطاقات الفيديو مع دعم GPU Boost 3.0 ، كان على Nvidia تقديم تفسيرات إضافية في الإرشادات الخاصة برفع تردد التشغيل للمنتجات الجديدة. هناك تقنيات مختلفة لرفع تردد التشغيل بخصائص متغيرة مختلفة تؤثر على النتيجة النهائية. لكل نظام معين ، قد تكون طريقة معينة مناسبة بشكل أفضل ، لكن الأساسيات دائمًا ما تكون متشابهة.

يستخدم العديد من محترفي رفع تردد التشغيل معيار Unigine Heaven 4.0 للتحقق من استقرار النظام ، والذي يقوم بتحميل وحدة معالجة الرسومات جيدًا ، وله إعدادات مرنة ويمكن تشغيله في وضع الإطارات جنبًا إلى جنب مع نافذة مساعدة لرفع تردد التشغيل والمراقبة في مكان قريب ، مثل EVGA Precision أو MSI Afterburner. ومع ذلك ، فإن هذا الفحص كافٍ فقط للتقديرات الأولية ، وللتأكيد بحزم على استقرار رفع تردد التشغيل ، يجب التحقق منه في العديد من تطبيقات الألعاب ، لأن الألعاب المختلفة تتطلب أحمالًا مختلفة على وحدات وظيفية مختلفة من وحدة معالجة الرسومات: رياضية ، نسيجية ، هندسية. يعتبر معيار Heaven 4.0 مناسبًا أيضًا لرفع تردد التشغيل لأنه يحتوي على وضع تشغيل متكرر ، حيث يكون مناسبًا لتغيير إعدادات رفع تردد التشغيل ، وهناك معيار لتقييم زيادة السرعة.

تنصح Nvidia بتشغيل نوافذ Heaven 4.0 و EVGA Precision XOC معًا عند رفع تردد التشغيل عن بطاقات الجرافيكس GeForce GTX 1080 و GTX 1070 الجديدة. في البداية ، من المستحسن زيادة سرعة المروحة على الفور. ولرفع تردد التشغيل بشكل خطير ، يمكنك ضبط قيمة السرعة على الفور على 100٪ ، الأمر الذي سيجعل بطاقة الفيديو تعمل بصوت عالٍ للغاية ، لكنها ستبرد وحدة معالجة الرسومات ومكونات بطاقة الفيديو الأخرى قدر الإمكان عن طريق خفض درجة الحرارة إلى أدنى حد. المستوى الممكن ، منع الاختناق (انخفاض في الترددات بسبب زيادة درجة حرارة وحدة معالجة الرسومات فوق قيمة معينة).

بعد ذلك ، تحتاج إلى ضبط قيمة الطاقة المستهدفة (Power Target) أيضًا على الحد الأقصى. سيوفر هذا الإعداد لوحدة معالجة الرسومات أقصى قدر ممكن من الطاقة عن طريق زيادة مستوى استهلاك الطاقة ودرجة الحرارة المستهدفة لوحدة معالجة الرسومات (GPU Temp Target). بالنسبة لبعض الأغراض ، يمكن فصل القيمة الثانية عن تغيير Power Target ، ومن ثم يمكن ضبط هذه الإعدادات بشكل فردي - لتحقيق تسخين أقل لشريحة الفيديو ، على سبيل المثال.

تتمثل الخطوة التالية في زيادة قيمة GPU Clock Offset - وهذا يعني مدى ارتفاع تردد التوربو أثناء التشغيل. ترفع هذه القيمة التردد لجميع الفولتية وتؤدي إلى أداء أفضل. كالعادة ، عند رفع تردد التشغيل ، تحتاج إلى التحقق من الثبات عند زيادة تردد وحدة معالجة الرسومات في خطوات صغيرة - من 10 ميجاهرتز إلى 50 ميجاهرتز لكل خطوة قبل أن تلاحظ حدوث تعليق أو خطأ في برنامج التشغيل أو التطبيق أو حتى أخطاء مرئية. عند الوصول إلى هذا الحد ، يجب عليك تقليل قيمة التردد عن طريق التنحي والتحقق مرة أخرى من الثبات والأداء أثناء رفع تردد التشغيل.

بالإضافة إلى تردد وحدة معالجة الرسومات ، يمكنك أيضًا زيادة تردد ذاكرة الفيديو (Memory Clock Offset) ، وهو أمر مهم بشكل خاص في حالة GeForce GTX 1070 المجهزة بذاكرة GDDR5 ، والتي عادةً ما تزيد تردد التشغيل بشكل جيد. تكرر العملية في حالة تردد الذاكرة تمامًا ما يتم إجراؤه عند العثور على تردد ثابت لوحدة معالجة الرسومات ، والفرق الوحيد هو أنه يمكن جعل الخطوات أكبر - أضف 50-100 ميجاهرتز إلى التردد الأساسي في وقت واحد.

بالإضافة إلى الخطوات المذكورة أعلاه ، يمكنك أيضًا زيادة حد الجهد الزائد ، لأنه غالبًا ما يتم تحقيق تردد أعلى لوحدة معالجة الرسومات عند زيادة الجهد ، عندما تتلقى الأجزاء غير المستقرة من وحدة معالجة الرسومات طاقة إضافية. صحيح ، العيب المحتمل للزيادة قيمة معينةهو احتمال حدوث تلف لشريحة الفيديو وفشلها المتسارع ، لذلك تحتاج إلى استخدام زيادة الجهد بحذر شديد.

يستخدم عشاق رفع تردد التشغيل تقنيات مختلفة قليلاً ، ويغيرون المعلمات بترتيب مختلف. على سبيل المثال ، تشارك بعض أجهزة رفع تردد التشغيل الخبرات في العثور على وحدة معالجة الرسومات الثابتة وتردد الذاكرة بحيث لا تتداخل مع بعضها البعض ، ثم تختبر عملية رفع تردد التشغيل المدمجة لكل من شريحة الفيديو وشرائح الذاكرة ، ولكن هذه بالفعل تفاصيل غير مهمة لنهج فردي .

إذا حكمنا من خلال الآراء في المنتديات والتعليقات على المقالات ، فإن بعض المستخدمين لم يعجبهم الخوارزمية الجديدة لـ GPU Boost 3.0 ، عندما يرتفع تردد GPU لأول مرة ، غالبًا فوق تردد التوربو ، ولكن بعد ذلك ، تحت تأثير زيادة في درجة حرارة وحدة معالجة الرسومات أو زيادة استهلاك الطاقة فوق الحد المعين ، يمكن أن تنخفض إلى قيم أقل بكثير. هذه مجرد تفاصيل الخوارزمية المحدثة ، تحتاج إلى التعود على السلوك الجديد لتردد GPU المتغير ديناميكيًا ، لكن ليس له أي عواقب سلبية.

GeForce GTX 1070 هو النموذج الثاني بعد GTX 1080 في خط Nvidia الجديد من معالجات الرسوم المبنية على عائلة Pascal. مكنت عملية التصنيع الجديدة FinFET 16nm وتحسينات البنية بطاقة الرسومات هذه من تحقيق سرعات عالية على مدار الساعة ، والتي يدعمها الجيل الجديد من تقنية GPU Boost. على الرغم من تقليل عدد الكتل الوظيفية في شكل معالجات الدفق ووحدات النسيج ، إلا أن عددها يظل كافياً حتى تصبح GTX 1070 الحل الأكثر ربحًا وكفاءة في استخدام الطاقة.

تركيب ذاكرة GDDR5 على أصغر زوج من موديلات بطاقات الفيديو Nvidia التي تم إصدارها على شريحة GP104 ، على عكس النوع الجديد من GDDR5X الذي يميز GTX 1080 ، لا يمنعها من تحقيق مؤشرات أداء عالية. أولاً ، قررت Nvidia عدم قطع ناقل الذاكرة من طراز GeForce GTX 1070 ، وثانيًا ، قاموا بوضع أسرع ذاكرة GDDR5 عليها بتردد فعال يبلغ 8 جيجاهرتز ، وهو أقل بقليل من 10 جيجاهرتز بالنسبة إلى GDDR5X المستخدم في نموذج أقدم. مع الأخذ في الاعتبار خوارزميات ضغط دلتا المحسّنة ، أصبح عرض النطاق الترددي الفعال لوحدة معالجة الرسومات أعلى من نفس المعلمة لـ نموذج مماثلالجيل السابق GeForce GTX 970.

تعتبر GeForce GTX 1070 جيدة من حيث أنها تقدم أداءً عاليًا للغاية ودعمًا للميزات والخوارزميات الجديدة بسعر أقل بكثير مقارنة بالنموذج الأقدم الذي تم الإعلان عنه قبل ذلك بقليل. إذا كان بمقدور عدد قليل من المتحمسين شراء GTX 1080 مقابل 55000 ، فستتمكن دائرة أكبر بكثير من المشترين المحتملين من دفع 35000 مقابل ربع الحل الأقل إنتاجية بنفس الإمكانات تمامًا. لقد كان مزيجًا من السعر المنخفض نسبيًا والأداء العالي هو ما جعل GeForce GTX 1070 ربما أكثر عملية شراء مربحة في وقت إصدارها.

مسرع الرسومات GeForce GTX 1060

معاملالمعنى
اسم رمز رقاقةGP106
تكنولوجيا الإنتاج16nm FinFET
عدد الترانزستورات4.4 مليار
منطقة جوهرية200 مم²
هندسة عامةموحد ، مع مجموعة من المعالجات الشائعة لمعالجة التدفق لأنواع عديدة من البيانات: الرؤوس ، والبكسل ، وما إلى ذلك.
دعم أجهزة DirectXDirectX 12 ، مع دعم مستوى الميزة 12_1
ناقل الذاكرة192 بت: ستة وحدات تحكم مستقلة في الذاكرة 32 بت تدعم ذاكرة GDDR5
تردد وحدة معالجة الرسومات1506 (1708) ميجا هرتز
كتل الحوسبة10 معالجات متعددة متدفقة ، بما في ذلك 1280 وحدة ALU قياسية لحسابات النقطة العائمة ضمن معيار IEEE 754-2008 ؛
كتل التركيب80 وحدة معالجة وترشيح نسيج مع دعم لمكونات FP16 و FP32 في القوام ودعم الترشيح ثلاثي الخطوط ومتباين الخواص لجميع تنسيقات النسيج
وحدات العمليات النقطية (ROPs)6 ROPs عريضة (48 بكسل) مع دعم لمختلف أوضاع الصقل ، بما في ذلك قابل للبرمجة وبتنسيق المخزن المؤقت للإطار FP16 أو FP32. تتكون الكتل من مجموعة من وحدات ALU القابلة للتكوين وهي مسؤولة عن توليد العمق والمقارنة والاختزال والمزج المتعدد
دعم المراقبةدعم متكامل لما يصل إلى أربع شاشات متصلة عبر Dual Link DVI و HDMI 2.0b و DisplayPort 1.2 (1.3 / 1.4 جاهز)

مواصفات الجرافيكس المرجعية للبطاقة GeForce GTX 1060
معاملالمعنى
التردد الأساسي1506 (1708) ميجا هرتز
عدد المعالجات العالمية1280
عدد الكتل النسيجية80
عدد كتل المزج48
تردد الذاكرة الفعال8000 (4 × 2000) ميجاهرتز
نوع الذاكرةGDDR5
ناقل الذاكرة192 بت
حجم الذاكرة6 جيجا بايت
عرض النطاق الترددي للذاكرة192 جيجا بايت / ثانية
أداء الحوسبة (FP32)حوالي 4 تيرافلوب
الحد الأقصى لمعدل التعبئة النظري72 جيجا بكسل / ثانية
معدل أخذ عينات النسيج النظري121 جيجاتكسيلس / ثانية
إطار العجلةPCI Express 3.0
موصلاتمنفذ DVI مزدوج الارتباط ومنفذ HDMI وثلاثة منافذ DisplayPort
استهلاك الطاقة النموذجي120 واط
المزيد من الطعامموصل واحد 6 سنون
عدد الفتحات المشغولة في هيكل النظام2
السعر الموصى به249 دولارًا (299 دولارًا) في الولايات المتحدة و 18990 في روسيا

تلقت بطاقة الفيديو GeForce GTX 1060 أيضًا اسمًا مشابهًا لنفس الحل من سلسلة GeForce السابقة ، يختلف عن اسم سلفها المباشر GeForce GTX 960 فقط من خلال الرقم الأول الذي تم تغييره من الجيل. أصبحت الحداثة في الخط الحالي للشركة أقل بخطوة واحدة من حل GeForce GTX 1070 الذي تم إصداره مسبقًا ، وهو متوسط ​​من حيث السرعة في السلسلة الجديدة.

الأسعار الموصى بها لبطاقة الفيديو الجديدة من Nvidia هي 249 دولارًا و 299 دولارًا للإصدارات العادية لشركاء الشركة وللإصدار الخاص للمؤسس ، على التوالي. بالمقارنة مع الطرازين الأقدم ، يعد هذا سعرًا مناسبًا للغاية ، نظرًا لأن طراز GTX 1060 الجديد ، على الرغم من أنه أدنى من اللوحات الأم المتطورة ، إلا أنه ليس قريبًا بقدر ما هو أرخص. في وقت الإعلان ، أصبحت الجدة بالتأكيد أفضل حل أداء في فئتها وأحد أكثر العروض ربحية في هذا النطاق السعري.

ظهر هذا النموذج من بطاقة فيديو عائلة Pascal من Nvidia لمواجهة القرار الجديد للشركة المنافسة AMD ، التي أصدرت Radeon RX 480 قبل ذلك بقليل.يمكنك مقارنة بطاقة الفيديو Nvidia الجديدة ببطاقة الفيديو هذه ، على الرغم من أنها ليست مباشرة تمامًا ، حيث لا تزال تختلف اختلافًا كبيرًا في السعر. تعد GeForce GTX 1060 أغلى ثمناً (249-299 دولارًا مقابل 199-229 دولارًا) ، لكنها أيضًا أسرع من منافستها.

يحتوي معالج الرسومات GP106 على ناقل ذاكرة 192 بت ، وبالتالي يمكن أن يكون حجم الذاكرة المثبتة على بطاقة الفيديو مع مثل هذا الناقل 3 أو 6 جيجابايت. القيمة الأقل في الظروف الحديثة ليست كافية بصراحة ، والعديد من مشاريع الألعاب ، حتى في دقة الوضوح العالي الكامل ، ستواجه نقصًا في ذاكرة الفيديو ، مما سيؤثر بشكل خطير على سلاسة العرض. لضمان أقصى أداء للحل الجديد في الإعدادات العالية ، تم تجهيز طراز GeForce GTX 1060 بذاكرة فيديو بسعة 6 جيجابايت ، وهو ما يكفي لتشغيل أي تطبيقات ثلاثية الأبعاد بأي إعدادات جودة. علاوة على ذلك ، لا يوجد فرق اليوم بين 6 و 8 جيجابايت ، وسيوفر هذا الحل بعض المال.

تبلغ قيمة استهلاك الطاقة النموذجية للمنتج الجديد 120 واط ، وهي أقل بنسبة 20٪ من قيمة GTX 1070 وتساوي استهلاك الطاقة للجيل السابق من بطاقة الرسومات GeForce GTX 960 ، والتي تتميز بأداء وقدرات أقل بكثير. تحتوي اللوحة المرجعية على مجموعة الموصلات المعتادة لتوصيل أجهزة إخراج الصور: منفذ DVI مزدوج الارتباط ومنفذ HDMI وثلاثة منافذ DisplayPort. علاوة على ذلك ، كان هناك دعم للإصدارات الجديدة من HDMI و DisplayPort ، والتي كتبنا عنها في مراجعة طراز GTX 1080.

يبلغ طول اللوحة المرجعية GeForce GTX 1060 9.8 بوصة (25 سم) ، ومن الاختلافات عن الخيارات القديمة ، نلاحظ بشكل منفصل أن GeForce GTX 1060 لا يدعم تكوين عرض الشرائح المتعددة SLI ، وليس لديه موصل خاص لهذا الغرض. نظرًا لأن اللوحة تستهلك طاقة أقل من الطرز القديمة ، فقد تم تثبيت موصل طاقة خارجي PCI-E مكون من 6 سنون على اللوحة للحصول على طاقة إضافية.

ظهرت بطاقات الفيديو GeForce GTX 1060 في السوق منذ يوم الإعلان في شكل منتجات من شركاء الشركة: Asus و EVGA و Gainward و Gigabyte و Innovision 3D و MSI و Palit و Zotac. سيتم إصدار إصدار خاص من إصدار المؤسس GeForce GTX 1060 ، الذي أنتجته Nvidia نفسها ، بكميات محدودة ، وسيتم بيعه بسعر 299 دولارًا حصريًا على موقع Nvidia الإلكتروني ولن يتم تقديمه رسميًا في روسيا. تتميز Founder's Edition بأنها مصنوعة من مواد ومكونات عالية الجودة ، بما في ذلك غلاف من الألومنيوم ، وتستخدم نظام تبريد فعال ، بالإضافة إلى دوائر طاقة منخفضة المقاومة ومنظمات جهد مصممة خصيصًا.

التغييرات المعمارية

تعتمد بطاقة الفيديو GeForce GTX 1060 على معالج رسوميات جديد تمامًا من طراز GP106 ، والذي لا يختلف وظيفيًا عن البكر في بنية Pascal في شكل شريحة GP104 ، والتي تم وصف طرازي GeForce GTX 1080 و GTX 1070 عليها أعلاه تستند هذه البنية إلى حلول تم إعادة صياغتها في Maxwell ، ولكن لديها أيضًا بعض الاختلافات الوظيفية ، والتي كتبنا عنها بالتفصيل سابقًا.

تتشابه شريحة الفيديو GP106 في تصميمها مع شريحة Pascal المتطورة والحلول المماثلة لهندسة Maxwell ، ويمكنك العثور على معلومات مفصلة حول تصميم وحدات معالجة الرسومات الحديثة في مراجعاتنا لحلول Nvidia السابقة. مثل وحدات معالجة الرسومات السابقة ، تحتوي شرائح الهيكل الجديد على تكوين مختلف لمجموعة معالجة الرسومات (GPC) ، والمعالجات المتدفقة المتعددة (SM) ووحدات التحكم في الذاكرة:

يشتمل معالج الرسومات GP106 على مجموعتين من مجموعات GPC ، تتكون من 10 معالجات متدفقة متعددة (Streaming Multiprocessor - SM) ، أي نصف GP104 بالضبط. كما هو الحال في GPU الأقدم ، يحتوي كل من المعالجات المتعددة على 128 نواة ، و 8 وحدات نسيج TMU ، و 256 كيلوبايت لكل منها تسجيل الذاكرةو 96 كيلوبايت من الذاكرة المشتركة و 48 كيلوبايت من ذاكرة التخزين المؤقت L1. نتيجة لذلك ، تحتوي GeForce GTX 1060 على إجمالي 1،280 نواة حسابية و 80 وحدة نسيج ، أي نصف ذلك من GTX 1080.

لكن النظام الفرعي للذاكرة في GeForce GTX 1060 لم ينخفض ​​إلى النصف بالنسبة للحل الأعلى ، فهو يحتوي على ستة وحدات تحكم في الذاكرة 32 بت ، مما يعطي ناقل ذاكرة 192 بت الأخير. مع تردد فعال لذاكرة الفيديو GDDR5 لـ GeForce GTX 1060 يساوي 8 جيجاهرتز ، يصل عرض النطاق الترددي إلى 192 جيجابايت / ثانية ، وهو أمر جيد جدًا لحل هذه الشريحة السعرية ، لا سيما بالنظر إلى الكفاءة العالية لاستخدامها في باسكال. تحتوي كل وحدة من وحدات التحكم في الذاكرة على ثمانية ROPs و 256 كيلوبايت من ذاكرة التخزين المؤقت L2 المرتبطة بها ، لذا في المجموع النسخة الكاملةتحتوي وحدة معالجة الرسومات GP106 على 48 ROPs و 1536 كيلوبايت L2 مخبأ.

لتقليل متطلبات عرض النطاق الترددي للذاكرة والاستفادة بشكل أكثر كفاءة من بنية Pascal المتاحة ، تم تحسين ضغط البيانات بدون خسارة على الرقاقة ، وهو قادر على ضغط البيانات في المخازن المؤقتة ، واكتساب الكفاءة ومكاسب الأداء. على وجه الخصوص ، تمت إضافة طرق ضغط دلتا الجديدة بنسب 4: 1 و 8: 1 إلى شرائح العائلة الجديدة ، مما يوفر 20٪ إضافية لكفاءة عرض النطاق الترددي للذاكرة مقارنة بالحلول السابقة لعائلة Maxwell.

التردد الأساسي لوحدة معالجة الرسومات الجديدة هو 1506 ميجاهرتز - يجب ألا يقل التردد عن هذه العلامة من حيث المبدأ. تكون ساعة التوربو النموذجية (Boost Clock) أعلى بكثير عند 1708 ميجاهرتز ، وهو متوسط ​​التردد الفعلي الذي تعمل به شريحة الرسومات GeForce GTX 1060 في مجموعة واسعة من الألعاب والتطبيقات ثلاثية الأبعاد. يعتمد تردد Boost الفعلي على اللعبة والظروف التي يتم فيها الاختبار.

مثل باقي عائلة Pascal ، فإن GeForce GTX 1060 لا تعمل فقط بسرعة ساعة عالية ، مما يوفر أداءً عاليًا ، ولكن أيضًا بهامش لائق لرفع تردد التشغيل. تشير التجارب الأولى إلى إمكانية الوصول إلى ترددات بترتيب 2 جيجاهرتز. ليس من المستغرب أن يقوم شركاء الشركة أيضًا بإعداد إصدارات تم رفع تردد التشغيل عنها في المصنع لبطاقة الفيديو GTX 1060.

لذلك ، كان التغيير الرئيسي في البنية الجديدة هو عملية FinFET مقاس 16 نانومتر ، والتي أتاح استخدامها في إنتاج GP106 زيادة تعقيد الشريحة بشكل كبير مع الحفاظ على مساحة منخفضة نسبيًا تبلغ 200 مم² ، لذلك تحتوي شريحة معمارية Pascal هذه على عدد أكبر بكثير من وحدات التنفيذ مقارنة بشريحة Maxwell ذات المواقع المماثلة التي تم إنتاجها باستخدام تقنية المعالجة 28 نانومتر.

إذا كان GM206 (GTX 960) بمساحة 227 مم² يحتوي على 3 مليارات ترانزستور و 1024 وحدة ALU و 64 وحدة TMU و 32 ROPs وناقل 128 بت ، فإن وحدة معالجة الرسومات الجديدة تحتوي على 4.4 مليار ترانزستور ، و 1280 وحدة ALU ، في 200 مم² و 80 وحدة TMU و 48 ROPs مع ناقل 192 بت. علاوة على ذلك ، عند تردد أعلى مرة ونصف تقريبًا: 1506 (1708) مقابل 1126 (1178) ميجاهرتز. وهذا بنفس استهلاك الطاقة البالغ 120 واط! نتيجة لذلك ، أصبحت GP106 GPU واحدة من أكثر وحدات معالجة الرسومات كفاءة في استخدام الطاقة ، إلى جانب GP104.

تقنيات Nvidia الجديدة

واحدة من أكثر تقنيات الشركة إثارة للاهتمام ، والتي تدعمها GeForce GTX 1060 والحلول الأخرى لعائلة Pascal ، هي التكنولوجيا Nvidia متعدد الإسقاطات المتزامنة. لقد كتبنا بالفعل عن هذه التقنية في مراجعة GeForce GTX 1080 ، فهي تتيح لك استخدام العديد من التقنيات الجديدة لتحسين العرض. على وجه الخصوص - لعرض صورة VR في وقت واحد لعينين في وقت واحد ، مما يزيد بشكل كبير من كفاءة استخدام وحدة معالجة الرسومات في الواقع الافتراضي.

لدعم SMP ، تحتوي جميع وحدات معالجة الرسومات التابعة لعائلة Pascal على محرك خاص ، والذي يوجد في محرك PolyMorph في نهاية خط الأنابيب الهندسي قبل أداة المسح. بواسطته ، يمكن لوحدة معالجة الرسومات (GPU) أن تعرض بشكل متزامن بدائية هندسية على عدة إسقاطات من نقطة واحدة ، في حين أن هذه الإسقاطات يمكن أن تكون مجسمة (على سبيل المثال ، يتم دعم ما يصل إلى 16 أو 32 إسقاطًا في وقت واحد). تسمح هذه الميزة لوحدات معالجة رسومات Pascal بإعادة إنتاج السطح المنحني بدقة لعرض الواقع الافتراضي ، وكذلك العرض بشكل صحيح على أنظمة الشاشات المتعددة.

من المهم أن يتم بالفعل دمج تقنية Simultaneous Multi-Projection في محركات الألعاب الشائعة (Unreal Engine و Unity) والألعاب ، وحتى الآن ، تم الإعلان عن دعم التكنولوجيا لأكثر من 30 لعبة قيد التطوير ، بما في ذلك تلك المعروفة جيدًا مشاريع مثل Unreal Tournament و Poolnation VR و Everest VR و Obduction و Adr1ft و Raw Data. ومن المثير للاهتمام ، على الرغم من أن Unreal Tournament ليست لعبة VR ، إلا أنها تستخدم SMP لتحقيق صور وأداء أفضل.

هناك تقنية أخرى طال انتظارها وهي أداة قوية لإنشاء لقطات شاشة في الألعاب. نفيديا أنسل. تتيح لك هذه الأداة إنشاء لقطات شاشة غير عادية وعالية الجودة من الألعاب ، مع ميزات لا يمكن الوصول إليها سابقًا ، وحفظها بدقة عالية جدًا وتكميلها بتأثيرات مختلفة ، ومشاركة إبداعاتك. يسمح لك Ansel بإنشاء لقطة شاشة بالطريقة التي يريدها الفنان حرفيًا ، مما يسمح لك بتثبيت كاميرا بأي معلمات في أي مكان في المشهد ، أو تطبيق مرشحات قوية لما بعد الصورة ، أو حتى التقاط لقطة بزاوية 360 درجة للمشاهدة في خوذة الواقع الافتراضي.

Nvidia لديها تكامل موحد واجهة المستخدم Ansel في الألعاب ، ومن السهل جدًا القيام بذلك - فقط أضف بضعة أسطر من التعليمات البرمجية. لم يعد من الضروري انتظار ظهور هذه الميزة في الألعاب ، يمكنك تقييم قدرات Ansel الآن في Mirror's Edge: Catalyst ، وبعد ذلك بقليل ستصبح متاحة في Witcher 3: Wild Hunt. بالإضافة إلى ذلك ، هناك العديد من مشاريع الألعاب التي تدعم Ansel قيد التطوير ، بما في ذلك ألعاب مثل Fortnite و Paragon و Unreal Tournament و Obduction و The Witness و Lawbreakers و Tom Clancy's The Division و No Man's Sky والمزيد.

تدعم وحدة معالجة الرسومات GeForce GTX 1060 الجديدة مجموعة الأدوات أيضًا نفيديا VRWorks، مما يساعد المطورين على إنشاء مشاريع رائعة للواقع الافتراضي. تتضمن هذه الحزمة العديد من الأدوات المساعدة للمطورين ، بما في ذلك VRWorks Audio ، والتي تتيح لك إجراء حساب دقيق للغاية لانعكاسات الموجات الصوتية من كائنات المشهد باستخدام تتبع أشعة GPU. تتضمن الحزمة أيضًا التكامل مع تأثيرات فيزياء VR و PhysX لضمان السلوك الصحيح جسديًا للأشياء في المشهد.

واحدة من أكثر ألعاب الواقع الافتراضي إثارة للاستفادة من VRWorks هي VR Funhouse ، لعبة VR الخاصة بـ Nvidia ، والمتاحة مجانًا على خدمة Valve's Steam. هذه اللعبة مدعومة من Unreal Engine 4 (Epic Games) وتعمل على بطاقات الرسوم GeForce GTX 1080 و 1070 و 1060 جنبًا إلى جنب مع سماعات الرأس HTC Vive VR. علاوة على ذلك ، سيكون الكود المصدري لهذه اللعبة متاحًا للجمهور ، مما سيسمح للمطورين الآخرين باستخدام الأفكار الجاهزة والأكواد الموجودة بالفعل في أماكن الجذب الخاصة بهم في الواقع الافتراضي. خذ كلمتنا من أجلها ، هذا أحد أكثر العروض إثارة للإعجاب لإمكانيات الواقع الافتراضي.

بما في ذلك بفضل تقنيات SMP و VRWorks ، فإن استخدام وحدة معالجة الرسومات GeForce GTX 1060 في تطبيقات VR يوفر ما يكفي تمامًا مبتدأأداء الواقع الافتراضي ، وتفي وحدة معالجة الرسومات (GPU) المعنية بالحد الأدنى المطلوب من مستوى الأجهزة ، بما في ذلك SteamVR ، لتصبح واحدة من أكثر عمليات الاستحواذ نجاحًا للاستخدام في الأنظمة ذات الدعم الرسمي VR.

نظرًا لأن طراز GeForce GTX 1060 يعتمد على شريحة GP106 ، والتي ليست بأي حال من الأحوال أدنى من معالج الرسومات GP104 ، الذي أصبح أساسًا للتعديلات الأقدم ، فهو يدعم تمامًا جميع التقنيات الموضحة أعلاه.

GeForce GTX 1060 هو النموذج الثالث في خط Nvidia الجديد من معالجات الرسوم المبنية على عائلة Pascal. سمحت تقنية المعالجة FinFET الجديدة ذات 16 نانومتر وتحسينات البنية لجميع بطاقات الرسومات الجديدة بتحقيق سرعات عالية على مدار الساعة ووضع المزيد من الكتل الوظيفية في وحدة معالجة الرسومات في شكل معالجات دفق ووحدات نسيجية وغيرها ، مقارنةً بشرائح الفيديو من الجيل السابق. هذا هو السبب في أن GTX 1060 أصبح الحل الأكثر ربحًا وكفاءة في استخدام الطاقة في فئته وبشكل عام.

من المهم بشكل خاص أن تقدم GeForce GTX 1060 أداءً عاليًا بدرجة كافية ودعمًا للميزات والخوارزميات الجديدة بسعر أقل بكثير مقارنة بالحلول القديمة القائمة على GP104. توفر شريحة الرسومات GP106 المستخدمة في الطراز الجديد أفضل أداء وكفاءة في استهلاك الطاقة. تم تصميم GeForce GTX 1060 خصيصًا وهي مثالية لجميع الألعاب الحديثة بإعدادات رسومات عالية وأقصى دقة تبلغ 1920 × 1080 وحتى مع تمكين خاصية منع التعرج بملء الشاشة. أساليب مختلفة(FXAA أو MFAA أو MSAA).

وبالنسبة لأولئك الذين يريدون المزيد من الأداء مع شاشات فائقة الدقة ، فإن Nvidia لديها أفضل بطاقات الرسوم GeForce GTX 1070 و GTX 1080 ، والتي تعد أيضًا جيدة جدًا من حيث الأداء وكفاءة الطاقة. ومع ذلك ، فإن الجمع بين السعر المنخفض والأداء الكافي يميز بشكل إيجابي للغاية GeForce GTX 1060 عن خلفية الحلول القديمة. مقارنةً بـ Radeon RX 480 المتنافس ، فإن حل Nvidia أسرع قليلاً مع تعقيد أقل وبصمة GPU ، وله كفاءة طاقة أفضل بشكل ملحوظ. صحيح أنه يباع بسعر أغلى قليلاً ، لذلك كل بطاقة فيديو لها مكانتها الخاصة.

مراجعة بطاقة الفيديو NVIDIA GeForce GTX 780 | تجربة GeForce و ShadowPlay

تجربة GeForce

بصفتنا من عشاق الكمبيوتر ، فإننا نقدر مجموعة الإعدادات المختلفة التي تؤثر على أداء وجودة الألعاب. أسهل طريقة هي إنفاق الكثير من المال على بطاقة فيديو جديدة وتعيين كافة إعدادات الرسومات إلى الحد الأقصى. ولكن عندما يتبين أن إحدى المعلمات ثقيلة جدًا بالنسبة للبطاقة ويجب تقليلها أو إيقاف تشغيلها ، فهناك شعور غير سار وإدراك أن اللعبة يمكن أن تعمل بشكل أفضل.

ومع ذلك ، فإن ضبط الإعدادات المثلى ليس بهذه السهولة. تنتج بعض الإعدادات مرئيات أفضل من غيرها ، ويمكن أن يختلف التأثير على الأداء بشكل كبير. يعد برنامج GeForce Experience محاولة من NVIDIA لتسهيل اختيار إعدادات اللعبة من خلال مقارنة وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU) والدقة مقابل قاعدة بيانات التكوينات. يساعدك الجزء الثاني من الأداة المساعدة في تحديد ما إذا كانت برامج التشغيل بحاجة إلى تحديثات.

من المحتمل أن يستمر المتحمسون في اختيار الإعدادات بأنفسهم وسوف يدركون ذلك بشكل سلبي برنامج إضافي. ومع ذلك ، فإن معظم اللاعبين الذين يرغبون في تثبيت اللعبة والبدء في اللعب على الفور دون التحقق من برامج التشغيل والاطلاع على الإعدادات المختلفة سيكونون سعداء بالتأكيد بهذه الفرصة. في كلتا الحالتين ، تساعد GeForce Experience من NVIDIA الأشخاص على تحقيق أقصى استفادة من تجربة الألعاب الخاصة بهم ، وبالتالي فهي أداة مفيدة لألعاب الكمبيوتر.

حددت GeForce Experience جميع الألعاب التسع المثبتة على نظام الاختبار الخاص بنا. بطبيعة الحال لم يحفظوا الإعدادات الافتراضية لأننا طبقنا إعدادات معينة من أجل الاختبار. ولكن لا يزال من المثير للاهتمام كيف غيّرت GeForce Experience الخيارات التي اخترناها.

بالنسبة إلى Tomb Raider ، أرادت GeForce Experience تعطيل تقنية TressFX ، على الرغم من ذلك NVIDIA GeForce GTX 780مع تمكين الوظيفة ، أظهر متوسط ​​40 إطارًا في الثانية. لسبب ما ، لم يتمكن البرنامج من تحديد التكوين بعيدة كل البعد 3، على الرغم من أن الإعدادات التي اقترحتها كانت عالية جدًا. لأسباب غير معروفة لـ Skyrim ، أرادت الأداة تعطيل FXAA.

من الجيد الحصول على مجموعة من لقطات الشاشة لكل لعبة تصف تأثير إعداد معين على جودة الصورة. من بين الأمثلة التسعة التي راجعناها ، اقتربت GeForce Experience من الإعدادات المثلى ، في رأينا. ومع ذلك ، فإن الأداة متحيزة أيضًا ، وترعى ميزات خاصة بـ NVIDIA مثل PhysX (التي وضعها البرنامج على مستوى عالفي Borderlands 2) ومنع تمكين الميزات من AMD (بما في ذلك TressFX في Tomb Raider). إن تعطيل FXAA في Skyrim ليس منطقيًا على الإطلاق ، حيث يبلغ متوسط ​​اللعبة 100 إطارًا في الثانية. من المحتمل أن يرغب المتحمسون في تثبيت GeForce Experience بمجرد شحن نظام NVIDIA Shield ، حيث يبدو أن ميزة Game Streaming متاحة من خلال تطبيق NVIDIA.

ShadowPlay: مسجل فيديو دائم للألعاب

غالبًا ما يسجل عشاق WoW غاراتهم ، لكن هذا يتطلب نظامًا قويًا إلى حد ما ، Fraps ، والكثير من مساحة القرص.

أعلنت NVIDIA مؤخرًا ميزة جديدة ShadowPlay ، والذي يمكنه تبسيط عملية التسجيل بشكل كبير.

عند التنشيط ، يستخدم ShadowPlay وحدة فك التشفير الثابتة NVEnc المدمجة في وحدة معالجة الرسومات Kepler ، والتي تسجل تلقائيًا آخر 20 دقيقة من اللعب. أو يمكنك بدء تشغيل ShadowPlay وإيقافه يدويًا. وهكذا ، تحل التكنولوجيا محل حلول البرمجياتمثل Fraps ، والتي تعطي حملًا أعلى على وحدة المعالجة المركزية.

كمرجع: يعمل NVEnc فقط مع ترميز H.264 بدقة تصل إلى 4096 × 4096 بكسل. ShadowPlay غير متوفر بعد في السوق ، لكن NVIDIA تقول إنه سيكون قادرًا على تسجيل فيديو بدقة 1080 بكسل بمعدل يصل إلى 30 إطارًا في الثانية بحلول وقت إطلاقه هذا الصيف. نود أن نرى دقة أعلى حيث قيل سابقًا أن المشفر لديه القدرة على دعمه في الأجهزة.

مراجعة بطاقة الفيديو NVIDIA GeForce GTX 780 | GPU Boost 2.0 ومشكلات رفع تردد التشغيل المحتملة

GPU Boost 2.0

في مراجعة بطاقة GeForce GTX Titanلم نتمكن من اختبار تقنية NVIDIA GPU Boost من الجيل الثاني على نطاق واسع ، ولكنها الآن هنا NVIDIA GeForce GTX 780. فيما يلي وصف موجز لهذه التقنية:

GPU Boost هي إحدى آليات NVIDIA التي تغير أداء بطاقات الرسومات اعتمادًا على نوع المهمة التي تتم معالجتها. كما تعلم على الأرجح ، تحتوي الألعاب على متطلبات مختلفة لموارد وحدة معالجة الرسومات. تاريخيا ، يجب ضبط التردد لسيناريو أسوأ الحالات. ولكن عند معالجة المهام "الخفيفة" ، عملت وحدة معالجة الرسومات عبثًا. يراقب GPU Boost المعلمات المختلفة ويزيد أو يقلل الترددات حسب احتياجات التطبيق والوضع الحالي.

عمل أول تطبيق لـ GPU Boost تحت حد طاقة معين (170 واط في حالة GeForce GTX 680). ومع ذلك ، فقد وجد مهندسو الشركة أنه يمكنهم تجاوز هذا المستوى بأمان إذا كانت درجة حرارة وحدة معالجة الرسومات منخفضة بدرجة كافية. وبالتالي ، يمكن تحسين الأداء بشكل أكبر.

من الناحية العملية ، يختلف GPU Boost 2.0 فقط في أن NVIDIA تقوم الآن بتسريع التردد ليس على أساس حد الطاقة ، ولكن على درجة حرارة معينة ، وهي 80 درجة مئوية. هذا يعني أنه سيتم الآن استخدام قيم التردد والجهد العالي حتى درجة حرارة الشريحة حتى 80 درجة. لا تنس أن درجة الحرارة تعتمد بشكل أساسي على ملف تعريف المروحة والإعدادات: فكلما زادت سرعة المروحة ، انخفضت درجة الحرارة ، وبالتالي زادت قيم GPU Boost (ومستوى الضوضاء ، للأسف ، أيضًا). لا تزال التكنولوجيا تقيم الموقف مرة واحدة كل 100 مللي ثانية ، لذا فإن لدى NVIDIA المزيد من العمل للقيام به في الإصدارات المستقبلية.

تجعل الإعدادات المعتمدة على درجة الحرارة عملية الاختبار أكثر صعوبة مقارنة بالإصدار الأول من GPU Boost. أي شيء يرفع درجة حرارة GK110 أو يخفضها يغير ساعة الرقاقة. لذلك ، فإن تحقيق نتائج متسقة بين الدورات أمر صعب للغاية. في ظروف المختبر ، يمكن للمرء أن يأمل فقط في درجة حرارة محيطة مستقرة.

بالإضافة إلى ما سبق ، تجدر الإشارة إلى أنه يمكنك زيادة حد درجة الحرارة. على سبيل المثال ، إذا كنت تريد NVIDIA GeForce GTX 780خفض التردد والجهد عند مستوى 85 أو 90 درجة مئوية ، ويمكن ضبط ذلك في المعلمات.

هل تريد إبقاء GK110 بعيدًا عن حد درجة الحرارة الذي اخترته قدر الإمكان؟ منحنى المروحة NVIDIA GeForce GTX 780قابل للتعديل بالكامل ، مما يسمح لك بضبط دورة العمل وفقًا لقيم درجة الحرارة.

مشاكل محتملة في رفع تردد التشغيل

خلال تعارفنا مع بطاقة GeForce GTX Titanأظهر لنا ممثلو الشركة أداة داخلية قادرة على قراءة الحالة أجهزة استشعار مختلفة: لذلك فهو يبسط عملية تشخيص السلوك غير القياسي للبطاقة. إذا ارتفعت درجة حرارة جهاز GK110 بشكل كبير أثناء رفع تردد التشغيل ، حتى عند الاختناق ، فسيتم تسجيل هذه المعلومات في السجل.

الآن تقوم الشركة بتنفيذ هذه الوظيفة من خلال تطبيق Precision X ، الذي يطلق "أسباب" خوارزمية تحذير إذا كانت هناك إجراءات تمنع استمرارها الفعال أثناء التسارع. هذه ميزة رائعة لأنك لم تعد مضطرًا للتخمين بشأن الاختناقات المحتملة. يوجد أيضًا مؤشر حد أقصى OV يتيح لك معرفة ما إذا كنت قد وصلت إلى ذروة الجهد المطلق لوحدة معالجة الرسومات. في هذه الحالة ، هناك خطر حرق البطاقة. يمكنك اعتبار هذا بمثابة اقتراح لخفض معاملات رفع تردد التشغيل.

مراجعة بطاقة الفيديو NVIDIA GeForce GTX 780 | اختبار الحامل والمعايير


اختبار تكوين مقاعد البدلاء
وحدة المعالجة المركزية Intel Core i7-3770K (Ivy Bridge) 3.5 جيجاهرتز @ 4.0 جيجاهرتز (40 * 100 ميجاهرتز) ، LGA 1155 ، ذاكرة تخزين مؤقت مشتركة L3 سعة 8 ميجابايت ، تمكين خيوط المعالجة المتعددة ، تمكين توفير الطاقة
اللوحة الأم Gigabyte Z77X-UD5H (LGA 1155) ، مجموعة شرائح Z77 Express ، BIOS F15q
الرامات " الذاكرة العشوائية في الهواتف والحواسيب " G.Skill 16 جيجابايت (4 × 4 جيجابايت) DDR3-1600 ، F3-12800CL9Q2-32GBZL @ 9-9-9-24 عند 1.5 فولت
جهاز التخزين حاسمة m4 SSD 256GB SATA 6Gb / s
بطاقات الفيديو Nvidia GeForce GTX 780 3 جيجا بايت

AMD Radeon HD 7990 6 جيجابايت

AMD Radeon HD 7970 GHz Edition 3 جيجابايت

Nvidia GeForce GTX 580 1.5 جيجا بايت

Nvidia GeForce GTX 680 2 جيجا بايت

بطاقة الرسومات Nvidia GeForce GTX Titan 6 جيجابايت

Nvidia GeForce GTX 690 4 جيجا بايت

مزود الطاقة كولر ماستر UCP-1000W
برامج النظام وبرامج التشغيل
نظام التشغيل نظام التشغيل Windows 8 Professional إصدار 64 بت
برنامج DirectX برنامج DirectX 11
رسم بياني. السائقين AMD Catalyst 13.5 (بيتا 2)
إصدار Nvidia GeForce 320.00.0000
Nvidia GeForce Release 320.18 (لـ GeForce GTX 780)

الحصول على قيمة معدل الإطارات الصحيحة

سيلاحظ القراء الملاحظون أن الأرقام الواردة في الصفحات التالية أكثر تواضعا مما في المراجعة. AMD راديون HD 7990، وهناك سبب لذلك. في السابق ، قدمنا ​​معدلات إطارات اصطناعية وحقيقية ، ثم أظهرنا تقلبات زمنية بين الإطارات جنبًا إلى جنب مع الإطارات المنخفضة والقصيرة. الحقيقة هي أن هذه الطريقة لا تعكس الأحاسيس الحقيقية لبطاقة الفيديو ، ومن جانبنا سيكون من الظلم إدانة AMD ، بناءً على مؤشرات تركيبية للتأخير الزمني بين الإطارات.

لهذا السبب ، جنبًا إلى جنب مع تقلبات معدل الإطارات ، نقدم الآن المزيد من مقاييس معدل الإطارات الديناميكية العملية. النتائج ليست عالية ، لكنها في نفس الوقت بليغة للغاية في الألعاب حيث تواجه AMD صعوبات.

الاختبارات والإعدادات
ساحة المعركة 3 جودة الرسومات - فائقة ، v-sync off ، 2560x1440 ، DirectX 11 ، الذهاب للصيد ، 90 ثانية ، FCAT
بعيدة كل البعد 3 جودة الرسومات - Ultra ، DirectX 11 ، v-sync off ، 2560x1440 ، قم بتشغيل مسارك الخاص ، 50 ثانية ، FCAT
بوردرلاندز 2 جودة الرسومات - الأعلى ، منخفضة فيزكس ، ترشيح متباين الخواص 16 مرة ، 2560 × 1440 ، تشغيل طريقك الخاص ، FCAT
قاتل محترف: الغفران جودة الرسومات - فائقة ، إيقاف MSAA ، 2560 × 1440 ، معيار مرجعي مدمج ، FCAT
The Elder Scrolls V: Skyrim جودة الرسومات - Ultra ، FXAA Enabled ، 2560x1440 ، قم بتشغيل مسارك الخاص ، 25 ثانية ، FCAT
برنامج 3DMark معيار إضراب النار
بيوشوك لانهائي جودة الرسومات - Ultra ، DirectX 11 ، عمق مجال ناشر الهواء ، 2560x1440 ، معيار مرجعي مدمج ، FCAT
Crysis 3 جودة الرسومات - عالية جدًا ، MSAA: منخفضة (2x) ، نص عالي الدقة ، 2560 × 1440 ، تعمل على مسارك الخاص ، 60 ثانية ، FCAT
تومب رايدر جودة الرسومات - Ultimate ، مُمكّن من FXAA ، تصفية متباينة الخواص 16x ، TressFX Hair ، 2560x1440 ، قم بتشغيل مسارك الخاص ، 45 ثانية ، FCAT
Lux Mark 2.0.0 تحديث 64 بت ثنائي ، الإصدار 2.0 ، مشهد سالا
برنامج SiSoftware Sandra 2013 Professional Sandra Tech Support (مهندس) 2013.SP1 ، التشفير ، أداء التحليل المالي


المحتوى