नवीनतम लेख
घर / मोबाइल ओएस / एनवीडिया जीपीयू बूस्ट 2.0 तकनीक। वीडियो कार्ड। एंसल गेम स्क्रीनशॉट प्लेटफॉर्म

एनवीडिया जीपीयू बूस्ट 2.0 तकनीक। वीडियो कार्ड। एंसल गेम स्क्रीनशॉट प्लेटफॉर्म

जीपीयू बूस्ट 2.0

NVIDIA GeForce GTX 680 ग्राफिक्स कार्ड के साथ, हमारे पास एक महत्वपूर्ण नई सुविधा है: GPU बूस्ट। और नया NVIDIA GeForce GTX टाइटन इस सुविधा को GPU बूस्ट 2.0 में विस्तारित करके एक कदम आगे जाता है। GPU बूस्ट 1.0 का पहला संस्करण सबसे अधिक मांग वाले आधुनिक खेलों में प्राप्त अधिकतम बिजली खपत पर केंद्रित है। उसी समय, GPU तापमान ने एक विशेष भूमिका नहीं निभाई, सिवाय शायद अगर यह महत्वपूर्ण सीमा के करीब आया। अधिकतम घड़ी आवृत्ति सापेक्ष वोल्टेज के आधार पर निर्धारित की गई थी। नुकसान काफी स्पष्ट था: GPU बूस्ट 1.0 उन स्थितियों को नहीं रोक सका, जहां गैर-महत्वपूर्ण वोल्टेज पर भी, तापमान अत्यधिक बढ़ गया।

NVIDIA GeForce GTX टाइटन - GPU बूस्ट 2.0

GeForce GTX टाइटन ने पहले ही दो मापदंडों का मूल्यांकन किया है: वोल्टेज और तापमान। यानी इन दो मापदंडों के आधार पर आपेक्षिक वोल्टेज (Vref) पहले से ही निर्धारित किया जाता है। बेशक, अलग-अलग जीपीयू पर निर्भरता बनी रहेगी, क्योंकि चिप उत्पादन में भिन्नता है, इसलिए प्रत्येक वीडियो कार्ड किसी अन्य से अलग होगा। लेकिन एनवीआईडीआईए बताता है कि, तकनीकी रूप से, तापमान के अतिरिक्त 3-7 प्रतिशत अधिक बूस्ट ओवरक्लॉकिंग के लिए अनुमति दी गई है। GPU बूस्ट 2.0 तकनीक सैद्धांतिक रूप से पुराने ग्राफिक्स कार्ड में पोर्ट की जा सकती है, लेकिन ऐसा होने की संभावना नहीं है।

NVIDIA GeForce GTX टाइटन - GPU बूस्ट 2.0

आइए GPU बूस्ट 2.0 पर करीब से नज़र डालें। ईवीजीए प्रेसिजन टूल या एमएसआई आफ्टरबर्नर जैसी उपयोगिताएं पहले से ही जीपीयू बूस्ट 2.0 का समर्थन करती हैं। हमने संस्करण 4.0 में EVGA प्रेसिजन टूल का उपयोग किया है।

NVIDIA GeForce GTX टाइटन - GPU बूस्ट 2.0

GPU बूस्ट 2.0 तापमान के बारे में जागरूक है, और कम तापमान पर, तकनीक प्रदर्शन को और अधिक बढ़ा सकती है। लक्ष्य तापमान (Ttarget) डिफ़ॉल्ट रूप से 80 °C पर सेट होता है।

NVIDIA GeForce GTX टाइटन - GPU बूस्ट 2.0

GPU बूस्ट 2.0 तकनीक में पहली पीढ़ी की तकनीक से परिचित सभी विशेषताएं शामिल हैं, लेकिन साथ ही साथ उच्च वोल्टेज सेट करना संभव बनाता है, और इसलिए उच्च घड़ी आवृत्तियों को सेट करना संभव बनाता है। ओवरक्लॉकर के लिए, सेटिंग्स को बदलना संभव है। आप GPU ओवरवॉल्टेज को सक्षम कर सकते हैं, लेकिन ग्राफिक्स कार्ड के जीवन में संभावित कमी से अवगत रहें।

NVIDIA GeForce GTX टाइटन - GPU बूस्ट 2.0

ओवरक्लॉकर Vref और Vmax (ओवरवोल्टेजिंग) बढ़ा सकते हैं। GK104 पर कई उपयोगकर्ता इसे चाहते थे, लेकिन NVIDIA ने ऐसा अवसर उपयोगकर्ताओं या निर्माताओं को नहीं सौंपा। और जिस EVGA GTX 680 क्लासीफाइड वीडियो कार्ड का हमने परीक्षण किया (परीक्षण और समीक्षा) वह एक बेहतरीन उदाहरण है। इस वीडियो कार्ड के साथ, एक विशेष EVGA Evbot मॉड्यूल ने उपयोगकर्ताओं को वोल्टेज पर नियंत्रण प्रदान किया। लेकिन NVIDIA ने तत्काल मांग की कि EVGA उनके ग्राफिक्स कार्ड से अतिरिक्त हार्डवेयर हटा दें। GPU Boost 2.0 और OverVoltaging के मामले में, NVIDIA ने स्वयं इस दिशा में एक कदम उठाया। इसलिए ग्राफिक्स कार्ड निर्माता GeForce GTX टाइटन के कई मॉडल जारी कर सकते हैं, जैसे मानक संस्करण और फ़ैक्टरी ओवरक्लॉक संस्करण। OverVoltaging का सक्रियण VBIOS स्विच के माध्यम से किया जाता है (अर्थात, स्पष्ट रूप से उपयोगकर्ता के लिए ताकि वह संभावित परिणामों से अवगत हो)।

पैरामीटरअर्थ
चिप कोड नामGP104
उत्पादन प्रौद्योगिकी16एनएम फिनफेट
ट्रांजिस्टर की संख्या7.2 अरब
मूल भाग314 मिमी²
आर्किटेक्चर
डायरेक्टएक्स हार्डवेयर सपोर्ट
मेमोरी बस
1607 (1733) मेगाहर्ट्ज
कंप्यूटिंग ब्लॉक2560 IEEE 754-2008 फ्लोटिंग पॉइंट स्केलर ALU सहित 20 स्ट्रीमिंग मल्टीप्रोसेसर;
बनावट ब्लॉकबनावट में FP16 और FP32 घटकों के समर्थन के साथ 160 टेक्सचर एड्रेसिंग और फ़िल्टरिंग इकाइयाँ और सभी बनावट स्वरूपों के लिए ट्रिलिनियर और अनिसोट्रोपिक फ़िल्टरिंग के लिए समर्थन
मॉनिटर समर्थन
GeForce GTX 1080 संदर्भ ग्राफिक्स निर्दिष्टीकरण
पैरामीटरअर्थ
कोर आवृत्ति1607 (1733) मेगाहर्ट्ज
2560
बनावट ब्लॉकों की संख्या160
सम्मिश्रण ब्लॉकों की संख्या64
प्रभावी स्मृति आवृत्ति10000 (4×2500) मेगाहर्ट्ज
मेमोरी प्रकारGDDR5X
मेमोरी बस256-बिट
स्मृति8 जीबी
320 जीबी/एस
लगभग 9 टेराफ्लॉप्स
103 गीगापिक्सेल/सेक
257 गीगाटेक्सेल/सेक
थका देनापीसीआई एक्सप्रेस 3.0
कनेक्टर्स
शक्ति का उपयोग180 डब्ल्यू . तक
अतिरिक्त भोजनएक 8-पिन कनेक्टर
2
अनुशंसित मूल्य$599-699 (यूएसए), 54990 आरयूबी (रूस)

GeForce GTX 1080 वीडियो कार्ड के नए मॉडल को नई GeForce श्रृंखला के पहले समाधान के लिए एक तार्किक नाम मिला - यह अपने प्रत्यक्ष पूर्ववर्ती से केवल एक परिवर्तित पीढ़ी के आंकड़े में भिन्न है। नवीनता न केवल कंपनी की वर्तमान लाइन में शीर्ष-अंत समाधानों की जगह लेती है, बल्कि कुछ समय के लिए नई श्रृंखला का प्रमुख भी बन गई, जब तक कि टाइटन एक्स को और भी अधिक शक्तिशाली जीपीयू पर जारी नहीं किया गया। इसके नीचे पदानुक्रम में पहले से घोषित मॉडल GeForce GTX 1070 भी है, जो GP104 चिप के स्ट्रिप्ड-डाउन संस्करण पर आधारित है, जिस पर हम नीचे विचार करेंगे।

एनवीडिया के नए ग्राफिक्स कार्ड के लिए सुझाई गई कीमतें क्रमशः नियमित और संस्थापक संस्करण (नीचे देखें) के लिए $ 599 और $ 699 हैं, जो कि जीटीएक्स 1080 को देखते हुए न केवल जीटीएक्स 980 टीआई, बल्कि टाइटन एक्स से भी आगे है। आज, नया उत्पाद बिना किसी प्रश्न के सिंगल-चिप वीडियो कार्ड बाजार पर प्रदर्शन के मामले में सबसे अच्छा समाधान है, और साथ ही यह पिछली पीढ़ी के सबसे शक्तिशाली वीडियो कार्ड से सस्ता है। अब तक, GeForce GTX 1080 का अनिवार्य रूप से AMD से कोई प्रतियोगी नहीं है, इसलिए Nvidia उनके लिए उपयुक्त कीमत निर्धारित करने में सक्षम था।

विचाराधीन वीडियो कार्ड GP104 चिप पर आधारित है, जिसमें 256-बिट मेमोरी बस है, लेकिन नए प्रकार की GDDR5X मेमोरी 10 GHz की बहुत उच्च प्रभावी आवृत्ति पर संचालित होती है, जो 320 GB / s की उच्च शिखर बैंडविड्थ देती है। - जो लगभग 384-बिट बस के साथ GTX 980 Ti के बराबर है। ऐसी बस के साथ वीडियो कार्ड पर स्थापित मेमोरी की मात्रा 4 या 8 जीबी हो सकती है, लेकिन आधुनिक परिस्थितियों में इस तरह के एक शक्तिशाली समाधान के लिए एक छोटी राशि निर्धारित करना बेवकूफी होगी, इसलिए जीटीएक्स 1080 को 8 जीबी मेमोरी मिली, और यह राशि आने वाले कई वर्षों तक किसी भी गुणवत्ता सेटिंग के साथ किसी भी 3D- एप्लिकेशन को चलाने के लिए पर्याप्त है।

GeForce GTX 1080 PCB कंपनी के पिछले PCB से काफी अलग है। नई वस्तुओं के लिए सामान्य बिजली खपत का मूल्य 180 वाट है - जीटीएक्स 980 से थोड़ा अधिक, लेकिन कम शक्तिशाली टाइटन एक्स और जीटीएक्स 980 टीआई की तुलना में काफी कम है। संदर्भ बोर्ड में छवि आउटपुट उपकरणों को जोड़ने के लिए कनेक्टर्स का सामान्य सेट होता है: एक डुअल-लिंक डीवीआई, एक एचडीएमआई और तीन डिस्प्लेपोर्ट।

संस्थापक संस्करण संदर्भ डिजाइन

मई की शुरुआत में GeForce GTX 1080 की घोषणा के साथ ही, फाउंडर्स एडिशन नामक वीडियो कार्ड के एक विशेष संस्करण की घोषणा की गई, जिसकी कीमत कंपनी के भागीदारों से नियमित वीडियो कार्ड की तुलना में अधिक है। वास्तव में, यह संस्करण कार्ड और शीतलन प्रणाली का संदर्भ डिजाइन है, और यह स्वयं एनवीडिया द्वारा निर्मित है। वीडियो कार्ड के लिए ऐसे विकल्पों के प्रति आपका अलग-अलग दृष्टिकोण हो सकता है, लेकिन कंपनी के इंजीनियरों द्वारा विकसित और गुणवत्ता वाले घटकों का उपयोग करके निर्मित संदर्भ डिजाइन में उनके प्रशंसक हैं।

लेकिन क्या वे एनवीडिया से वीडियो कार्ड के लिए कई हजार रूबल अधिक का भुगतान करेंगे, यह एक ऐसा प्रश्न है जिसका उत्तर केवल अभ्यास ही दे सकता है। किसी भी स्थिति में, सबसे पहले यह एनवीडिया के संदर्भ वीडियो कार्ड होंगे जो बढ़ी हुई कीमत पर बिक्री पर दिखाई देंगे, और इसमें से चुनने के लिए बहुत कुछ नहीं है - यह हर घोषणा के साथ होता है, लेकिन संदर्भ GeForce GTX 1080 इसमें अलग है अगली पीढ़ी के समाधान जारी होने तक, इसे जीवन भर इस रूप में बेचने की योजना है।

एनवीडिया का मानना ​​है कि भागीदारों के सर्वोत्तम कार्यों पर भी इस संस्करण की अपनी खूबियां हैं। उदाहरण के लिए, कूलर का दो-स्लॉट डिज़ाइन इस शक्तिशाली वीडियो कार्ड के आधार पर अपेक्षाकृत छोटे फॉर्म फैक्टर और मल्टी-चिप वीडियो सिस्टम के गेमिंग पीसी दोनों को इकट्ठा करना आसान बनाता है (यहां तक ​​​​कि तीन- और चार-चिप मोड के बावजूद अनुशंसित नहीं है) कंपनी द्वारा)। GeForce GTX 1080 फाउंडर्स एडिशन में बाष्पीकरणीय कक्ष और एक पंखे का उपयोग करके एक कुशल कूलर के रूप में कुछ फायदे हैं जो गर्म हवा को मामले से बाहर धकेलते हैं - यह एनवीडिया का पहला ऐसा समाधान है जो 250 वाट से कम बिजली की खपत करता है।

कंपनी के पिछले संदर्भ उत्पाद डिजाइनों की तुलना में, पावर सर्किट को चार-चरण से पांच-चरण में अपग्रेड किया गया है। एनवीडिया उन बेहतर घटकों के बारे में भी बात करता है जिन पर नया उत्पाद आधारित है, वोल्टेज स्थिरता और ओवरक्लॉकिंग क्षमता में सुधार के लिए विद्युत शोर को भी कम किया गया है। सभी सुधारों के परिणामस्वरूप, GeForce GTX 980 की तुलना में संदर्भ बोर्ड की शक्ति दक्षता में 6% की वृद्धि हुई है।

और GeForce GTX 1080 के "साधारण" मॉडल से अलग होने के लिए और बाहरी रूप से, संस्थापक संस्करण के लिए एक असामान्य "कटा हुआ" केस डिज़ाइन विकसित किया गया था। हालांकि, संभवतः वाष्पीकरण कक्ष और रेडिएटर (फोटो देखें) के आकार की जटिलता का कारण बन गया, जो इस तरह के एक विशेष संस्करण के लिए $ 100 अतिरिक्त भुगतान करने के कारणों में से एक हो सकता है। हम दोहराते हैं कि बिक्री की शुरुआत में, खरीदारों के पास ज्यादा विकल्प नहीं होंगे, लेकिन भविष्य में कंपनी के भागीदारों में से एक से अपने स्वयं के डिजाइन के साथ एक समाधान चुनना संभव होगा, और एनवीडिया द्वारा ही प्रदर्शन किया जाएगा।

पास्कल ग्राफिक्स आर्किटेक्चर की नई पीढ़ी

GeForce GTX 1080 वीडियो कार्ड GP104 चिप पर आधारित कंपनी का पहला समाधान है, जो Nvidia के पास्कल ग्राफिक्स आर्किटेक्चर की नई पीढ़ी से संबंधित है। हालांकि नया आर्किटेक्चर मैक्सवेल में तैयार किए गए समाधानों पर आधारित है, लेकिन इसमें महत्वपूर्ण कार्यात्मक अंतर भी हैं, जिनके बारे में हम बाद में लिखेंगे। वैश्विक दृष्टिकोण से मुख्य परिवर्तन नया था तकनीकी प्रक्रियाजिस पर नया जीपीयू बनाया गया है।

ताइवान की कंपनी TSMC के कारखानों में GP104 GPU के उत्पादन में 16 एनएम FinFET प्रक्रिया प्रौद्योगिकी के उपयोग ने अपेक्षाकृत कम क्षेत्र और लागत को बनाए रखते हुए चिप की जटिलता को काफी बढ़ाना संभव बना दिया। ट्रांजिस्टर की संख्या और GP104 और GM204 चिप्स के क्षेत्र की तुलना करें - वे क्षेत्र में करीब हैं (नवीनता की चिप शारीरिक रूप से भी छोटी है), लेकिन पास्कल आर्किटेक्चर चिप में ट्रांजिस्टर की काफी बड़ी संख्या है, और, तदनुसार , निष्पादन इकाइयाँ, जिनमें नई कार्यक्षमता प्रदान करने वाली इकाइयाँ शामिल हैं।

वास्तुकला की दृष्टि से, पहला गेमिंग पास्कल मैक्सवेल वास्तुकला के समान समाधानों के समान है, हालांकि कुछ अंतर हैं। मैक्सवेल की तरह, पास्कल आर्किटेक्चर प्रोसेसर में ग्राफिक्स प्रोसेसिंग क्लस्टर (जीपीसी), स्ट्रीमिंग मल्टीप्रोसेसर (एसएम) और मेमोरी कंट्रोलर के अलग-अलग कॉन्फ़िगरेशन होंगे। एसएम मल्टीप्रोसेसर एक अत्यधिक समानांतर मल्टीप्रोसेसर है जो मल्टीप्रोसेसर में CUDA कोर और अन्य निष्पादन इकाइयों पर वार्प्स (वार्प्स, 32 इंस्ट्रक्शन स्ट्रीम के समूह) को शेड्यूल और चलाता है। पिछले एनवीडिया समाधानों की हमारी समीक्षाओं में आप इन सभी ब्लॉकों के डिजाइन के बारे में विस्तृत जानकारी पा सकते हैं।

प्रत्येक एसएम मल्टीप्रोसेसर को पॉलीमॉर्फ इंजन के साथ जोड़ा जाता है, जो बनावट नमूनाकरण, टेसेलेशन, परिवर्तन, वर्टेक्स विशेषता सेटिंग और परिप्रेक्ष्य सुधार को संभालता है। कंपनी के पिछले समाधानों के विपरीत, GP104 चिप में पॉलीमॉर्फ इंजन में एक नया एक साथ बहु-प्रोजेक्शन ब्लॉक भी शामिल है, जिसके बारे में हम नीचे बात करेंगे। एक पॉलीमॉर्फ इंजन के साथ एसएम मल्टीप्रोसेसर के संयोजन को पारंपरिक रूप से एनवीडिया के लिए टीपीसी - टेक्सचर प्रोसेसर क्लस्टर कहा जाता है।

कुल मिलाकर, GeForce GTX 1080 में GP104 चिप में चार GPC क्लस्टर और 20 SM मल्टीप्रोसेसर, साथ ही 64 ROP के साथ आठ मेमोरी कंट्रोलर शामिल हैं। प्रत्येक जीपीसी क्लस्टर में एक समर्पित रास्टरराइजेशन इंजन है और इसमें पांच एसएम शामिल हैं। बदले में, प्रत्येक मल्टीप्रोसेसर में 128 CUDA कोर, 256 KB रजिस्टर फ़ाइल, 96 KB साझा मेमोरी, 48 KB L1 कैश और आठ TMU बनावट इकाइयाँ होती हैं। यानी कुल मिलाकर, GP104 में 2560 CUDA कोर और 160 TMU इकाइयाँ हैं।

साथ ही, जिस ग्राफिक्स प्रोसेसर पर GeForce GTX 1080 आधारित है, उसमें आठ 32-बिट (पहले इस्तेमाल किए गए 64-बिट के विपरीत) मेमोरी कंट्रोलर होते हैं, जो हमें अंतिम 256-बिट मेमोरी बस देता है। आठ ROP और 256 KB L2 कैश प्रत्येक मेमोरी कंट्रोलर से जुड़े होते हैं। यानी कुल मिलाकर GP104 चिप में 64 ROP और 2048 KB का L2 कैश होता है।

वास्तु अनुकूलन और एक नई प्रक्रिया प्रौद्योगिकी के लिए धन्यवाद, पहला गेमिंग पास्कल अब तक का सबसे अधिक ऊर्जा कुशल GPU बन गया है। इसके अलावा, मैक्सवेल की तुलना में सबसे उन्नत तकनीकी प्रक्रियाओं में से एक 16 एनएम फिनफेट और पास्कल में किए गए आर्किटेक्चर ऑप्टिमाइज़ेशन दोनों में से एक का योगदान है। नई प्रक्रिया प्रौद्योगिकी की ओर बढ़ने पर एनवीडिया घड़ी की गति को उनकी अपेक्षा से भी अधिक बढ़ाने में सक्षम था। GP104 16nm प्रक्रिया का उपयोग करके बनाए गए काल्पनिक GM204 की तुलना में उच्च आवृत्ति पर चलता है। ऐसा करने के लिए, एनवीडिया इंजीनियरों को पिछले समाधानों की सभी बाधाओं को सावधानीपूर्वक जांचना और अनुकूलित करना था जो एक निश्चित सीमा से ऊपर ओवरक्लॉकिंग को रोकते हैं। नतीजतन, नया GeForce GTX 1080, GeForce GTX 980 की तुलना में 40% से अधिक तेजी से क्लॉक किया गया है। लेकिन GPU घड़ी में बदलाव के लिए यह सब नहीं है।

GPU बूस्ट 3.0 तकनीक

जैसा कि हम पिछले एनवीडिया ग्राफिक्स कार्ड से अच्छी तरह जानते हैं, वे अपने जीपीयू में जीपीयू बूस्ट हार्डवेयर तकनीक का उपयोग करते हैं, जिसे जीपीयू की ऑपरेटिंग घड़ी की गति को उन मोड में बढ़ाने के लिए डिज़ाइन किया गया है जहां यह अभी तक बिजली की खपत और थर्मल सीमा तक नहीं पहुंचा है। इन वर्षों में, इस एल्गोरिथ्म में कई बदलाव हुए हैं, और इस तकनीक की तीसरी पीढ़ी पहले से ही पास्कल आर्किटेक्चर वीडियो चिप - जीपीयू बूस्ट 3.0 में उपयोग की जाती है, जिसका मुख्य नवाचार वोल्टेज के आधार पर टर्बो आवृत्तियों की एक बेहतर सेटिंग है।

अगर आपको याद है कि यह कैसे काम करता है पिछला संस्करणप्रौद्योगिकी, फिर आधार आवृत्ति के बीच का अंतर (गारंटी .) न्यूनतम मूल्यआवृत्ति जिसके नीचे GPU नहीं गिरता है, कम से कम खेलों में) और टर्बो आवृत्ति तय की गई थी। यानी, टर्बो फ्रीक्वेंसी हमेशा पर थी एक निश्चित मात्राआधार से ऊपर मेगाहर्ट्ज़। GPU बूस्ट 3.0 ने प्रत्येक वोल्टेज के लिए अलग से टर्बो फ़्रीक्वेंसी ऑफ़सेट सेट करने की क्षमता पेश की। इसे समझने का सबसे आसान तरीका एक उदाहरण है:

बाईं ओर दूसरे संस्करण का GPU बूस्ट है, दाईं ओर - तीसरा, जो पास्कल में दिखाई दिया। आधार और टर्बो आवृत्तियों के बीच निश्चित अंतर ने GPU की पूर्ण क्षमताओं को प्रकट करने की अनुमति नहीं दी, कुछ मामलों में, पिछली पीढ़ियों के GPU तेजी से काम कर सकते थे वोल्टेज सेट करें, लेकिन टर्बो आवृत्ति की एक निश्चित अधिकता ने ऐसा करने की अनुमति नहीं दी। GPU बूस्ट 3.0 में, यह सुविधा दिखाई दी, और टर्बो फ़्रीक्वेंसी को प्रत्येक व्यक्तिगत वोल्टेज मान के लिए सेट किया जा सकता है, GPU से सभी रस को पूरी तरह से निचोड़ कर।

ओवरक्लॉकिंग को प्रबंधित करने और टर्बो फ़्रीक्वेंसी कर्व सेट करने के लिए उपयोगी उपयोगिताओं की आवश्यकता होती है। एनवीडिया स्वयं ऐसा नहीं करता है, लेकिन अपने भागीदारों को ओवरक्लॉकिंग (उचित सीमा के भीतर, निश्चित रूप से) की सुविधा के लिए ऐसी उपयोगिताओं को बनाने में मदद करता है। उदाहरण के लिए, नया कार्यक्षमताईवीजीए प्रेसिजन एक्सओसी में जीपीयू बूस्ट 3.0 पहले ही सामने आ चुका है, जिसमें एक विशेष ओवरक्लॉकिंग स्कैनर शामिल है जो अंतर्निहित प्रदर्शन और स्थिरता परीक्षण चलाकर विभिन्न वोल्टेज के लिए बेस फ्रीक्वेंसी और टर्बो फ्रीक्वेंसी के बीच गैर-रैखिक अंतर को स्वचालित रूप से ढूंढता है और सेट करता है। नतीजतन, उपयोगकर्ता को एक टर्बो फ़्रीक्वेंसी वक्र मिलता है जो किसी विशेष चिप की क्षमताओं से पूरी तरह मेल खाता है। इसके अलावा, किसी भी तरह से संशोधित किया जा सकता है हस्तचालित ढंग से.

जैसा कि आप उपयोगिता के स्क्रीनशॉट में देख सकते हैं, GPU और सिस्टम के बारे में जानकारी के अलावा, ओवरक्लॉकिंग के लिए सेटिंग्स भी हैं: पावर टारगेट (ओवरक्लॉकिंग के दौरान सामान्य बिजली की खपत को मानक के प्रतिशत के रूप में परिभाषित करता है), GPU Temp लक्ष्य (अधिकतम अनुमत कोर तापमान), GPU क्लॉक ऑफ़सेट (सभी वोल्टेज मानों के लिए आधार आवृत्ति से अधिक), मेमोरी ऑफ़सेट (डिफ़ॉल्ट मान पर वीडियो मेमोरी की आवृत्ति से अधिक), ओवरवॉल्टेज (वोल्टेज बढ़ाने का अतिरिक्त अवसर)।

प्रेसिजन एक्सओसी उपयोगिता में तीन ओवरक्लॉकिंग मोड शामिल हैं: बेसिक, लीनियर और मैनुअल। मुख्य मोड में, आप आधार एक पर एक ओवरक्लॉक मान (फिक्स्ड टर्बो फ़्रीक्वेंसी) सेट कर सकते हैं, जैसा कि पिछले GPU के मामले में था। रैखिक मोड आपको GPU के लिए आवृत्ति रैंप को न्यूनतम से अधिकतम वोल्टेज मानों तक सेट करने की अनुमति देता है। ठीक है, मैनुअल मोड में, आप ग्राफ़ पर प्रत्येक वोल्टेज बिंदु के लिए अद्वितीय GPU आवृत्ति मान सेट कर सकते हैं।

उपयोगिता में स्वचालित ओवरक्लॉकिंग के लिए एक विशेष स्कैनर भी शामिल है। आप या तो अपना आवृत्ति स्तर सेट कर सकते हैं या प्रेसिजन एक्सओसी उपयोगिता सभी वोल्टेज पर जीपीयू स्कैन कर सकते हैं और वोल्टेज और आवृत्ति वक्र पर प्रत्येक बिंदु के लिए सबसे स्थिर आवृत्तियों को पूरी तरह से स्वचालित रूप से ढूंढ सकते हैं। स्कैनिंग प्रक्रिया के दौरान, प्रेसिजन एक्सओसी जीपीयू की आवृत्ति में वृद्धि करता है और स्थिरता या कलाकृतियों के लिए इसके संचालन की जांच करता है, एक आदर्श आवृत्ति और वोल्टेज वक्र का निर्माण करता है जो प्रत्येक विशेष चिप के लिए अद्वितीय होगा।

प्रत्येक वोल्टेज मान, परीक्षण की जाने वाली न्यूनतम और अधिकतम आवृत्ति, और उसके चरण का परीक्षण करने के लिए समय अंतराल निर्धारित करके इस स्कैनर को आपकी अपनी आवश्यकताओं के अनुसार अनुकूलित किया जा सकता है। यह स्पष्ट है कि स्थिर परिणाम प्राप्त करने के लिए, एक छोटा कदम और परीक्षण की एक अच्छी अवधि निर्धारित करना बेहतर होगा। परीक्षण के दौरान, वीडियो ड्राइवर और सिस्टम के अस्थिर संचालन को देखा जा सकता है, लेकिन अगर स्कैनर फ्रीज नहीं होता है, तो यह ऑपरेशन को बहाल कर देगा और इष्टतम आवृत्तियों को खोजना जारी रखेगा।

नए प्रकार की वीडियो मेमोरी GDDR5X और बेहतर संपीड़न

तो, GPU की शक्ति में काफी वृद्धि हुई है, और मेमोरी बस केवल 256-बिट रह गई है - क्या मेमोरी बैंडविड्थ समग्र प्रदर्शन को सीमित कर देगी और इसके बारे में क्या किया जा सकता है? ऐसा लगता है कि दूसरी पीढ़ी का होनहार एचबीएम अभी भी निर्माण के लिए बहुत महंगा है, इसलिए अन्य विकल्पों की तलाश करनी पड़ी। 2009 में GDDR5 मेमोरी की शुरुआत के बाद से, Nvidia इंजीनियर नए प्रकार की मेमोरी के उपयोग की संभावनाएं तलाश रहे हैं। नतीजतन, विकास एक नए मेमोरी मानक GDDR5X को पेश करने के लिए आया है - जो अब तक का सबसे जटिल और उन्नत मानक है, जो 10 Gbps की अंतरण दर देता है।

एनवीडिया एक दिलचस्प उदाहरण देता है कि यह कितना तेज़ है। प्रेषित बिट्स के बीच केवल 100 पिकोसेकंड व्यतीत होते हैं - इस समय के दौरान, प्रकाश की किरण केवल एक इंच (लगभग 2.5 सेमी) की दूरी तय करेगी। और GDDR5X मेमोरी का उपयोग करते समय, डेटा प्राप्त करने वाले सर्किट को अगले एक को भेजे जाने से पहले इस समय के आधे से भी कम समय में ट्रांसमिटेड बिट का मान चुनना होता है - यह सिर्फ इतना है कि आप समझते हैं कि आधुनिक तकनीक क्या आई है।

इस गति को प्राप्त करने के लिए एक नए I/O सिस्टम आर्किटेक्चर के विकास की आवश्यकता थी जिसके लिए मेमोरी चिप निर्माताओं के साथ कई वर्षों के संयुक्त विकास की आवश्यकता थी। बढ़ी हुई डेटा ट्रांसफर दर के अलावा, ऊर्जा दक्षता में भी वृद्धि हुई है - GDDR5X मेमोरी चिप्स 1.35 V के कम वोल्टेज का उपयोग करते हैं और नई तकनीकों का उपयोग करके निर्मित होते हैं, जो 43% उच्च आवृत्ति पर समान बिजली की खपत देता है।

कंपनी के इंजीनियरों को जीपीयू कोर और मेमोरी चिप्स के बीच डेटा ट्रांसमिशन लाइनों को फिर से काम करना पड़ा, सिग्नल हानि को रोकने और मेमोरी से जीपीयू और बैक तक सिग्नल की गिरावट को रोकने के लिए अधिक ध्यान देना। तो, ऊपर के चित्रण में, कैप्चर किए गए सिग्नल को एक बड़े सममित "आंख" के रूप में दिखाया गया है, जो पूरे सर्किट के अच्छे अनुकूलन और सिग्नल से डेटा कैप्चर करने की सापेक्ष आसानी को इंगित करता है। इसके अलावा, ऊपर वर्णित परिवर्तनों ने न केवल 10 गीगाहर्ट्ज़ पर GDDR5X का उपयोग करने की संभावना को जन्म दिया है, बल्कि अधिक परिचित GDDR5 मेमोरी का उपयोग करके भविष्य के उत्पादों पर एक उच्च मेमोरी बैंडविड्थ प्राप्त करने में भी मदद करनी चाहिए।

खैर, नई मेमोरी के उपयोग से हमें मेमोरी बैंडविड्थ में 40% से अधिक की वृद्धि हुई है। लेकिन क्या यह काफी नहीं है? मेमोरी बैंडविड्थ दक्षता को और बढ़ाने के लिए, एनवीडिया ने पिछले आर्किटेक्चर में पेश किए गए उन्नत डेटा संपीड़न में सुधार करना जारी रखा। GeForce GTX 1080 में मेमोरी सबसिस्टम बैंडविड्थ आवश्यकताओं को कम करने के लिए डिज़ाइन की गई कई नई दोषरहित डेटा संपीड़न तकनीकों का उपयोग करता है - पहले से ही ऑन-चिप संपीड़न की चौथी पीढ़ी।

स्मृति में डेटा संपीड़न के लिए एल्गोरिदम एक साथ कई सकारात्मक पहलू लाते हैं। संपीड़न मेमोरी में लिखे गए डेटा की मात्रा को कम करता है, वही वीडियो मेमोरी से दूसरे स्तर के कैश में स्थानांतरित डेटा पर लागू होता है, जो L2 कैश का उपयोग करने की दक्षता में सुधार करता है, क्योंकि एक संपीड़ित टाइल (कई फ्रेमबफर पिक्सल का एक ब्लॉक) में एक छोटा होता है एक असम्पीडित की तुलना में आकार। यह टीएमयू बनावट मॉड्यूल और फ्रेमबफर जैसे विभिन्न बिंदुओं के बीच भेजे गए डेटा की मात्रा को भी कम करता है।

GPU में डेटा संपीड़न पाइपलाइन कई एल्गोरिदम का उपयोग करती है, जो डेटा की "संपीड़नशीलता" के आधार पर निर्धारित की जाती हैं - उनके लिए सबसे अच्छा उपलब्ध एल्गोरिदम चुना जाता है। सबसे महत्वपूर्ण में से एक डेल्टा रंग संपीड़न एल्गोरिथ्म है। यह संपीड़न विधि डेटा को डेटा के बजाय लगातार मानों के बीच अंतर के रूप में एन्कोड करती है। GPU एक ब्लॉक (टाइल) में पिक्सेल के बीच रंग मूल्यों में अंतर की गणना करता है और ब्लॉक को पूरे ब्लॉक के लिए कुछ औसत रंग के रूप में संग्रहीत करता है और प्रत्येक पिक्सेल के मूल्यों में अंतर पर डेटा। ग्राफिक डेटा के लिए, यह विधि आमतौर पर अच्छी तरह से अनुकूल होती है, क्योंकि सभी पिक्सेल के लिए छोटी टाइलों के भीतर का रंग अक्सर बहुत अधिक भिन्न नहीं होता है।

GeForce GTX 1080 में GP104 GPU पिछले मैक्सवेल चिप्स की तुलना में अधिक संपीड़न एल्गोरिदम का समर्थन करता है। इस प्रकार, 2:1 संपीड़न एल्गोरिदम अधिक कुशल हो गया है, और इसके अलावा, दो नए एल्गोरिदम दिखाई दिए हैं: एक 4:1 संपीड़न मोड, उन मामलों के लिए उपयुक्त जहां ब्लॉक के पिक्सेल के रंग मान में अंतर बहुत अधिक है छोटा, और एक 8:1 मोड, जो ब्लॉकों के बीच 2x डेल्टा संपीड़न के साथ 2x2 पिक्सेल ब्लॉकों के निरंतर 4:1 संपीड़न को जोड़ती है। जब संपीड़न बिल्कुल संभव नहीं है, तो इसका उपयोग नहीं किया जाता है।

हालांकि, वास्तव में, उत्तरार्द्ध बहुत कम ही होता है। यह गेम प्रोजेक्ट CARS के उदाहरण स्क्रीनशॉट से देखा जा सकता है, जिसे एनवीडिया ने पास्कल में बढ़े हुए संपीड़न अनुपात को चित्रित करने के लिए उद्धृत किया था। दृष्टांतों में, वे फ्रेम बफर टाइलें जिन्हें GPU संपीड़ित कर सकता था, उन्हें मैजेंटा में छायांकित किया गया था, और जिन्हें बिना नुकसान के संपीड़ित नहीं किया जा सकता था, वे मूल रंग (शीर्ष - मैक्सवेल, नीचे - पास्कल) के साथ बने रहे।

जैसा कि आप देख सकते हैं, GP104 में नया संपीड़न एल्गोरिदम वास्तव में मैक्सवेल की तुलना में बहुत बेहतर काम करता है। हालांकि पुरानी वास्तुकला भी दृश्य में अधिकांश टाइलों को संपीड़ित करने में सक्षम थी, किनारों के आसपास बहुत सारी घास और पेड़, साथ ही साथ कार के पुर्जे, विरासत संपीड़न एल्गोरिदम के अधीन नहीं हैं। लेकिन पास्कल में नई तकनीकों को शामिल करने के साथ, बहुत कम संख्या में छवि क्षेत्र असम्पीडित रहे - बेहतर दक्षता स्पष्ट है।

डेटा संपीड़न में सुधार के परिणामस्वरूप, GeForce GTX 1080 प्रति फ्रेम भेजे गए डेटा की मात्रा को काफी कम करने में सक्षम है। संख्या में, बेहतर संपीड़न प्रभावी मेमोरी बैंडविड्थ का अतिरिक्त 20% बचाता है। GDDR5X मेमोरी का उपयोग करने से GTX 980 के सापेक्ष GeForce GTX 1080 की मेमोरी बैंडविड्थ में 40% से अधिक की वृद्धि के अलावा, यह सब मिलकर पिछली पीढ़ी के मॉडल की तुलना में प्रभावी मेमोरी बैंडविड्थ में लगभग 70% की वृद्धि देता है।

Async कंप्यूट के लिए समर्थन

अधिकांश आधुनिक गेम ग्राफिक्स के अलावा जटिल गणनाओं का उपयोग करते हैं। उदाहरण के लिए, भौतिक निकायों के व्यवहार की गणना करते समय गणना ग्राफिकल गणना से पहले या बाद में नहीं की जा सकती है, लेकिन साथ ही साथ, क्योंकि वे एक-दूसरे से संबंधित नहीं हैं और एक ही फ्रेम के भीतर एक-दूसरे पर निर्भर नहीं हैं। एक अन्य उदाहरण पहले से रेंडर किए गए फ़्रेमों की पोस्ट-प्रोसेसिंग और ऑडियो डेटा की प्रोसेसिंग है, जिसे रेंडरिंग के समानांतर भी किया जा सकता है।

कार्यक्षमता के उपयोग का एक और स्पष्ट उदाहरण एसिंक्रोनस टाइम ताना तकनीक है जिसका उपयोग वीआर सिस्टम में आउटपुट फ्रेम को बदलने के लिए किया जाता है, जो आउटपुट से ठीक पहले खिलाड़ी के सिर की गति के अनुसार होता है, जिससे अगले एक के प्रतिपादन में बाधा उत्पन्न होती है। GPU क्षमताओं की ऐसी अतुल्यकालिक लोडिंग इसकी निष्पादन इकाइयों के उपयोग की दक्षता बढ़ाने की अनुमति देती है।

ये कार्यभार दो नए GPU उपयोग परिदृश्य बनाते हैं। इनमें से पहले में अतिव्यापी भार शामिल हैं, क्योंकि कई प्रकार के कार्य GPU की क्षमताओं का पूरी तरह से उपयोग नहीं करते हैं, और कुछ संसाधन निष्क्रिय हैं। ऐसे मामलों में, आप बस एक ही GPU पर दो अलग-अलग कार्यों को चला सकते हैं, इसकी निष्पादन इकाइयों को अधिक कुशल उपयोग प्राप्त करने के लिए अलग कर सकते हैं - उदाहरण के लिए, PhysX प्रभाव जो फ्रेम के 3D रेंडरिंग के संयोजन के साथ चलते हैं।

इस परिदृश्य के प्रदर्शन को बेहतर बनाने के लिए, पास्कल आर्किटेक्चर ने गतिशील लोड संतुलन की शुरुआत की। पिछले मैक्सवेल आर्किटेक्चर में, ओवरलैपिंग वर्कलोड को ग्राफिक्स और कंप्यूट के बीच GPU संसाधनों के स्थिर वितरण के रूप में लागू किया गया था। यह दृष्टिकोण प्रभावी है बशर्ते कि दो कार्यभार के बीच संतुलन मोटे तौर पर संसाधनों के विभाजन से मेल खाता हो और कार्य समय पर समान रूप से चलते हों। यदि गैर-ग्राफ़िकल गणनाओं में ग्राफ़िकल की तुलना में अधिक समय लगता है, और दोनों सामान्य कार्य के पूरा होने की प्रतीक्षा कर रहे हैं, तो शेष समय के लिए GPU का हिस्सा निष्क्रिय रहेगा, जिससे समग्र प्रदर्शन में कमी आएगी और सभी लाभों को समाप्त कर दिया जाएगा। दूसरी ओर, हार्डवेयर डायनेमिक लोड बैलेंसिंग, आपको उपलब्ध होते ही मुक्त किए गए GPU संसाधनों का उपयोग करने की अनुमति देता है - समझने के लिए, हम एक उदाहरण देंगे।

ऐसे कार्य भी हैं जो समय-महत्वपूर्ण हैं, और यह एसिंक्रोनस कंप्यूटिंग के लिए दूसरा परिदृश्य है। उदाहरण के लिए, VR में एसिंक्रोनस टाइम डिस्टॉर्शन एल्गोरिथम का निष्पादन स्कैन आउट से पहले पूरा होना चाहिए या फ्रेम को छोड़ दिया जाएगा। ऐसे मामले में, GPU को बहुत तेज़ कार्य रुकावट का समर्थन करना चाहिए और GPU पर निष्पादन से कम महत्वपूर्ण कार्य लेने के लिए दूसरे कार्य पर स्विच करना चाहिए, अपने संसाधनों को महत्वपूर्ण कार्यों के लिए मुक्त करना - इसे प्रीमेशन कहा जाता है।

गेम इंजन के एक सिंगल रेंडर कमांड में सैकड़ों ड्रॉ कॉल हो सकते हैं, प्रत्येक ड्रॉ कॉल में बदले में सैकड़ों रेंडर किए गए त्रिकोण होते हैं, जिनमें से प्रत्येक में सैकड़ों पिक्सल की गणना और ड्रा किया जाता है। पारंपरिक GPU दृष्टिकोण केवल उच्च-स्तरीय कार्य रुकावट का उपयोग करता है, और ग्राफिक्स पाइपलाइन को कार्यों को स्विच करने से पहले सभी कार्यों को पूरा करने के लिए इंतजार करना पड़ता है, जिसके परिणामस्वरूप बहुत अधिक विलंबता होती है।

इसे ठीक करने के लिए, पास्कल आर्किटेक्चर ने सबसे पहले पिक्सेल स्तर पर एक कार्य को बाधित करने की क्षमता पेश की - पिक्सेल स्तर प्रीमेशन। पास्कल जीपीयू निष्पादन इकाइयाँ लगातार रेंडरिंग कार्यों की प्रगति की निगरानी कर सकती हैं, और जब एक रुकावट का अनुरोध किया जाता है, तो वे निष्पादन को रोक सकते हैं, संदर्भ को बाद में पूरा करने के लिए जल्दी से दूसरे कार्य पर स्विच करके सहेज सकते हैं।

कंप्यूट ऑपरेशंस के लिए थ्रेड-लेवल इंटरप्ट और टॉगल ग्राफिक्स कंप्यूटिंग के लिए पिक्सेल-लेवल इंटरप्ट के समान काम करता है। कम्प्यूटेशनल वर्कलोड में कई ग्रिड होते हैं, जिनमें से प्रत्येक में कई थ्रेड होते हैं। जब एक इंटरप्ट अनुरोध प्राप्त होता है, तो मल्टीप्रोसेसर पर चलने वाले थ्रेड उनके निष्पादन को समाप्त कर देते हैं। अन्य ब्लॉक भविष्य में एक ही बिंदु से जारी रखने के लिए अपने स्वयं के राज्य को बचाते हैं, और GPU दूसरे कार्य में बदल जाता है। रनिंग थ्रेड्स के बाहर निकलने के बाद पूरी टास्क स्विचिंग प्रक्रिया में 100 माइक्रोसेकंड से भी कम समय लगता है।

गेमिंग वर्कलोड के लिए, ग्राफिक्स के लिए पिक्सेल-लेवल इंटरप्ट और कंप्यूट कार्यों के लिए थ्रेड-लेवल इंटरप्ट का संयोजन पास्कल आर्किटेक्चर जीपीयू को कम से कम समय के नुकसान के साथ कार्यों के बीच जल्दी से स्विच करने की क्षमता देता है। और CUDA पर कार्यों की गणना के लिए, निर्देश स्तर पर - न्यूनतम ग्रैन्युलैरिटी के साथ बाधित करना भी संभव है। इस मोड में, सभी थ्रेड एक ही बार में निष्पादन रोक देते हैं, तुरंत दूसरे कार्य पर स्विच हो जाते हैं। इस दृष्टिकोण के लिए प्रत्येक थ्रेड के सभी रजिस्टरों की स्थिति के बारे में अधिक जानकारी को सहेजना आवश्यक है, लेकिन गैर-ग्राफ़िकल गणना के कुछ मामलों में यह काफी उचित है।

ग्राफिकल और कम्प्यूटेशनल कार्यों में फास्ट इंटरप्ट और टास्क स्विचिंग का उपयोग पास्कल आर्किटेक्चर में जोड़ा गया था ताकि ग्राफिकल और गैर-ग्राफिकल कार्यों को पूरे थ्रेड के बजाय व्यक्तिगत निर्देशों के स्तर पर बाधित किया जा सके, जैसा कि मैक्सवेल और केप्लर के मामले में था। . ये प्रौद्योगिकियां विभिन्न जीपीयू वर्कलोड के एसिंक्रोनस निष्पादन में सुधार कर सकती हैं और एक ही समय में कई कार्यों को चलाने पर प्रतिक्रियात्मकता में सुधार कर सकती हैं। एनवीडिया कार्यक्रम में, उन्होंने भौतिक प्रभावों की गणना के उदाहरण का उपयोग करके अतुल्यकालिक गणना के कार्य का प्रदर्शन दिखाया। यदि अतुल्यकालिक गणना के बिना प्रदर्शन 77-79 एफपीएस के स्तर पर था, तो इन सुविधाओं को शामिल करने के साथ, फ्रेम दर बढ़कर 93-94 एफपीएस हो गई।

हमने पहले ही वीआर में एसिंक्रोनस टाइम डिस्टॉर्शन के रूप में गेम में इस कार्यक्षमता का उपयोग करने की संभावनाओं में से एक का उदाहरण दिया है। चित्रण इस तकनीक के संचालन को पारंपरिक रुकावट (पूर्वावधान) और तेज के साथ दिखाता है। पहले मामले में, अतुल्यकालिक समय विरूपण की प्रक्रिया को यथासंभव देर से करने की कोशिश की जाती है, लेकिन प्रदर्शन पर छवि को अपडेट करने की शुरुआत से पहले। लेकिन एल्गोरिथ्म का काम कुछ मिलीसेकंड पहले GPU में निष्पादन के लिए दिया जाना चाहिए, क्योंकि तेजी से रुकावट के बिना काम को सही समय पर सही ढंग से निष्पादित करने का कोई तरीका नहीं है, और GPU कुछ समय के लिए निष्क्रिय है।

पिक्सेल और थ्रेड स्तर (दाईं ओर दिखाया गया) पर सटीक रुकावट के मामले में, यह क्षमता रुकावट के क्षण को निर्धारित करने में अधिक सटीकता देती है, और एसिंक्रोनस टाइम वॉरपिंग बहुत बाद में काम पूरा होने से पहले विश्वास के साथ शुरू किया जा सकता है। प्रदर्शन पर जानकारी का अद्यतन शुरू होता है। और पहले मामले में कुछ समय के लिए निष्क्रिय, GPU को कुछ अतिरिक्त ग्राफिक कार्य के साथ लोड किया जा सकता है।

एक साथ बहु-प्रक्षेपण प्रौद्योगिकी

नया GP104 GPU अब सपोर्ट करता है नई टेक्नोलॉजीमल्टी-प्रोजेक्शन (एक साथ मल्टी-प्रोजेक्शन - एसएमपी), जो GPU को आधुनिक इमेजिंग सिस्टम पर डेटा को अधिक कुशलता से प्रस्तुत करने की अनुमति देता है। एसएमपी वीडियो चिप को एक साथ कई अनुमानों में डेटा प्रदर्शित करने की अनुमति देता है, जिसके लिए रैस्टराइजेशन ब्लॉक से पहले ज्यामितीय पाइपलाइन के अंत में पॉलीमॉर्फ इंजन के हिस्से के रूप में जीपीयू में एक नए हार्डवेयर ब्लॉक की शुरूआत की आवश्यकता होती है। यह ब्लॉक सिंगल ज्योमेट्री स्ट्रीम के लिए कई अनुमानों के साथ काम करने के लिए जिम्मेदार है।

मल्टी-प्रोजेक्शन इंजन 16 पूर्व-कॉन्फ़िगर किए गए अनुमानों के लिए ज्यामितीय डेटा को एक साथ संसाधित करता है जो प्रक्षेपण बिंदु (कैमरों) को जोड़ते हैं, इन अनुमानों को स्वतंत्र रूप से घुमाया या झुकाया जा सकता है। चूंकि प्रत्येक ज्यामिति आदिम एक साथ कई अनुमानों में प्रकट हो सकता है, एसएमपी इंजन इस कार्यक्षमता को प्रदान करता है, जिससे एप्लिकेशन को अतिरिक्त प्रसंस्करण के बिना 32 बार (दो प्रक्षेपण केंद्रों पर 16 अनुमान) तक ज्यामिति को दोहराने के लिए वीडियो चिप को निर्देश देने की अनुमति मिलती है।

संपूर्ण प्रसंस्करण प्रक्रिया हार्डवेयर त्वरित है, और चूंकि बहुप्रक्षेपण ज्यामिति इंजन के बाद काम करता है, इसलिए इसे ज्यामिति प्रसंस्करण के सभी चरणों को कई बार दोहराने की आवश्यकता नहीं होती है। सहेजे गए संसाधन महत्वपूर्ण होते हैं जब प्रतिपादन गति ज्यामिति प्रसंस्करण के प्रदर्शन से सीमित होती है, जैसे टेसेलेशन, जब प्रत्येक प्रक्षेपण के लिए एक ही ज्यामितीय कार्य कई बार किया जाता है। तदनुसार, चरम मामले में, बहु-प्रक्षेपण ज्यामिति प्रसंस्करण की आवश्यकता को 32 गुना तक कम कर सकता है।

लेकिन यह सब क्यों जरूरी है? ऐसे कई अच्छे उदाहरण हैं जहां बहु-प्रक्षेपण प्रौद्योगिकी उपयोगी हो सकती है। उदाहरण के लिए, तीन डिस्प्ले वाला एक मल्टी-मॉनिटर सिस्टम उपयोगकर्ता के काफी करीब एक कोण पर माउंट किया जाता है (चारों ओर कॉन्फ़िगरेशन)। एक विशिष्ट स्थिति में, दृश्य को एक प्रक्षेपण में प्रस्तुत किया जाता है, जिससे ज्यामितीय विकृतियां और गलत ज्यामिति प्रतिपादन होता है। प्रत्येक मॉनिटर के लिए सही तरीका तीन अलग-अलग अनुमान हैं, जिस कोण पर वे स्थित हैं।

पास्कल आर्किटेक्चर के साथ एक चिप पर एक वीडियो कार्ड के साथ, यह एक ज्यामिति पास में किया जा सकता है, तीन अलग-अलग अनुमानों को निर्दिष्ट करते हुए, प्रत्येक एक अलग मॉनिटर के लिए। और उपयोगकर्ता, इस प्रकार, उस कोण को बदलने में सक्षम होगा जिस पर मॉनिटर एक दूसरे से न केवल भौतिक रूप से, बल्कि वस्तुतः भी - साइड मॉनिटर के लिए अनुमानों को घुमाकर 3D दृश्य में सही परिप्रेक्ष्य प्राप्त करने के लिए एक व्यापक रूप से देखने वाला कोण (FOV)। सच है, यहां एक सीमा है - इस तरह के समर्थन के लिए, एप्लिकेशन को व्यापक एफओवी के साथ दृश्य प्रस्तुत करने में सक्षम होना चाहिए और इसे सेट करने के लिए विशेष एसएमपी एपीआई कॉल का उपयोग करना चाहिए। यानी आप हर गेम में ऐसा नहीं कर सकते, आपको स्पेशल सपोर्ट की जरूरत होती है।

जो भी हो, सिंगल फ्लैट मॉनिटर पर सिंगल प्रोजेक्शन के दिन खत्म हो गए हैं, अब कई मल्टी-मॉनिटर कॉन्फ़िगरेशन और कर्व्ड डिस्प्ले हैं जो इस तकनीक का उपयोग भी कर सकते हैं। वर्चुअल रियलिटी सिस्टम का उल्लेख नहीं है जो स्क्रीन और उपयोगकर्ता की आंखों के बीच विशेष लेंस का उपयोग करते हैं, जिन्हें 3D छवि को 2D छवि में प्रोजेक्ट करने के लिए नई तकनीकों की आवश्यकता होती है। इनमें से कई प्रौद्योगिकियां और तकनीकें अभी भी शुरुआती विकास में हैं, मुख्य बात यह है कि पुराने जीपीयू प्रभावी रूप से एक से अधिक प्लानर प्रोजेक्शन का उपयोग नहीं कर सकते हैं। उन्हें कई रेंडरिंग पास, एक ही ज्यामिति के कई प्रसंस्करण, और इसी तरह की आवश्यकता होती है।

मैक्सवेल चिप्स में दक्षता बढ़ाने में मदद करने के लिए सीमित बहु-रिज़ॉल्यूशन समर्थन था, लेकिन पास्कल का एसएमपी बहुत कुछ कर सकता है। मैक्सवेल क्यूब मैपिंग या विभिन्न प्रोजेक्शन रिज़ॉल्यूशन के लिए प्रोजेक्शन को 90 डिग्री तक घुमा सकता था, लेकिन यह केवल VXGI जैसे सीमित अनुप्रयोगों में ही उपयोगी था।

एसएमपी का उपयोग करने की अन्य संभावनाओं में विभिन्न प्रस्तावों पर प्रतिपादन और एकल-पास स्टीरियो प्रतिपादन शामिल हैं। उदाहरण के लिए, विभिन्न प्रस्तावों पर प्रतिपादन (मल्टी-रेस शेडिंग) का उपयोग प्रदर्शन को अनुकूलित करने के लिए खेलों में किया जा सकता है। जब लागू किया जाता है, तो फ्रेम के केंद्र में एक उच्च रिज़ॉल्यूशन का उपयोग किया जाता है, और परिधि पर इसे तेज़ रेंडरिंग गति प्राप्त करने के लिए कम किया जाता है।

VR में सिंगल-पास स्टीरियो रेंडरिंग का उपयोग किया जाता है, इसे पहले ही VRWorks पैकेज में जोड़ा जा चुका है और VR रेंडरिंग में आवश्यक ज्यामितीय कार्य की मात्रा को कम करने के लिए मल्टी-प्रोजेक्शन फीचर का उपयोग करता है। यदि इस सुविधा का उपयोग किया जाता है, तो GeForce GTX 1080 GPU केवल एक बार दृश्य ज्यामिति को संसाधित करता है, प्रत्येक आंख के लिए एक बार में दो अनुमान उत्पन्न करता है, जो GPU पर ज्यामितीय भार को आधा कर देता है, और ड्राइवर और OS से होने वाले नुकसान को भी कम करता है।

वीआर रेंडरिंग की दक्षता में सुधार के लिए एक और अधिक उन्नत तकनीक लेंस मैचेड शेडिंग है, जो वीआर रेंडरिंग में आवश्यक ज्यामितीय विकृतियों को अनुकरण करने के लिए कई अनुमानों का उपयोग करती है। यह विधि एक सतह पर एक 3D दृश्य प्रस्तुत करने के लिए बहु-प्रक्षेपण का उपयोग करती है जो VR हेडसेट आउटपुट के लिए प्रदान किए जाने पर लेंस-समायोजित सतह का अनुमान लगाती है, परिधि पर कई अतिरिक्त पिक्सेल से बचती है जिसे छोड़ दिया जाएगा। विधि के सार को समझने का सबसे आसान तरीका चित्रण द्वारा है - प्रत्येक आंख के सामने चार थोड़े विस्तारित अनुमानों का उपयोग किया जाता है (पास्कल में, आप प्रत्येक आंख के लिए 16 अनुमानों का उपयोग कर सकते हैं - एक घुमावदार लेंस को अधिक सटीक रूप से अनुकरण करने के लिए) एक के बजाय:

इस दृष्टिकोण से महत्वपूर्ण प्रदर्शन बचत हो सकती है। उदाहरण के लिए, प्रति आंख एक विशिष्ट ओकुलस रिफ्ट छवि 1.1 मेगापिक्सेल है। लेकिन अनुमानों में अंतर के कारण, इसे प्रस्तुत करने के लिए, मूल छवि 2.1 मेगापिक्सेल है - आवश्यकता से 86% अधिक! पास्कल आर्किटेक्चर में लागू किए गए मल्टी-प्रोजेक्शन का उपयोग, प्रदान की गई छवि के रिज़ॉल्यूशन को 1.4 मेगापिक्सेल तक कम करने की अनुमति देता है, पिक्सेल प्रोसेसिंग गति में 1.5 गुना बचत प्राप्त करता है, और मेमोरी बैंडविड्थ भी बचाता है।

और सिंगल-पास स्टीरियो रेंडरिंग के कारण ज्यामिति प्रसंस्करण गति में दो गुना बचत के साथ, GeForce GTX 1080 ग्राफिक्स प्रोसेसर VR रेंडरिंग प्रदर्शन में उल्लेखनीय वृद्धि प्रदान करने में सक्षम है, जो कि ज्यामिति प्रसंस्करण गति पर बहुत मांग है, और इससे भी अधिक पिक्सेल प्रसंस्करण।

वीडियो आउटपुट और प्रोसेसिंग ब्लॉक में सुधार

3D रेंडरिंग से संबंधित प्रदर्शन और नई कार्यक्षमता के अलावा, छवि आउटपुट के साथ-साथ वीडियो डिकोडिंग और एन्कोडिंग का एक अच्छा स्तर बनाए रखना आवश्यक है। और पहले पास्कल आर्किटेक्चर ग्राफिक्स प्रोसेसर ने निराश नहीं किया - यह इस अर्थ में सभी आधुनिक मानकों का समर्थन करता है, जिसमें एचईवीसी प्रारूप के हार्डवेयर डिकोडिंग भी शामिल है, जो एक पीसी पर 4K वीडियो देखने के लिए आवश्यक है। साथ ही, GeForce GTX 1080 ग्राफिक्स कार्ड के भविष्य के मालिक जल्द ही अपने सिस्टम पर नेटफ्लिक्स और अन्य प्रदाताओं से 4K वीडियो स्ट्रीमिंग का आनंद ले सकेंगे।

डिस्प्ले आउटपुट के मामले में, GeForce GTX 1080 में HDCP 2.2 के साथ-साथ डिस्प्लेपोर्ट के साथ HDMI 2.0b के लिए सपोर्ट है। अब तक, DP 1.2 संस्करण को प्रमाणित किया गया है, लेकिन GPU मानक के नए संस्करणों के प्रमाणन के लिए तैयार है: DP 1.3 रेडी और DP 1.4 रेडी। बाद वाला 4K स्क्रीन को 120Hz पर प्रदर्शित करने की अनुमति देता है, और 5K और 8K को 60Hz पर डिस्प्लेपोर्ट 1.3 केबल की एक जोड़ी का उपयोग करके प्रदर्शित करता है। यदि GTX 980 के लिए अधिकतम समर्थित रिज़ॉल्यूशन 60Hz पर 5120x3200 था, तो नए GTX 1080 मॉडल के लिए यह उसी 60Hz पर 7680x4320 हो गया है। संदर्भ GeForce GTX 1080 में तीन डिस्प्लेपोर्ट आउटपुट, एक एचडीएमआई 2.0 बी और एक डिजिटल डुअल-लिंक डीवीआई है।

एनवीडिया वीडियो कार्ड के नए मॉडल को वीडियो डेटा को डिकोडिंग और एन्कोडिंग के लिए एक बेहतर ब्लॉक भी मिला। इस प्रकार, GP104 चिप वीडियो प्लेबैक स्ट्रीमिंग के लिए PlayReady 3.0 (SL3000) के उच्च मानकों का अनुपालन करता है, जो आपको यह सुनिश्चित करने की अनुमति देता है कि नेटफ्लिक्स जैसे प्रसिद्ध प्रदाताओं से उच्च गुणवत्ता वाली सामग्री खेलना उच्चतम गुणवत्ता और ऊर्जा कुशल होगा। . एन्कोडिंग और डिकोडिंग के दौरान विभिन्न वीडियो प्रारूपों के समर्थन के बारे में विवरण तालिका में दिया गया है, नया उत्पाद बेहतर के लिए पिछले समाधानों से स्पष्ट रूप से भिन्न है:

लेकिन एक और भी दिलचस्प नवीनता तथाकथित हाई डायनेमिक रेंज (एचडीआर) डिस्प्ले के लिए समर्थन है, जो बाजार में व्यापक होने वाले हैं। टीवी 2016 की शुरुआत में बिक्री पर हैं (केवल एक साल में चार मिलियन एचडीआर टीवी बेचे जाने की उम्मीद है), और अगले साल मॉनिटर करता है। एचडीआर वर्षों में डिस्प्ले टेक्नोलॉजी में सबसे बड़ी सफलता है, जो डबल कलर टोन (75% दृश्यमान स्पेक्ट्रम बनाम आरजीबी के लिए 33%), उच्च कंट्रास्ट (10000:1) और समृद्ध रंगों के साथ उज्ज्वल डिस्प्ले (1000 एनआईटी) प्रदान करता है।

चमक और समृद्ध और अधिक संतृप्त रंगों में अधिक अंतर के साथ सामग्री को चलाने की क्षमता का उद्भव स्क्रीन पर छवि को वास्तविकता के करीब लाएगा, काला रंग गहरा हो जाएगा, चमकदार रोशनी वास्तविक दुनिया की तरह ही चकाचौंध हो जाएगी। . तदनुसार, उपयोगकर्ता मानक मॉनिटर और टीवी की तुलना में छवियों के उज्ज्वल और अंधेरे क्षेत्रों में अधिक विवरण देखेंगे।

HDR डिस्प्ले को सपोर्ट करने के लिए, GeForce GTX 1080 में वह सब कुछ है जो आपको चाहिए - 12-बिट कलर आउटपुट, BT.2020 और SMPTE 2084 मानकों के लिए सपोर्ट, और HDMI 2.0b 10/12-बिट 4K HDR आउटपुट। मैक्सवेल। इसके अलावा, पास्कल ने एचईवीसी प्रारूप को 4K रिज़ॉल्यूशन में 60 हर्ट्ज और 10- या 12-बिट रंग में डीकोड करने के लिए समर्थन जोड़ा है, जिसका उपयोग एचडीआर वीडियो के लिए किया जाता है, साथ ही समान मापदंडों के साथ समान प्रारूप को एन्कोड करने के लिए, लेकिन केवल 10 में एचडीआर वीडियो रिकॉर्डिंग या स्ट्रीमिंग के लिए बिट। इसके अलावा, इस कनेक्टर के माध्यम से एचडीआर डेटा ट्रांसमिशन के लिए डिस्प्लेपोर्ट 1.4 मानकीकरण के लिए नवीनता तैयार है।

वैसे, भविष्य में ऐसे डेटा को होम पीसी से SHIELD गेम कंसोल में स्थानांतरित करने के लिए HDR वीडियो एन्कोडिंग की आवश्यकता हो सकती है जो 10-बिट HEVC चला सकता है। यानी यूजर पीसी से एचडीआर फॉर्मेट में गेम को ब्रॉडकास्ट कर सकेगा। रुको, मुझे इस तरह के समर्थन के साथ गेम कहां मिल सकते हैं? एनवीडिया इस समर्थन को लागू करने के लिए गेम डेवलपर्स के साथ लगातार काम कर रहा है, जिससे उन्हें मौजूदा डिस्प्ले के साथ संगत एचडीआर छवियों को सही ढंग से प्रस्तुत करने के लिए उन्हें जो कुछ भी चाहिए (ड्राइवर समर्थन, कोड नमूने, आदि) दे रहा है।

वीडियो कार्ड जारी होने के समय, GeForce GTX 1080, गेम जैसे ऑबडक्शन, द विटनेस, लॉब्रेकर्स, राइज़ ऑफ़ द टॉम्ब रेडर, पैरागॉन, द टैलोस प्रिंसिपल और शैडो वारियर 2 में एचडीआर आउटपुट के लिए समर्थन है। लेकिन यह सूची है निकट भविष्य में फिर से भरने की उम्मीद है।

मल्टी-चिप SLI रेंडरिंग में परिवर्तन

मालिकाना SLI मल्टी-चिप रेंडरिंग तकनीक से संबंधित कुछ बदलाव भी थे, हालाँकि किसी को भी इसकी उम्मीद नहीं थी। एसएलआई का उपयोग पीसी गेमिंग के प्रति उत्साही लोगों द्वारा प्रदर्शन को बढ़ावा देने के लिए किया जाता है, या तो सबसे शक्तिशाली सिंगल-चिप ग्राफिक्स कार्ड को अग्रानुक्रम में चलाकर, या खुद को कुछ मध्य-श्रेणी के समाधानों तक सीमित करके बहुत उच्च फ्रेम दर प्राप्त करने के लिए जो कभी-कभी सस्ते होते हैं। एक शीर्ष-अंत (विवादास्पद निर्णय, लेकिन वे इसे करते हैं)। 4K मॉनिटर के साथ, खिलाड़ियों के पास कुछ वीडियो कार्ड स्थापित करने के अलावा लगभग कोई अन्य विकल्प नहीं होता है, क्योंकि शीर्ष मॉडल भी अक्सर ऐसी परिस्थितियों में अधिकतम सेटिंग्स पर एक आरामदायक गेम प्रदान नहीं कर सकते हैं।

एनवीडिया एसएलआई के महत्वपूर्ण घटकों में से एक पुल हैं जो वीडियो कार्ड को एक सामान्य वीडियो सबसिस्टम में जोड़ते हैं और उनके बीच डेटा ट्रांसफर के लिए एक डिजिटल चैनल को व्यवस्थित करने का काम करते हैं। GeForce ग्राफिक्स कार्ड में पारंपरिक रूप से दोहरे SLI कनेक्टर होते हैं, जो 3-वे और 4-वे SLI कॉन्फ़िगरेशन में दो या चार ग्राफिक्स कार्ड के बीच जुड़ने का काम करते हैं। प्रत्येक वीडियो कार्ड को प्रत्येक से जोड़ा जाना था, क्योंकि सभी GPU ने उन फ़्रेमों को भेजा जो उन्होंने मुख्य GPU को प्रदान किए थे, यही वजह है कि प्रत्येक बोर्ड पर दो इंटरफेस की आवश्यकता थी।

GeForce GTX 1080 से शुरू होकर, पास्कल आर्किटेक्चर पर आधारित सभी Nvidia ग्राफिक्स कार्ड में ग्राफिक्स कार्ड के बीच डेटा ट्रांसफर के प्रदर्शन को बढ़ाने के लिए दो SLI इंटरफेस एक साथ जुड़े हुए हैं, और यह नया डुअल-चैनल SLI मोड दृश्य जानकारी प्रदर्शित करते समय प्रदर्शन और आराम में सुधार करता है। बहुत उच्च-रिज़ॉल्यूशन डिस्प्ले या मल्टी-मॉनिटर सिस्टम।

इस मोड के लिए, नए पुलों की भी आवश्यकता थी, जिन्हें एसएलआई एचबी कहा जाता है। वे दो एसएलआई चैनलों के माध्यम से एक बार में GeForce GTX 1080 वीडियो कार्ड की एक जोड़ी को जोड़ते हैं, हालांकि नए वीडियो कार्ड पुराने पुलों के साथ भी संगत हैं। 1920×1080 और 2560×1440 पिक्सल के रिज़ॉल्यूशन के लिए 60 हर्ट्ज की ताज़ा दर पर, मानक पुलों का उपयोग किया जा सकता है, लेकिन अधिक मांग वाले मोड (4K, 5K और मल्टी-मॉनिटर सिस्टम) में, केवल नए ब्रिज ही बेहतर परिणाम प्रदान करेंगे। चिकनी फ्रेम परिवर्तन, हालांकि पुराने काम करेंगे, लेकिन कुछ हद तक बदतर।

इसके अलावा, SLI HB ब्रिज का उपयोग करते समय, GeForce GTX 1080 डेटा इंटरफ़ेस पुराने GPU पर पारंपरिक SLI ब्रिज के लिए 400 MHz की तुलना में 650 MHz पर चलता है। इसके अलावा, कुछ कठिन पुराने पुलों के लिए, पास्कल वास्तुकला के वीडियो चिप्स के साथ उच्च डेटा अंतरण दर भी उपलब्ध है। ऑपरेशन की बढ़ी हुई आवृत्ति के साथ दोगुने एसएलआई इंटरफेस के माध्यम से जीपीयू के बीच डेटा ट्रांसफर दर में वृद्धि के साथ, पिछले समाधानों की तुलना में स्क्रीन पर फ्रेम का एक आसान प्रदर्शन भी प्रदान किया जाता है:

यह भी ध्यान दिया जाना चाहिए कि DirectX 12 में मल्टी-चिप रेंडरिंग के लिए समर्थन पहले की प्रथा से कुछ अलग है। पर नवीनतम संस्करणग्राफिक्स एपीआई, माइक्रोसॉफ्ट ने ऐसे वीडियो सिस्टम के संचालन से संबंधित कई बदलाव किए हैं। सॉफ्टवेयर डेवलपर्स के लिए, DX12 कई GPU का उपयोग करने के लिए दो विकल्प प्रदान करता है: मल्टी डिस्प्ले एडेप्टर (MDA) और लिंक्ड डिस्प्ले एडेप्टर (LDA) मोड।

इसके अलावा, एलडीए मोड के दो रूप हैं: लागू एलडीए (जिसे एनवीडिया एसएलआई के लिए उपयोग करता है) और स्पष्ट एलडीए (जब गेम डेवलपर मल्टी-चिप रेंडरिंग के प्रबंधन का काम करता है। एमडीए और स्पष्ट एलडीए मोड अभी डायरेक्टएक्स 12 में लागू किए गए थे। मल्टी-चिप वीडियो सिस्टम का उपयोग करते समय गेम डेवलपर्स को अधिक स्वतंत्रता और अवसर देने के लिए। मोड के बीच का अंतर निम्न तालिका में स्पष्ट रूप से दिखाई देता है:

एलडीए मोड में, प्रत्येक जीपीयू की मेमोरी को दूसरे की मेमोरी से जोड़ा जा सकता है और बड़े कुल वॉल्यूम के रूप में प्रदर्शित किया जा सकता है, निश्चित रूप से, सभी प्रदर्शन सीमाओं के साथ जब डेटा "विदेशी" मेमोरी से लिया जाता है। एमडीए मोड में, प्रत्येक जीपीयू की मेमोरी अलग से काम करती है, और विभिन्न जीपीयू सीधे दूसरे जीपीयू की मेमोरी से डेटा तक नहीं पहुंच सकते हैं। एलडीए मोड समान प्रदर्शन के मल्टी-चिप सिस्टम के लिए डिज़ाइन किया गया है, जबकि एमडीए मोड कम प्रतिबंधात्मक है और अलग-अलग निर्माताओं के चिप्स के साथ असतत और एकीकृत जीपीयू या असतत समाधान के साथ मिलकर काम कर सकता है। लेकिन इस मोड को भी अधिक ध्यान देने और डेवलपर्स से काम करने की आवश्यकता होती है जब प्रोग्रामिंग सहयोग करते हैं ताकि जीपीयू एक दूसरे के साथ संवाद कर सकें।

डिफ़ॉल्ट रूप से, GeForce GTX 1080 आधारित SLI सिस्टम केवल दो GPU का समर्थन करता है, और तीन- और चार-GPU कॉन्फ़िगरेशन को आधिकारिक तौर पर हटा दिया जाता है, क्योंकि आधुनिक गेम तीसरे और चौथे GPU को जोड़ने से प्रदर्शन लाभ प्राप्त करना कठिन होता जा रहा है। उदाहरण के लिए, कई गेम मल्टी-चिप वीडियो सिस्टम का संचालन करते समय सिस्टम के केंद्रीय प्रोसेसर की क्षमताओं पर भरोसा करते हैं, और नए गेम तेजी से अस्थायी (अस्थायी) तकनीकों का उपयोग करते हैं जो पिछले फ्रेम से डेटा का उपयोग करते हैं, जिसमें एक साथ कई जीपीयू का कुशल संचालन होता है। बस असंभव।

हालांकि, अन्य (गैर-एसएलआई) मल्टी-चिप सिस्टम में सिस्टम का संचालन संभव रहता है, जैसे डायरेक्टएक्स 12 में एमडीए या एलडीए स्पष्ट मोड या फिजिक्स भौतिक प्रभावों के लिए समर्पित तीसरे जीपीयू के साथ दो-चिप एसएलआई सिस्टम। लेकिन बेंचमार्क में रिकॉर्ड के बारे में क्या, क्या एनवीडिया वास्तव में उन्हें पूरी तरह से छोड़ रहा है? नहीं, निश्चित रूप से, लेकिन चूंकि दुनिया में लगभग कुछ उपयोगकर्ताओं द्वारा ऐसी प्रणालियों की मांग है, ऐसे अति उत्साही लोगों के लिए एक विशेष उत्साही कुंजी का आविष्कार किया गया था, जिसे एनवीडिया वेबसाइट से डाउनलोड किया जा सकता है और इस सुविधा को अनलॉक किया जा सकता है। ऐसा करने के लिए, आपको पहले एक विशेष एप्लिकेशन चलाकर एक अद्वितीय GPU आईडी प्राप्त करने की आवश्यकता है, फिर वेबसाइट पर उत्साही कुंजी का अनुरोध करें और इसे डाउनलोड करने के बाद, सिस्टम में कुंजी स्थापित करें, जिससे 3-वे और 4-वे अनलॉक हो जाएं। एसएलआई विन्यास।

फास्ट सिंक टेक्नोलॉजी

प्रदर्शन पर जानकारी प्रदर्शित करते समय सिंक्रनाइज़ेशन तकनीकों में कुछ बदलाव हुए हैं। आगे देखें तो G-Sync में कुछ भी नया नहीं है और न ही Adaptive Sync तकनीक समर्थित है। लेकिन एनवीडिया ने उन खेलों के लिए आउटपुट और सिंक्रोनाइज़ेशन की चिकनाई में सुधार करने का फैसला किया जो बहुत दिखाते हैं उच्च प्रदर्शनजब फ्रेम दर मॉनिटर की ताज़ा दर से अधिक हो जाती है। यह उन खेलों के लिए विशेष रूप से महत्वपूर्ण है जिनमें न्यूनतम विलंबता और तेज़ प्रतिक्रिया की आवश्यकता होती है, और जो मल्टीप्लेयर लड़ाई और प्रतियोगिताएं हैं।

फास्ट सिंक वर्टिकल सिंक का एक नया विकल्प है जिसमें दृश्य कलाकृतियां नहीं हैं जैसे कि छवि में फाड़ना और एक निश्चित ताज़ा दर से बंधा नहीं है, जो विलंबता को बढ़ाता है। काउंटर-स्ट्राइक: ग्लोबल ऑफेंसिव जैसे खेलों में वर्टिकल सिंक में क्या समस्या है? शक्तिशाली आधुनिक जीपीयू पर यह गेम कई सौ फ्रेम प्रति सेकेंड पर चलता है, और खिलाड़ी के पास एक विकल्प होता है कि वी-सिंक को सक्षम करना है या नहीं।

मल्टीप्लेयर गेम में, उपयोगकर्ता अक्सर न्यूनतम देरी का पीछा करते हैं और वीएसआईएनसी को बंद कर देते हैं, जिससे छवि में स्पष्ट रूप से फाड़ दिखाई देता है, जो उच्च फ्रेम दर पर भी बेहद अप्रिय है। हालांकि, यदि आप वी-सिंक चालू करते हैं, तो खिलाड़ी को अपने कार्यों और स्क्रीन पर छवि के बीच देरी में उल्लेखनीय वृद्धि का अनुभव होगा, जब ग्राफिक्स पाइपलाइन मॉनिटर की ताज़ा दर तक धीमी हो जाती है।

इस तरह एक पारंपरिक पाइपलाइन काम करती है। लेकिन एनवीडिया ने फास्ट सिंक तकनीक का उपयोग करके छवि को स्क्रीन पर प्रदर्शित करने और प्रदर्शित करने की प्रक्रिया को अलग करने का निर्णय लिया। यह आपको यथासंभव जारी रखने की अनुमति देता है कुशल कार्य GPU के उस भाग के लिए जो फ़्रेम को पूर्ण गति से प्रस्तुत करता है, इन फ़्रेमों को एक विशेष अस्थायी Last Rendered Buffer में संग्रहीत करता है।

यह विधि आपको कम विलंबता प्राप्त करते हुए, लेकिन छवि कलाकृतियों के बिना, प्रदर्शन पद्धति को बदलने और VSync चालू और VSync बंद मोड से सर्वश्रेष्ठ लेने की अनुमति देती है। फास्ट सिंक के साथ, कोई फ्रेम प्रवाह नियंत्रण नहीं है, गेम इंजन सिंक-ऑफ मोड में चलता है और अगले एक को ड्रा करने के लिए प्रतीक्षा करने के लिए नहीं कहा जाता है, इसलिए विलंबता लगभग वीएसआईएनसी ऑफ मोड जितनी कम है। लेकिन चूंकि फास्ट सिंक स्वतंत्र रूप से स्क्रीन पर प्रदर्शित करने के लिए एक बफर का चयन करता है और पूरे फ्रेम को प्रदर्शित करता है, इसलिए कोई चित्र विराम भी नहीं है।

फास्ट सिंक तीन अलग-अलग बफर का उपयोग करता है, जिनमें से पहले दो क्लासिक पाइपलाइन में डबल बफरिंग के समान काम करते हैं। प्राथमिक बफर (फ्रंट बफर - एफबी) एक बफर है, जिसमें से जानकारी डिस्प्ले पर प्रदर्शित होती है, एक पूरी तरह से प्रस्तुत फ्रेम। बैक बफर (बैक बफर - बीबी) वह बफर है जो प्रतिपादन करते समय जानकारी प्राप्त करता है।

उच्च फ्रेम दर स्थितियों में लंबवत सिंक का उपयोग करते समय, स्क्रीन पर एकल फ्रेम की छवि प्रदर्शित करने के लिए माध्यमिक बफर के साथ प्राथमिक बफर को स्वैप करने के लिए रीफ्रेश अंतराल तक पहुंचने तक गेम प्रतीक्षा करता है। यह चीजों को धीमा कर देता है, और पारंपरिक ट्रिपल बफरिंग जैसे अधिक बफ़र्स जोड़ने से केवल देरी होगी।

Fast Sync के साथ, एक तीसरा Last Rendered Buffer (LRB) जोड़ा जाता है, जिसका उपयोग उन सभी फ़्रेमों को संग्रहीत करने के लिए किया जाता है, जिन्हें अभी-अभी सेकेंडरी बफ़र में रेंडर किया गया है। बफर का नाम अपने लिए बोलता है, इसमें अंतिम पूरी तरह से रेंडर किए गए फ्रेम की एक प्रति होती है। और जब प्राथमिक बफर को अपडेट करने का समय आता है, तो इस एलआरबी बफर को प्राथमिक में पूरी तरह से कॉपी किया जाता है, न कि भागों में, जैसा कि सेकेंडरी से अक्षम वर्टिकल सिंक्रोनाइज़ेशन के साथ होता है। चूंकि बफ़र्स से जानकारी की प्रतिलिपि बनाना अक्षम है, इसलिए उन्हें बस स्वैप किया जाता है (या नाम बदला जाता है, क्योंकि यह समझने में अधिक सुविधाजनक होगा), और GP104 में पेश किए गए बफ़र्स को स्वैप करने का नया तर्क इस प्रक्रिया का प्रबंधन करता है।

व्यवहार में, एक नई सिंक्रोनाइज़ेशन विधि का समावेश फास्ट सिंक अभी भी पूरी तरह से अक्षम वर्टिकल सिंक्रोनाइज़ेशन की तुलना में थोड़ा बड़ा विलंब प्रदान करता है - औसतन 8 एमएस अधिक, लेकिन यह स्क्रीन पर अप्रिय कलाकृतियों के बिना, मॉनिटर पर फ्रेम को पूरी तरह से प्रदर्शित करता है। छवि को फाड़ दो। नई विधि को वर्टिकल सिंक कंट्रोल सेक्शन में एनवीडिया कंट्रोल पैनल ग्राफिक्स सेटिंग्स से सक्षम किया जा सकता है। हालाँकि, डिफ़ॉल्ट मान एप्लिकेशन नियंत्रण बना रहता है, और आपको सभी 3D अनुप्रयोगों में फास्ट सिंक को सक्षम करने की आवश्यकता नहीं है, विशेष रूप से उच्च FPS वाले गेम के लिए इस पद्धति को चुनना बेहतर है।

आभासी वास्तविकता प्रौद्योगिकी एनवीडिया वीआरवर्क्स

हमने इस लेख में एक से अधिक बार VR के चर्चित विषय पर बात की है, लेकिन यह ज्यादातर फ्रैमरेट को बढ़ाने और कम विलंबता सुनिश्चित करने के बारे में है, जो VR के लिए बहुत महत्वपूर्ण है। यह सब बहुत महत्वपूर्ण है और वास्तव में प्रगति हो रही है, लेकिन अभी तक वीआर गेम "नियमित" आधुनिक 3 डी गेम के सर्वश्रेष्ठ के रूप में प्रभावशाली नहीं दिखते हैं। यह केवल इसलिए नहीं होता है क्योंकि अग्रणी गेम डेवलपर्स अभी तक वीआर अनुप्रयोगों में विशेष रूप से शामिल नहीं हुए हैं, बल्कि इसलिए भी कि वीआर फ्रेम दर पर अधिक मांग कर रहा है, जो उच्च मांगों के कारण ऐसे खेलों में कई सामान्य तकनीकों के उपयोग को रोकता है।

वीआर गेम और नियमित गेम के बीच गुणवत्ता में अंतर को कम करने के लिए, एनवीडिया ने संबंधित वीआरवर्क्स प्रौद्योगिकियों का एक पूरा पैकेज जारी करने का फैसला किया, जिसमें बड़ी संख्या में एपीआई, पुस्तकालय, इंजन और प्रौद्योगिकियां शामिल थीं जो गुणवत्ता और प्रदर्शन दोनों में काफी सुधार कर सकती हैं। वीआर- एप्लिकेशन। यह पास्कल में पहले गेमिंग समाधान की घोषणा से कैसे संबंधित है? यह बहुत आसान है - इसमें कुछ तकनीकों को पेश किया गया है जो उत्पादकता बढ़ाने और गुणवत्ता में सुधार करने में मदद करती हैं, और हम उनके बारे में पहले ही लिख चुके हैं।

और यद्यपि यह न केवल ग्राफिक्स की चिंता करता है, पहले हम इसके बारे में थोड़ी बात करेंगे। VRWorks ग्राफ़िक्स तकनीकों के सेट में GeForce GTX 1080 में दिखाई देने वाली बहु-प्रक्षेपण सुविधा का उपयोग करते हुए, पहले उल्लिखित तकनीकों, जैसे लेंस मिलान छायांकन, शामिल हैं। नया उत्पाद आपको इसके संबंध में 1.5-2 गुना की प्रदर्शन वृद्धि प्राप्त करने की अनुमति देता है। समाधान जिनके पास ऐसा समर्थन नहीं है। हमने अन्य तकनीकों का भी उल्लेख किया है, जैसे कि मल्टीरेस शेडिंग, जिसे फ्रेम के केंद्र में और इसकी परिधि पर विभिन्न प्रस्तावों पर प्रस्तुत करने के लिए डिज़ाइन किया गया है।

लेकिन बहुत अधिक अप्रत्याशित VRWorks ऑडियो तकनीक की घोषणा थी, जिसे 3D दृश्यों में ध्वनि डेटा की उच्च-गुणवत्ता की गणना के लिए डिज़ाइन किया गया था, जो विशेष रूप से आभासी वास्तविकता प्रणालियों में महत्वपूर्ण है। पारंपरिक इंजनों में, आभासी वातावरण में ध्वनि स्रोतों की स्थिति की गणना काफी सही ढंग से की जाती है, यदि दुश्मन दाईं ओर से गोली मारता है, तो ऑडियो सिस्टम के इस तरफ से ध्वनि तेज होती है, और इस तरह की गणना कंप्यूटिंग शक्ति पर बहुत अधिक मांग नहीं करती है .

लेकिन वास्तव में, ध्वनियाँ न केवल खिलाड़ी की ओर जाती हैं, बल्कि सभी दिशाओं में जाती हैं और विभिन्न सामग्रियों को उछाल देती हैं, जैसे प्रकाश किरणें उछलती हैं। और वास्तव में, हम इन प्रतिबिंबों को सुनते हैं, हालांकि प्रत्यक्ष ध्वनि तरंगों के रूप में स्पष्ट रूप से नहीं। इन अप्रत्यक्ष ध्वनि प्रतिबिंबों को आमतौर पर विशेष रीवरब प्रभावों द्वारा सिम्युलेटेड किया जाता है, लेकिन यह कार्य के लिए एक बहुत ही आदिम दृष्टिकोण है।

VRWorks ऑडियो रेंडरिंग में रे ट्रेसिंग के समान ध्वनि तरंग रेंडरिंग का उपयोग करता है, जहां प्रकाश किरणों के पथ को आभासी दृश्य में वस्तुओं से कई प्रतिबिंबों के लिए खोजा जाता है। जब प्रत्यक्ष और परावर्तित तरंगों को ट्रैक किया जाता है, तो उनके आपतन कोण और परावर्तक सामग्री के गुणों के आधार पर VRWorks ऑडियो वातावरण में ध्वनि तरंगों के प्रसार का अनुकरण भी करता है। अपने काम में, VRWorks Audio ग्राफिक्स कार्यों के लिए जाने जाने वाले उच्च-प्रदर्शन Nvidia OptiX रे ट्रेसिंग इंजन का उपयोग करता है। OptiX का उपयोग विभिन्न कार्यों के लिए किया जा सकता है, जैसे अप्रत्यक्ष प्रकाश गणना और लाइटमैपिंग, और अब VRWorks ऑडियो में ध्वनि तरंग अनुरेखण के लिए भी।

एनवीडिया ने अपने वीआर फनहाउस डेमो में सटीक ध्वनि तरंग गणना का निर्माण किया है, जो कई हजार किरणों का उपयोग करता है और वस्तुओं से 12 प्रतिबिंबों की गणना करता है। और एक स्पष्ट उदाहरण का उपयोग करके प्रौद्योगिकी के लाभों को जानने के लिए, हमारा सुझाव है कि आप रूसी में प्रौद्योगिकी के संचालन के बारे में एक वीडियो देखें:

यह महत्वपूर्ण है कि एनवीडिया का दृष्टिकोण पारंपरिक ध्वनि इंजनों से अलग है, जिसमें GPU में एक विशेष ब्लॉक का उपयोग करके मुख्य प्रतियोगी से हार्डवेयर-त्वरित विधि शामिल है। ये सभी विधियां केवल ध्वनि स्रोतों की सटीक स्थिति प्रदान करती हैं, लेकिन 3D दृश्य में वस्तुओं से ध्वनि तरंगों के प्रतिबिंबों की गणना नहीं करती हैं, हालांकि वे reverb प्रभाव का उपयोग करके इसका अनुकरण कर सकते हैं। हालांकि, किरण अनुरेखण तकनीक का उपयोग अधिक यथार्थवादी हो सकता है, क्योंकि केवल इस तरह के दृष्टिकोण से दृश्य में वस्तुओं के आकार, आकार और सामग्री को ध्यान में रखते हुए विभिन्न ध्वनियों की सटीक नकल प्रदान की जा सकती है। यह कहना मुश्किल है कि क्या एक विशिष्ट खिलाड़ी के लिए ऐसी कम्प्यूटेशनल सटीकता की आवश्यकता है, लेकिन हम निश्चित रूप से कह सकते हैं: वीआर में, यह उपयोगकर्ताओं को बहुत ही यथार्थवाद जोड़ सकता है जो अभी भी पारंपरिक खेलों में कमी है।

खैर, हमें केवल VR SLI तकनीक के बारे में बताना बाकी है, जो OpenGL और DirectX दोनों में काम करती है। इसका सिद्धांत बेहद सरल है: वीआर एप्लिकेशन में एक दो-जीपीयू वीडियो सिस्टम इस तरह से काम करेगा कि प्रत्येक आंख को एक अलग जीपीयू आवंटित किया जाए, जैसा कि एसएलआई कॉन्फ़िगरेशन से परिचित एएफआर प्रतिपादन के विपरीत है। यह समग्र प्रदर्शन में काफी सुधार करता है, जो वर्चुअल रियलिटी सिस्टम के लिए बहुत महत्वपूर्ण है। सैद्धांतिक रूप से, अधिक GPU का उपयोग किया जा सकता है, लेकिन उनकी संख्या सम होनी चाहिए।

इस दृष्टिकोण की आवश्यकता थी क्योंकि एएफआर वीआर के लिए उपयुक्त नहीं है, क्योंकि इसकी मदद से पहला जीपीयू दोनों आंखों के लिए एक समान फ्रेम तैयार करेगा, और दूसरा एक अजीब प्रस्तुत करेगा, जो वर्चुअल के लिए महत्वपूर्ण देरी को कम नहीं करता है वास्तविकता प्रणाली। हालांकि फ्रेम रेट काफी ज्यादा होगा। तो वीआर एसएलआई की मदद से, प्रत्येक फ्रेम पर काम दो जीपीयू में बांटा गया है - एक बाईं आंख के लिए फ्रेम के हिस्से पर काम करता है, दूसरा दाएं के लिए, और फिर फ्रेम के इन हिस्सों को एक पूरे में जोड़ दिया जाता है।

GPU की एक जोड़ी के बीच इस तरह विभाजित कार्य 2x प्रदर्शन को बढ़ावा देता है, जिससे एकल GPU पर आधारित सिस्टम की तुलना में उच्च फ्रेम दर और कम विलंबता की अनुमति मिलती है। सच है, इस स्केलिंग पद्धति का उपयोग करने के लिए VR SLI के उपयोग के लिए एप्लिकेशन से विशेष समर्थन की आवश्यकता होती है। लेकिन वीआर एसएलआई तकनीक पहले से ही वीआर डेमो ऐप जैसे कि वाल्व की द लैब और आईएलएमएक्सएलएबी के ट्रायल्स ऑन टैटूइन में निर्मित है, और यह सिर्फ शुरुआत है - एनवीडिया अन्य ऐप को जल्द ही आने का वादा करता है, साथ ही तकनीक को अवास्तविक इंजन 4, यूनिटी और मैक्स में लाता है। खेलना।

एंसल गेम स्क्रीनशॉट प्लेटफॉर्म

सॉफ्टवेयर से संबंधित सबसे दिलचस्प घोषणाओं में से एक गेमिंग अनुप्रयोगों में उच्च-गुणवत्ता वाले स्क्रीनशॉट को कैप्चर करने के लिए एक तकनीक का विमोचन था, जिसका नाम एक प्रसिद्ध फोटोग्राफर - एंसेल के नाम पर रखा गया था। खेल लंबे समय से न केवल खेल रहे हैं, बल्कि विभिन्न रचनात्मक व्यक्तित्वों के लिए चंचल हाथों का उपयोग करने का स्थान भी रहे हैं। कोई गेम के लिए स्क्रिप्ट बदलता है, कोई गेम के लिए उच्च-गुणवत्ता वाले टेक्सचर सेट जारी करता है, और कोई सुंदर स्क्रीनशॉट बनाता है।

एनवीडिया ने प्रस्तुत करके बाद वाले की मदद करने का फैसला किया नया मंचबनाने के लिए (अर्थात्, बनाएं, क्योंकि यह इतनी आसान प्रक्रिया नहीं है) खेलों से उच्च गुणवत्ता वाले शॉट्स। उनका मानना ​​है कि एंसल एक नई तरह की समकालीन कला बनाने में मदद कर सकता है। आखिरकार, पहले से ही काफी कलाकार हैं जो अपना अधिकांश जीवन पीसी पर बिताते हैं, गेम से सुंदर स्क्रीनशॉट बनाते हैं, और उनके पास अभी भी इसके लिए एक सुविधाजनक उपकरण नहीं है।

Ansel आपको न केवल खेल में एक छवि को कैप्चर करने की अनुमति देता है, बल्कि इसे निर्माता की आवश्यकता के अनुसार बदल देता है। इस तकनीक का उपयोग करके, आप कैमरे को दृश्य के चारों ओर घुमा सकते हैं, घुमा सकते हैं और फ्रेम की वांछित संरचना प्राप्त करने के लिए इसे किसी भी दिशा में झुका सकते हैं। उदाहरण के लिए, प्रथम-व्यक्ति निशानेबाजों जैसे खेलों में, आप केवल खिलाड़ी को स्थानांतरित कर सकते हैं, आप वास्तव में कुछ और नहीं बदल सकते हैं, इसलिए सभी स्क्रीनशॉट बहुत नीरस हैं। Ansel में एक निःशुल्क कैमरे के साथ, आप बहुत आगे जा सकते हैं गेम कैमरा, एक अच्छी तस्वीर के लिए आवश्यक कोण का चयन करना, या यहां तक ​​कि आवश्यक बिंदु से एक पूर्ण 360-डिग्री स्टीरियो छवि को कैप्चर करना, और बाद में VR हेलमेट में देखने के लिए उच्च रिज़ॉल्यूशन में।

Ansel काफी सरलता से काम करता है - Nvidia के एक विशेष पुस्तकालय की मदद से, यह प्लेटफ़ॉर्म गेम कोड में अंतर्निहित है। ऐसा करने के लिए, इसके डेवलपर को केवल एनवीडिया वीडियो ड्राइवर को बफर और शेडर डेटा को इंटरसेप्ट करने की अनुमति देने के लिए अपने प्रोजेक्ट में कोड का एक छोटा सा टुकड़ा जोड़ना होगा। बहुत कम काम किया जाना है, एंसेल को खेल में लाने में एक दिन से भी कम समय लगता है। इसलिए, द विटनेस में इस फीचर को शामिल करने में कोड की लगभग 40 लाइनें और द विचर 3 में - कोड की लगभग 150 लाइनें शामिल थीं।

एंसल एक ओपन डेवलपमेंट पैकेज - एसडीके के साथ आएगा। मुख्य बात यह है कि उपयोगकर्ता को उसके साथ सेटिंग्स का एक मानक सेट मिलता है जो उसे कैमरे की स्थिति और कोण को बदलने, प्रभाव जोड़ने आदि की अनुमति देता है। एंसल प्लेटफॉर्म इस तरह काम करता है: यह खेल को रोकता है, मुफ्त कैमरा चालू करता है और आपको एक नियमित स्क्रीनशॉट, एक 360-डिग्री छवि, एक स्टीरियो जोड़ी, या केवल उच्च रिज़ॉल्यूशन के पैनोरमा के रूप में परिणाम रिकॉर्ड करके फ़्रेम को वांछित दृश्य में बदलने की अनुमति देता है।

एकमात्र चेतावनी यह है कि सभी गेम को Ansel गेम स्क्रीनशॉट प्लेटफॉर्म की सभी विशेषताओं के लिए समर्थन प्राप्त नहीं होगा। कुछ गेम डेवलपर्स, एक कारण या किसी अन्य के लिए, अपने गेम में पूरी तरह से मुफ्त कैमरा शामिल नहीं करना चाहते हैं - उदाहरण के लिए, इस कार्यक्षमता का उपयोग करने वाले धोखेबाजों की संभावना के कारण। या वे उसी कारण से व्यूइंग एंगल में बदलाव को सीमित करना चाहते हैं - ताकि किसी को अनुचित लाभ न मिले। ठीक है, या इसलिए कि उपयोगकर्ता पृष्ठभूमि में दयनीय स्प्राइट नहीं देखते हैं। यह सब गेम क्रिएटर्स की काफी सामान्य इच्छाएं हैं।

Ansel की सबसे दिलचस्प विशेषताओं में से एक केवल विशाल रिज़ॉल्यूशन के स्क्रीनशॉट का निर्माण है। इससे कोई फर्क नहीं पड़ता कि खेल 4K तक के प्रस्तावों का समर्थन करता है, उदाहरण के लिए, और उपयोगकर्ता का मॉनिटर फुल एचडी है। स्क्रीनशॉट प्लेटफॉर्म का उपयोग करके, आप ड्राइव के आकार और प्रदर्शन के बजाय सीमित उच्च गुणवत्ता वाली छवि कैप्चर कर सकते हैं। प्लेटफ़ॉर्म 4.5 गीगापिक्सेल तक के स्क्रीनशॉट को आसानी से कैप्चर करता है, 3600 टुकड़ों से एक साथ सिला जाता है!

यह स्पष्ट है कि ऐसी तस्वीरों में आप दूरी में पड़े अखबारों पर पाठ तक सभी विवरण देख सकते हैं, यदि खेल में सिद्धांत रूप में इस तरह के स्तर का विवरण प्रदान किया जाता है - एंसल विवरण के स्तर को भी नियंत्रित कर सकता है, सेटिंग सर्वोत्तम चित्र गुणवत्ता प्राप्त करने के लिए अधिकतम स्तर। लेकिन आप अभी भी सुपरसैंपलिंग को सक्षम कर सकते हैं। यह सब आपको उन खेलों से चित्र बनाने की अनुमति देता है जिन्हें आप बड़े बैनर पर सुरक्षित रूप से प्रिंट कर सकते हैं और उनकी गुणवत्ता के बारे में शांत रह सकते हैं।

दिलचस्प बात यह है कि बड़ी छवियों को सिलने के लिए CUDA पर आधारित एक विशेष हार्डवेयर-त्वरित कोड का उपयोग किया जाता है। आखिरकार, कोई भी वीडियो कार्ड बहु-गीगापिक्सेल छवि को उसकी संपूर्णता में प्रस्तुत नहीं कर सकता है, लेकिन यह इसे टुकड़ों में कर सकता है, जिसे आपको बाद में संयोजित करने की आवश्यकता है, प्रकाश, रंग, और इसी तरह के संभावित अंतर को ध्यान में रखते हुए।

इस तरह के पैनोरमा को सिलाई करने के बाद, पूरे फ्रेम के लिए एक विशेष पोस्ट-प्रोसेसिंग का उपयोग किया जाता है, जिसे GPU पर भी त्वरित किया जाता है। और उच्च गतिशील रेंज में छवियों को कैप्चर करने के लिए, आप एक विशेष छवि प्रारूप का उपयोग कर सकते हैं - EXR, औद्योगिक प्रकाश और जादू से एक खुला मानक, प्रत्येक चैनल में रंग मान जिनमें से 16-बिट फ्लोटिंग पॉइंट प्रारूप में दर्ज किए गए हैं (एफपी16)।

यह प्रारूप आपको चमक बदलने की अनुमति देता है और डानामिक रेंजछवियों को पोस्ट-प्रोसेसिंग द्वारा, प्रत्येक विशिष्ट डिस्प्ले के लिए इसे उसी तरह दाईं ओर लाया जाता है जैसे यह कैमरों से रॉ प्रारूपों के साथ किया जाता है। और छवि प्रसंस्करण कार्यक्रमों में पोस्ट-प्रोसेसिंग फिल्टर के बाद के उपयोग के लिए, यह प्रारूप बहुत उपयोगी है, क्योंकि इसमें सामान्य छवि प्रारूपों की तुलना में बहुत अधिक डेटा होता है।

लेकिन एंसल प्लेटफॉर्म में ही बहुत सारे पोस्ट-प्रोसेसिंग फिल्टर होते हैं, जो विशेष रूप से महत्वपूर्ण है क्योंकि इसकी न केवल अंतिम छवि तक पहुंच है, बल्कि गेम द्वारा उपयोग किए जाने वाले सभी बफ़र्स तक भी पहुंच है, जिसका उपयोग बहुत दिलचस्प प्रभावों के लिए किया जा सकता है। , क्षेत्र की गहराई की तरह। ऐसा करने के लिए, एंसल के पास एक विशेष पोस्ट-प्रोसेसिंग एपीआई है, और इस प्लेटफॉर्म के समर्थन के साथ किसी भी प्रभाव को गेम में शामिल किया जा सकता है।

Ansel पोस्ट-फ़िल्टर में शामिल हैं: कलर कर्व्स, कलर स्पेस, ट्रांसफ़ॉर्मेशन, डिसैचुरेशन, ब्राइटनेस / कंट्रास्ट, फ़िल्म ग्रेन, ब्लूम, लेंस फ़्लेयर, एनामॉर्फिक ग्लेयर, डिस्टॉर्शन, हीथज़, फ़िशआई, कलर एबेरेशन, टोन मैपिंग, लेंस डर्ट, लाइटशाफ्ट, विगनेट, गामा करेक्शन, कनवल्शन, शार्पनिंग, एज डिटेक्शन, ब्लर, सीपिया, डेनोइस, एफएक्सएए और अन्य।

खेलों में एंसल समर्थन की उपस्थिति के लिए, हमें तब तक थोड़ा इंतजार करना होगा जब तक कि डेवलपर्स इसे लागू न करें और इसका परीक्षण न करें। लेकिन एनवीडिया ने वादा किया है कि इस तरह के समर्थन जल्द ही द डिवीजन, द विटनेस, लॉब्रेकर्स, द विचर 3, पैरागॉन, फ़ोर्टनाइट, ऑबडक्शन, नो मैन्स स्काई, अवास्तविक टूर्नामेंट और अन्य जैसे प्रसिद्ध खेलों में दिखाई देंगे।

नई 16nm FinFET प्रक्रिया प्रौद्योगिकी और वास्तुकला अनुकूलन ने GP104 GPU पर आधारित GeForce GTX 1080 ग्राफिक्स कार्ड को संदर्भ रूप में भी 1.6-1.7 GHz की उच्च घड़ी की गति प्राप्त करने की अनुमति दी है, और नई पीढ़ी खेलों में उच्चतम संभव आवृत्तियों की गारंटी देती है। जीपीयू बूस्ट टेक्नोलॉजीज। निष्पादन इकाइयों की बढ़ी हुई संख्या के साथ, ये सुधार न केवल इसे अब तक का उच्चतम प्रदर्शन करने वाला सिंगल-चिप ग्राफिक्स कार्ड बनाते हैं, बल्कि बाजार पर सबसे अधिक ऊर्जा कुशल समाधान भी बनाते हैं।

GeForce GTX 1080 पहला ग्राफिक्स कार्ड है जिसमें नई GDDR5X ग्राफिक्स मेमोरी, उच्च गति वाले चिप्स की एक नई पीढ़ी है जो बहुत उच्च डेटा दर प्राप्त करती है। संशोधित GeForce GTX 1080 के मामले में, इस प्रकार की मेमोरी 10 GHz की प्रभावी आवृत्ति पर काम करती है। बेहतर फ्रेमबफर संपीड़न एल्गोरिदम के साथ संयुक्त, इसके परिणामस्वरूप इस GPU के लिए अपने प्रत्यक्ष पूर्ववर्ती, GeForce GTX 980 की तुलना में प्रभावी मेमोरी बैंडविड्थ में 1.7x की वृद्धि हुई।

एनवीडिया ने विवेकपूर्ण ढंग से अपने लिए पूरी तरह से नई प्रक्रिया प्रौद्योगिकी पर एक मौलिक नई वास्तुकला जारी नहीं करने का निर्णय लिया, ताकि विकास और उत्पादन के दौरान अनावश्यक समस्याओं का सामना न करना पड़े। इसके बजाय, उन्होंने कुछ सुविधाओं को जोड़कर पहले से ही अच्छी और बहुत कुशल मैक्सवेल वास्तुकला में गंभीरता से सुधार किया। नतीजतन, नए GPU के उत्पादन के साथ सब कुछ ठीक है, और GeForce GTX 1080 मॉडल के मामले में, इंजीनियरों ने बहुत उच्च आवृत्ति क्षमता हासिल की है - भागीदारों से ओवरक्लॉक किए गए संस्करणों में, GPU आवृत्ति 2 GHz तक होने की उम्मीद है! पास्कल जीपीयू के विकास में एनवीडिया इंजीनियरों की सही तकनीकी प्रक्रिया और श्रमसाध्य कार्य के लिए इस तरह की प्रभावशाली आवृत्ति एक वास्तविकता बन गई है।

और जबकि पास्कल मैक्सवेल का प्रत्यक्ष अनुयायी है, और ये ग्राफिक्स आर्किटेक्चर मौलिक रूप से एक दूसरे से बहुत अलग नहीं हैं, एनवीडिया ने कई बदलाव और सुधार पेश किए हैं, जिसमें प्रदर्शन क्षमताएं, वीडियो एन्कोडिंग और डिकोडिंग इंजन, विभिन्न प्रकार की गणनाओं के बेहतर अतुल्यकालिक निष्पादन शामिल हैं। GPU ने मल्टी-चिप रेंडरिंग में बदलाव किए और एक नई सिंक्रोनाइज़ेशन विधि, Fast Sync पेश की।

एक साथ मल्टी-प्रोजेक्शन तकनीक को उजागर करना असंभव नहीं है, जो वर्चुअल रियलिटी सिस्टम में प्रदर्शन को बेहतर बनाने में मदद करता है, मल्टी-मॉनिटर सिस्टम पर दृश्यों का अधिक सही प्रदर्शन प्राप्त करता है, और नई प्रदर्शन अनुकूलन तकनीकों को पेश करता है। लेकिन वीआर अनुप्रयोगों में सबसे अधिक गति में वृद्धि देखने को मिलेगी जब वे बहु-प्रक्षेपण प्रौद्योगिकी का समर्थन करते हैं, जो ज्यामितीय डेटा को संसाधित करते समय और प्रति-पिक्सेल गणना में डेढ़ गुना तक GPU संसाधनों को बचाने में मदद करता है।

विशुद्ध रूप से सॉफ़्टवेयर परिवर्तनों के बीच, Ansel नामक गेम में स्क्रीनशॉट बनाने का प्लेटफ़ॉर्म सबसे अलग है - इसे न केवल उन लोगों के लिए व्यवहार में आज़माना दिलचस्प होगा, जो बहुत खेलते हैं, बल्कि उन लोगों के लिए भी जो केवल उच्च-गुणवत्ता वाले 3D ग्राफिक्स में रुचि रखते हैं। . नवीनता आपको स्क्रीनशॉट बनाने और नए स्तर पर रीटच करने की कला को आगे बढ़ाने की अनुमति देती है। खैर, गेम डेवलपर्स के लिए गेमवर्क्स और वीआरवर्क्स, एनवीडिया जैसे पैकेजों में कदम दर कदम सुधार जारी है - इसलिए, बाद में, उच्च-गुणवत्ता वाली ध्वनि गणना की एक दिलचस्प संभावना दिखाई दी, हार्डवेयर रे का उपयोग करके ध्वनि तरंगों के कई प्रतिबिंबों को ध्यान में रखते हुए अनुरेखण।

सामान्य तौर पर, Nvidia GeForce GTX 1080 वीडियो कार्ड के रूप में, एक वास्तविक नेता ने बाजार में प्रवेश किया, इसके लिए सभी आवश्यक गुण थे: उच्च प्रदर्शन और व्यापक कार्यक्षमता, साथ ही नई सुविधाओं और एल्गोरिदम के लिए समर्थन। इस वीडियो कार्ड के पहले खरीदार तुरंत उल्लिखित कई लाभों की सराहना करने में सक्षम होंगे, और समाधान की अन्य संभावनाएं थोड़ी देर बाद सामने आएंगी, जब बाहर से व्यापक समर्थन मिलेगा। सॉफ्टवेयर. मुख्य बात यह है कि GeForce GTX 1080 बहुत तेज और कुशल निकला, और, जैसा कि हम वास्तव में आशा करते हैं, एनवीडिया इंजीनियरों ने कुछ समस्या क्षेत्रों (समान अतुल्यकालिक गणना) को ठीक करने में कामयाबी हासिल की।

ग्राफिक्स त्वरक GeForce GTX 1070

पैरामीटरअर्थ
चिप कोड नामGP104
उत्पादन प्रौद्योगिकी16एनएम फिनफेट
ट्रांजिस्टर की संख्या7.2 अरब
मूल भाग314 मिमी²
आर्किटेक्चरकई प्रकार के डेटा के स्ट्रीम प्रोसेसिंग के लिए सामान्य प्रोसेसर की एक सरणी के साथ एकीकृत: कोने, पिक्सेल, आदि।
डायरेक्टएक्स हार्डवेयर सपोर्टDirectX 12, फ़ीचर स्तर 12_1 . के समर्थन के साथ
मेमोरी बस256-बिट: GDDR5 और GDDR5X मेमोरी का समर्थन करने वाले आठ स्वतंत्र 32-बिट मेमोरी कंट्रोलर
GPU आवृत्ति1506 (1683) मेगाहर्ट्ज
कंप्यूटिंग ब्लॉकआईईईई 754-2008 मानक के ढांचे के भीतर फ्लोटिंग पॉइंट गणना के लिए 1920 (256 में से) स्केलर एएलयू सहित 15 सक्रिय (चिप में 20 में से) स्ट्रीमिंग मल्टीप्रोसेसर;
बनावट ब्लॉक120 सक्रिय (चिप में 160 में से) बनावट में FP16 और FP32 घटकों के समर्थन के साथ टेक्सचर एड्रेसिंग और फ़िल्टरिंग इकाइयाँ और सभी बनावट स्वरूपों के लिए ट्रिलिनियर और अनिसोट्रोपिक फ़िल्टरिंग के लिए समर्थन
रेखापुंज संचालन इकाइयां (आरओपी)प्रोग्राम करने योग्य और FP16 या FP32 फ्रेम बफर प्रारूप सहित विभिन्न एंटी-अलियासिंग मोड के समर्थन के साथ 8 चौड़े आरओपी (64 पिक्सल)। ब्लॉक में विन्यास योग्य एएलयू की एक सरणी होती है और गहराई निर्माण और तुलना, बहु-नमूनाकरण और सम्मिश्रण के लिए जिम्मेदार होते हैं।
मॉनिटर समर्थनडुअल लिंक डीवीआई, एचडीएमआई 2.0 बी और डिस्प्लेपोर्ट 1.2 (1.3/1.4 रेडी) के माध्यम से जुड़े अधिकतम चार मॉनिटरों के लिए एकीकृत समर्थन

GeForce GTX 1070 संदर्भ ग्राफिक्स निर्दिष्टीकरण
पैरामीटरअर्थ
कोर आवृत्ति1506 (1683) मेगाहर्ट्ज
यूनिवर्सल प्रोसेसर की संख्या1920
बनावट ब्लॉकों की संख्या120
सम्मिश्रण ब्लॉकों की संख्या64
प्रभावी स्मृति आवृत्ति8000 (4×2000) मेगाहर्ट्ज
मेमोरी प्रकारजीडीडीआर5
मेमोरी बस256-बिट
स्मृति8 जीबी
मेमोरी बैंडविड्थ256 जीबी/एस
कम्प्यूटिंग प्रदर्शन (FP32)लगभग 6.5 टेराफ्लॉप्स
सैद्धांतिक अधिकतम भरण दर96 गीगापिक्सेल/सेक
सैद्धांतिक बनावट नमूनाकरण दर181 गीगाटेक्सेल/सेक
थका देनापीसीआई एक्सप्रेस 3.0
कनेक्टर्सएक डुअल लिंक डीवीआई, एक एचडीएमआई और तीन डिस्प्लेपोर्ट
शक्ति का उपयोग150 डब्ल्यू . तक
अतिरिक्त भोजनएक 8-पिन कनेक्टर
सिस्टम चेसिस में व्याप्त स्लॉट्स की संख्या2
अनुशंसित मूल्य$379-449 (अमेरिका), 34,990 (रूस)

GeForce GTX 1070 वीडियो कार्ड को भी पिछली GeForce श्रृंखला के समान समाधान के समान तार्किक नाम मिला है। यह अपने प्रत्यक्ष पूर्ववर्ती GeForce GTX 970 से केवल एक परिवर्तित पीढ़ी के आंकड़े में भिन्न है। नवीनता कंपनी की वर्तमान लाइन में वर्तमान शीर्ष समाधान GeForce GTX 1080 से एक कदम नीचे बन जाती है, जो और भी अधिक शक्तिशाली GPU समाधान जारी होने तक नई श्रृंखला का अस्थायी फ्लैगशिप बन गया।

एनवीडिया के नए शीर्ष वीडियो कार्ड के लिए अनुशंसित मूल्य क्रमशः एनवीडिया पार्टनर्स और संस्थापक संस्करण के लिए $ 379 और $ 449 हैं। शीर्ष मॉडल की तुलना में, यह बहुत है अच्छा मूल्ययह देखते हुए कि सबसे खराब स्थिति में GTX 1070 लगभग 25% पीछे है। और घोषणा और रिलीज के समय, GTX 1070 अपनी कक्षा में सर्वश्रेष्ठ प्रदर्शन समाधान बन जाता है। GeForce GTX 1080 की तरह, GTX 1070 का AMD से कोई प्रत्यक्ष प्रतियोगी नहीं है, और इसकी तुलना केवल Radeon R9 390X और Fury से की जा सकती है।

GeForce GTX 1070 संशोधन में GP104 GPU ने एक पूर्ण 256-बिट मेमोरी बस को छोड़ने का फैसला किया, हालांकि उन्होंने एक नए प्रकार की GDDR5X मेमोरी का उपयोग नहीं किया, लेकिन एक बहुत तेज़ GDDR5, जो 8 GHz की उच्च प्रभावी आवृत्ति पर संचालित होता है। ऐसी बस के साथ वीडियो कार्ड पर स्थापित मेमोरी की मात्रा 4 या 8 जीबी हो सकती है, और उच्च सेटिंग्स और रेंडरिंग रिज़ॉल्यूशन की स्थितियों में नए समाधान के अधिकतम प्रदर्शन को सुनिश्चित करने के लिए, GeForce GTX 1070 वीडियो कार्ड मॉडल भी सुसज्जित था। 8 जीबी वीडियो मेमोरी के साथ, अपनी बड़ी बहन की तरह। यह वॉल्यूम किसी भी 3D एप्लिकेशन को कई वर्षों तक अधिकतम गुणवत्ता सेटिंग्स के साथ चलाने के लिए पर्याप्त है।

GeForce GTX 1070 संस्थापक संस्करण

मई की शुरुआत में GeForce GTX 1080 की घोषणा के साथ, फाउंडर्स एडिशन नामक वीडियो कार्ड के एक विशेष संस्करण की घोषणा की गई, जिसकी कंपनी के भागीदारों से नियमित वीडियो कार्ड की तुलना में अधिक कीमत है। यही बात नवीनता पर भी लागू होती है। इस लेख में, हम फिर से GeForce GTX 1070 वीडियो कार्ड के एक विशेष संस्करण के बारे में बात करेंगे जिसे फाउंडर्स एडिशन कहा जाता है। पुराने मॉडल की तरह, एनवीडिया ने निर्माता के संदर्भ वीडियो कार्ड के इस संस्करण को अधिक कीमत पर जारी करने का निर्णय लिया। उनका दावा है कि कई गेमर्स और उत्साही जो महंगे टॉप-एंड ग्राफिक्स कार्ड खरीदते हैं, वे एक उपयुक्त "प्रीमियम" लुक और फील वाला उत्पाद चाहते हैं।

तदनुसार, यह ऐसे उपयोगकर्ताओं के लिए है कि GeForce GTX 1070 फाउंडर्स एडिशन वीडियो कार्ड बाजार में जारी किया जाएगा, जिसे प्रीमियम सामग्री और घटकों से Nvidia इंजीनियरों द्वारा डिजाइन और निर्मित किया गया है, जैसे कि GeForce GTX 1070 फाउंडर्स एडिशन एल्यूमीनियम कवर, साथ ही साथ एक लो-प्रोफाइल बैक प्लेट के रूप में जो पीसीबी के पिछले हिस्से को कवर करती है और उत्साही लोगों के बीच काफी लोकप्रिय है।

जैसा कि आप बोर्ड की तस्वीरों से देख सकते हैं, GeForce GTX 1070 फाउंडर्स एडिशन को GeForce GTX 1080 फाउंडर्स एडिशन के संदर्भ संस्करण से बिल्कुल वैसा ही औद्योगिक डिज़ाइन विरासत में मिला है। दोनों मॉडल एक रेडियल पंखे का उपयोग करते हैं जो गर्म हवा को बाहर निकालता है, जो छोटे मामलों और सीमित भौतिक स्थान के साथ मल्टी-चिप एसएलआई कॉन्फ़िगरेशन दोनों में बहुत उपयोगी है। मामले के अंदर प्रसारित करने के बजाय गर्म हवा को बाहर निकालने से, आप थर्मल तनाव को कम कर सकते हैं, ओवरक्लॉकिंग परिणामों में सुधार कर सकते हैं और सिस्टम घटकों के जीवन का विस्तार कर सकते हैं।

GeForce GTX 1070 रेफरेंस कूलिंग सिस्टम के कवर के नीचे, तीन बिल्ट-इन कॉपर हीट पाइप के साथ एक विशेष रूप से आकार का एल्यूमीनियम रेडिएटर है जो GPU से ही गर्मी को दूर करता है। गर्मी पाइपों द्वारा समाप्त गर्मी को फिर एल्यूमीनियम हीटसिंक द्वारा नष्ट कर दिया जाता है। खैर, बोर्ड के पीछे लो-प्रोफाइल मेटल प्लेट को भी बेहतर थर्मल प्रदर्शन प्रदान करने के लिए डिज़ाइन किया गया है। इसमें SLI कॉन्फ़िगरेशन में कई ग्राफिक्स कार्ड के बीच बेहतर एयरफ्लो के लिए एक वापस लेने योग्य अनुभाग भी है।

बोर्ड के पावर सिस्टम के लिए, GeForce GTX 1070 फाउंडर्स एडिशन में स्थिर बिजली आपूर्ति के लिए अनुकूलित चार-चरण बिजली प्रणाली है। एनवीडिया का दावा है कि जीटीएक्स 1070 फाउंडर्स एडिशन में विशेष घटकों के उपयोग ने जीईफ़ोर्स जीटीएक्स 970 की तुलना में बिजली दक्षता, स्थिरता और विश्वसनीयता में सुधार किया है, जो बेहतर ओवरक्लॉकिंग प्रदर्शन प्रदान करता है। कंपनी के अपने परीक्षणों में, GeForce GTX 1070 GPU आसानी से 1.9 GHz को पार कर गया, जो पुराने GTX 1080 मॉडल के परिणामों के करीब है।

Nvidia GeForce GTX 1070 ग्राफिक्स कार्ड 10 जून से रिटेल स्टोर्स पर उपलब्ध होगा। GeForce GTX 1070 फाउंडर्स एडिशन और पार्टनर सॉल्यूशंस के लिए अनुशंसित मूल्य अलग-अलग हैं, और यह इस विशेष संस्करण के लिए मुख्य प्रश्न है। अगर एनवीडिया पार्टनर अपने GeForce GTX 1070 ग्राफिक्स कार्ड को $379 (अमेरिकी बाजार में) से शुरू करते हैं, तो Nvidia के रेफरेंस डिजाइन फाउंडर्स एडिशन की कीमत $449 जितनी कम होगी। क्या ऐसे कई उत्साही लोग हैं जो संदर्भ संस्करण के संदिग्ध लाभों के लिए अधिक भुगतान करने के लिए तैयार हैं, आइए इसका सामना करते हैं? समय बताएगा, लेकिन हम मानते हैं कि बिक्री की शुरुआत में खरीद के लिए उपलब्ध विकल्प के रूप में संदर्भ शुल्क अधिक दिलचस्प है, और बाद में इसे खरीदने का बिंदु (और उच्च कीमत पर भी!) पहले से ही शून्य हो गया है।

यह जोड़ा जाना बाकी है कि संदर्भ GeForce GTX 1070 का मुद्रित सर्किट बोर्ड पुराने वीडियो कार्ड के समान है, और ये दोनों कंपनी के पिछले बोर्डों के डिवाइस से भिन्न हैं। नए उत्पाद के लिए सामान्य बिजली खपत मूल्य 150 डब्ल्यू है, जो जीटीएक्स 1080 के मूल्य से लगभग 20% कम है और पिछली पीढ़ी के जीईफ़ोर्स जीटीएक्स 970 वीडियो कार्ड की बिजली खपत के करीब है। एनवीडिया संदर्भ बोर्ड में एक परिचित सेट है छवि आउटपुट उपकरणों को जोड़ने के लिए कनेक्टर्स की संख्या: एक डुअल-लिंक डीवीआई, एक एचडीएमआई और तीन डिस्प्लेपोर्ट। इसके अलावा, नए के लिए समर्थन है एचडीएमआई संस्करणऔर डिस्प्लेपोर्ट, जिसके बारे में हमने ऊपर GTX 1080 मॉडल की समीक्षा में लिखा था।

वास्तु परिवर्तन

GeForce GTX 1070 GP104 चिप पर आधारित है, जो Nvidia के पास्कल ग्राफिक्स आर्किटेक्चर की नई पीढ़ी का पहला है। यह आर्किटेक्चर मैक्सवेल में विकसित समाधानों पर आधारित था, लेकिन इसमें कुछ कार्यात्मक अंतर भी हैं, जिनके बारे में हमने ऊपर विस्तार से लिखा है - शीर्ष GeForce GTX 1080 वीडियो कार्ड के लिए समर्पित भाग में।

नई वास्तुकला का मुख्य परिवर्तन तकनीकी प्रक्रिया थी जिसके द्वारा सभी नए जीपीयू निष्पादित किए जाएंगे। GP104 के उत्पादन में 16 एनएम FinFET निर्माण प्रक्रिया के उपयोग ने अपेक्षाकृत कम क्षेत्र और लागत को बनाए रखते हुए चिप की जटिलता को बढ़ाना संभव बना दिया, और पास्कल आर्किटेक्चर की पहली चिप में निष्पादन की एक बड़ी संख्या है। समान स्थिति वाले मैक्सवेल चिप्स की तुलना में नई कार्यक्षमता प्रदान करने वाली इकाइयां शामिल हैं।

GP104 वीडियो चिप इसके डिज़ाइन में समान मैक्सवेल आर्किटेक्चर समाधानों के समान है, और आप पिछले Nvidia समाधानों की हमारी समीक्षाओं में आधुनिक GPU के डिज़ाइन के बारे में विस्तृत जानकारी पा सकते हैं। पिछले GPU की तरह, नए आर्किटेक्चर के चिप्स में ग्राफिक्स प्रोसेसिंग क्लस्टर (GPC), स्ट्रीमिंग मल्टीप्रोसेसर (SM) और मेमोरी कंट्रोलर का एक अलग कॉन्फ़िगरेशन होगा, और GeForce GTX 1070 में कुछ बदलाव पहले ही हो चुके हैं - चिप का हिस्सा लॉक था और निष्क्रिय (ग्रे में हाइलाइट किया गया):

हालांकि GP104 GPU में चार GPC क्लस्टर और 20 SM मल्टीप्रोसेसर शामिल हैं, GeForce GTX 1070 के संस्करण में इसे हार्डवेयर द्वारा अक्षम एक GPC क्लस्टर के साथ एक स्ट्रिप-डाउन संशोधन प्राप्त हुआ। चूंकि प्रत्येक जीपीसी क्लस्टर में एक समर्पित रास्टरराइजेशन इंजन होता है और इसमें पांच एसएम शामिल होते हैं, और प्रत्येक मल्टीप्रोसेसर में 128 सीयूडीए कोर और आठ बनावट टीएमयू होते हैं, 1920 सीयूडीए कोर और 2560 स्ट्रीम प्रोसेसर के 120 टीएमयू जीपी 104 और 160 भौतिक बनावट इकाइयों के इस संस्करण में सक्रिय हैं।

ग्राफिक्स प्रोसेसर जिस पर GeForce GTX 1070 आधारित है, उसमें आठ 32-बिट मेमोरी कंट्रोलर होते हैं, जिसके परिणामस्वरूप कुल 256-बिट मेमोरी बस होती है - बिल्कुल पुराने GTX 1080 मॉडल की तरह। मेमोरी सबसिस्टम को क्रम में ट्रिम नहीं किया गया है GeForce GTX 1070 में GDDR5 मेमोरी का उपयोग करने की शर्त के साथ पर्याप्त रूप से उच्च बैंडविड्थ मेमोरी प्रदान करने के लिए। प्रत्येक मेमोरी कंट्रोलर में आठ ROP और 256 KB L2 कैश होते हैं, इसलिए इस संशोधन में GP104 चिप में 64 ROP और 2048 KB भी होते हैं। L2 कैश स्तर।

वास्तु अनुकूलन और एक नई प्रक्रिया प्रौद्योगिकी के लिए धन्यवाद, GP104 GPU अब तक का सबसे अधिक ऊर्जा कुशल GPU बन गया है। एनवीडिया इंजीनियरों ने एक नई प्रक्रिया में जाने पर अपेक्षा से अधिक घड़ी की गति को बढ़ाने में सक्षम थे, जिसके लिए उन्हें कड़ी मेहनत करनी पड़ी, पिछले समाधानों की सभी बाधाओं की सावधानीपूर्वक जांच और अनुकूलन करना था जो उन्हें उच्च आवृत्ति पर काम करने की अनुमति नहीं देते थे। तदनुसार, GeForce GTX 1070 भी बहुत उच्च आवृत्ति पर संचालित होता है, GeForce GTX 970 के संदर्भ मूल्य से 40% अधिक है।

चूंकि GeForce GTX 1070, संक्षेप में, GDDR5 मेमोरी के साथ थोड़ा कम उत्पादक GTX 1080 है, यह उन सभी तकनीकों का समर्थन करता है जिनका हमने पिछले भाग में वर्णन किया था। पास्कल आर्किटेक्चर के साथ-साथ इसके द्वारा समर्थित तकनीकों के बारे में अधिक जानकारी के लिए, जैसे कि बेहतर आउटपुट और वीडियो प्रोसेसिंग यूनिट, Async कंप्यूट सपोर्ट, एक साथ मल्टी-प्रोजेक्शन तकनीक, SLI मल्टी-चिप रेंडरिंग में बदलाव और नया फास्ट सिंक सिंक्रोनाइज़ेशन प्रकार , यह GTX 1080 पर एक अनुभाग के साथ पढ़ने लायक है।

उच्च-प्रदर्शन GDDR5 मेमोरी और इसका कुशल उपयोग

हमने ऊपर GP104 GPU के मेमोरी सबसिस्टम में बदलाव के बारे में लिखा है, जिस पर GeForce GTX 1080 और GTX 1070 मॉडल आधारित हैं - इस GPU में शामिल मेमोरी कंट्रोलर दोनों नए प्रकार की GDDR5X वीडियो मेमोरी का समर्थन करते हैं, जिसका विस्तार से वर्णन किया गया है GTX 1080 की समीक्षा, साथ ही साथ अच्छी पुरानी GDDR5 मेमोरी जिसे हम कई वर्षों से जानते हैं।

पुराने GTX 1080 की तुलना में छोटे GTX 1070 में मेमोरी बैंडविड्थ में बहुत अधिक नहीं खोने के लिए, सभी आठ 32-बिट मेमोरी नियंत्रकों को इसमें सक्रिय छोड़ दिया गया था, एक पूर्ण 256-बिट सामान्य वीडियो मेमोरी इंटरफ़ेस प्राप्त कर रहा था। इसके अलावा, वीडियो कार्ड बाजार में उपलब्ध सबसे तेज GDDR5 मेमोरी से लैस था - 8 GHz की प्रभावी ऑपरेटिंग आवृत्ति के साथ। यह सब पुराने समाधान के लिए 320 जीबी / एस के विपरीत 256 जीबी / एस की मेमोरी बैंडविड्थ प्रदान करता है - कंप्यूटिंग क्षमताओं को लगभग उसी राशि से काट दिया गया था, इसलिए संतुलन बनाए रखा गया था।

ध्यान रखें कि GPU प्रदर्शन के लिए चरम सैद्धांतिक बैंडविड्थ महत्वपूर्ण है, लेकिन आपको इसकी दक्षता पर भी ध्यान देने की आवश्यकता है। रेंडरिंग प्रक्रिया के दौरान, कई अलग-अलग अड़चनें समग्र प्रदर्शन को सीमित कर सकती हैं, जिससे सभी उपलब्ध मेमोरी बैंडविड्थ के उपयोग को रोका जा सकता है। इन बाधाओं को कम करने के लिए, GPU डेटा पढ़ने और लिखने की दक्षता में सुधार करने के लिए विशेष दोषरहित डेटा संपीड़न का उपयोग करते हैं।

बफर जानकारी के डेल्टा संपीड़न की चौथी पीढ़ी को पास्कल आर्किटेक्चर में पहले ही पेश किया जा चुका है, जो GPU को वीडियो मेमोरी बस की उपलब्ध क्षमताओं का अधिक कुशलता से उपयोग करने की अनुमति देता है। GeForce GTX 1070 और GTX 1080 में मेमोरी सबसिस्टम बैंडविड्थ आवश्यकताओं को कम करने के लिए डिज़ाइन की गई पुरानी और कई नई दोषरहित डेटा संपीड़न तकनीकों का उपयोग करता है। यह मेमोरी में लिखे गए डेटा की मात्रा को कम करता है, L2 कैश दक्षता में सुधार करता है, और GPU पर विभिन्न बिंदुओं जैसे TMU और फ्रेमबफ़र के बीच भेजे गए डेटा की मात्रा को कम करता है।

GPU बूस्ट 3.0 और ओवरक्लॉकिंग सुविधाएँ

अधिकांश एनवीडिया भागीदारों ने पहले ही GeForce GTX 1080 और GTX 1070 पर आधारित फैक्ट्री ओवरक्लॉक्ड समाधानों की घोषणा कर दी है। विशेष उपयोगिताओंओवरक्लॉकिंग के लिए, आपको GPU बूस्ट 3.0 तकनीक की नई कार्यक्षमता का उपयोग करने की अनुमति देता है। ऐसी उपयोगिताओं का एक उदाहरण ईवीजीए प्रेसिजन एक्सओसी है, जिसमें वोल्टेज-टू-फ़्रीक्वेंसी वक्र निर्धारित करने के लिए एक स्वचालित स्कैनर शामिल है - इस मोड में, प्रत्येक वोल्टेज के लिए, स्थिरता परीक्षण चलाकर, एक स्थिर आवृत्ति पाई जाती है जिस पर जीपीयू एक प्रदान करता है प्रदर्शन को बढ़ावा। हालाँकि, इस वक्र को मैन्युअल रूप से भी बदला जा सकता है।

हम पिछले एनवीडिया ग्राफिक्स कार्ड से जीपीयू बूस्ट तकनीक को अच्छी तरह जानते हैं। अपने GPU में, वे इस हार्डवेयर सुविधा का उपयोग करते हैं, जिसे GPU की ऑपरेटिंग घड़ी की गति को उन मोड में बढ़ाने के लिए डिज़ाइन किया गया है जहां यह अभी तक बिजली की खपत और गर्मी अपव्यय की सीमा तक नहीं पहुंचा है। पास्कल जीपीयू में, इस एल्गोरिदम में कई बदलाव हुए हैं, जिनमें से मुख्य वोल्टेज के आधार पर टर्बो आवृत्तियों की एक बेहतर सेटिंग है।

यदि पहले बेस फ़्रीक्वेंसी और टर्बो फ़्रीक्वेंसी के बीच का अंतर तय किया गया था, तो GPU बूस्ट 3.0 में प्रत्येक वोल्टेज के लिए अलग से टर्बो फ़्रीक्वेंसी ऑफ़सेट सेट करना संभव हो गया। अब प्रत्येक व्यक्तिगत वोल्टेज मान के लिए टर्बो आवृत्ति सेट की जा सकती है, जो आपको GPU से सभी ओवरक्लॉकिंग क्षमताओं को पूरी तरह से निचोड़ने की अनुमति देती है। हमने इस सुविधा के बारे में GeForce GTX 1080 समीक्षा में विस्तार से लिखा है, और आप इसके लिए EVGA प्रेसिजन XOC और MSI आफ्टरबर्नर उपयोगिताओं का उपयोग कर सकते हैं।

चूंकि GPU बूस्ट 3.0 के समर्थन के साथ वीडियो कार्ड जारी करने के साथ ओवरक्लॉकिंग पद्धति में कुछ विवरण बदल गए हैं, इसलिए एनवीडिया को नए उत्पादों को ओवरक्लॉक करने के निर्देशों में अतिरिक्त स्पष्टीकरण देना पड़ा। विभिन्न चर विशेषताओं के साथ अलग-अलग ओवरक्लॉकिंग तकनीकें हैं जो अंतिम परिणाम को प्रभावित करती हैं। प्रत्येक विशिष्ट प्रणाली के लिए, एक विशेष विधि बेहतर अनुकूल हो सकती है, लेकिन मूल बातें हमेशा समान होती हैं।

कई ओवरक्लॉकर सिस्टम स्थिरता की जांच करने के लिए यूनिगिन हेवन 4.0 बेंचमार्क का उपयोग करते हैं, जो GPU को अच्छी तरह से लोड करता है, इसमें लचीली सेटिंग्स होती हैं और इसे विंडो मोड में चलाया जा सकता है, साथ ही पास में एक ओवरक्लॉकिंग और मॉनिटरिंग यूटिलिटी विंडो, जैसे EVGA प्रेसिजन या MSI आफ्टरबर्नर। हालाँकि, इस तरह की जाँच केवल प्रारंभिक अनुमानों के लिए पर्याप्त है, और ओवरक्लॉकिंग की स्थिरता की दृढ़ता से पुष्टि करने के लिए, इसे कई गेमिंग अनुप्रयोगों में जाँचना चाहिए, क्योंकि विभिन्न खेलों को GPU की विभिन्न कार्यात्मक इकाइयों पर अलग-अलग भार की आवश्यकता होती है: गणितीय, बनावट, ज्यामितीय। हेवन 4.0 बेंचमार्क ओवरक्लॉकिंग के लिए भी सुविधाजनक है क्योंकि इसमें ऑपरेशन का लूप मोड है, जिसमें ओवरक्लॉकिंग सेटिंग्स को बदलना सुविधाजनक है, और गति वृद्धि का मूल्यांकन करने के लिए एक बेंचमार्क है।

Nvidia नए GeForce GTX 1080 और GTX 1070 ग्राफिक्स कार्ड को ओवरक्लॉक करते समय स्वर्ग 4.0 और EVGA प्रेसिजन XOC विंडो को एक साथ चलाने की सलाह देता है। सबसे पहले, पंखे की गति को तुरंत बढ़ाना वांछनीय है। और गंभीर ओवरक्लॉकिंग के लिए, आप तुरंत गति मान को 100% पर सेट कर सकते हैं, जिससे वीडियो कार्ड बहुत तेज़ हो जाएगा, लेकिन यह तापमान को न्यूनतम संभव तक कम करके जितना संभव हो सके GPU और वीडियो कार्ड के अन्य घटकों को ठंडा कर देगा। स्तर, थ्रॉटलिंग को रोकना (एक निश्चित मूल्य से ऊपर GPU तापमान में वृद्धि के कारण आवृत्तियों में कमी)।

इसके बाद, आपको लक्ष्य शक्ति मान (पावर लक्ष्य) को भी अधिकतम पर सेट करने की आवश्यकता है। यह सेटिंग GPU को बिजली की खपत के स्तर और GPU के लक्ष्य तापमान (GPU Temp लक्ष्य) को बढ़ाकर अधिकतम संभव शक्ति प्रदान करेगी। कुछ उद्देश्यों के लिए, दूसरे मान को पावर लक्ष्य परिवर्तन से अलग किया जा सकता है, और फिर इन सेटिंग्स को व्यक्तिगत रूप से समायोजित किया जा सकता है - उदाहरण के लिए, वीडियो चिप के कम हीटिंग को प्राप्त करने के लिए।

अगला कदम GPU क्लॉक ऑफ़सेट वैल्यू को बढ़ाना है - इसका मतलब है कि ऑपरेशन के दौरान टर्बो फ़्रीक्वेंसी कितनी अधिक होगी। यह मान सभी वोल्टेज के लिए आवृत्ति बढ़ाता है और बेहतर प्रदर्शन में परिणाम देता है। हमेशा की तरह, ओवरक्लॉकिंग करते समय, आपको हैंग, ड्राइवर या एप्लिकेशन त्रुटि, या यहां तक ​​​​कि दृश्य कलाकृतियों को नोटिस करने से पहले छोटे चरणों में GPU की आवृत्ति को 10 मेगाहर्ट्ज से 50 मेगाहर्ट्ज प्रति चरण तक बढ़ाते समय स्थिरता की जांच करने की आवश्यकता होती है। जब यह सीमा समाप्त हो जाती है, तो आपको आवृत्ति मान को एक कदम नीचे कम करना चाहिए और एक बार फिर से ओवरक्लॉकिंग के दौरान स्थिरता और प्रदर्शन की जांच करनी चाहिए।

GPU फ़्रीक्वेंसी के अलावा, आप वीडियो मेमोरी फ़्रीक्वेंसी (मेमोरी क्लॉक ऑफ़सेट) भी बढ़ा सकते हैं, जो कि GDDR5 मेमोरी से लैस GeForce GTX 1070 के मामले में विशेष रूप से महत्वपूर्ण है, जो आमतौर पर अच्छी तरह से ओवरक्लॉक करता है। मेमोरी फ़्रीक्वेंसी के मामले में प्रक्रिया बिल्कुल वही दोहराती है जो स्थिर GPU फ़्रीक्वेंसी खोजने पर की जाती है, केवल अंतर यह है कि चरणों को बड़ा बनाया जा सकता है - एक बार में बेस फ़्रीक्वेंसी में 50-100 MHz जोड़ें।

उपरोक्त चरणों के अलावा, आप ओवरवॉल्टेज सीमा भी बढ़ा सकते हैं, क्योंकि उच्च GPU आवृत्ति अक्सर बढ़े हुए वोल्टेज पर प्राप्त की जाती है, जब GPU के अस्थिर भागों को अतिरिक्त शक्ति प्राप्त होती है। सच है, बढ़ने का संभावित नुकसान दिया गया मूल्यवीडियो चिप को नुकसान और इसकी त्वरित विफलता की संभावना है, इसलिए आपको अत्यधिक सावधानी के साथ वोल्टेज वृद्धि का उपयोग करने की आवश्यकता है।

ओवरक्लॉकिंग के प्रति उत्साही थोड़ा अलग तकनीकों का उपयोग करते हैं, मापदंडों को एक अलग क्रम में बदलते हैं। उदाहरण के लिए, कुछ ओवरक्लॉकर एक स्थिर GPU और मेमोरी फ़्रीक्वेंसी खोजने पर प्रयोग साझा करते हैं ताकि वे एक दूसरे के साथ हस्तक्षेप न करें, और फिर वीडियो चिप और मेमोरी चिप्स दोनों के संयुक्त ओवरक्लॉकिंग का परीक्षण करें, लेकिन ये पहले से ही एक व्यक्तिगत दृष्टिकोण के महत्वहीन विवरण हैं। .

मंचों में राय और लेखों पर टिप्पणियों को देखते हुए, कुछ उपयोगकर्ताओं को नए GPU बूस्ट 3.0 ऑपरेशन एल्गोरिथ्म पसंद नहीं आया, जब GPU आवृत्ति पहले बहुत अधिक बढ़ जाती है, अक्सर टर्बो आवृत्ति से अधिक होती है, लेकिन फिर, वृद्धि के प्रभाव में GPU तापमान में या निर्धारित सीमा से अधिक बिजली की खपत में, यह बहुत कम मूल्यों तक गिर सकता है। यह केवल अद्यतन एल्गोरिथ्म की विशिष्टता है, आपको गतिशील रूप से बदलते GPU आवृत्ति के नए व्यवहार के लिए अभ्यस्त होने की आवश्यकता है, लेकिन इसका कोई नकारात्मक परिणाम नहीं है।

पास्कल परिवार पर आधारित एनवीडिया के ग्राफिक्स प्रोसेसर की नई लाइन में जीटीएक्स 1080 के बाद GeForce GTX 1070 दूसरा मॉडल है। नई 16nm FinFET निर्माण प्रक्रिया और आर्किटेक्चर ऑप्टिमाइजेशन ने इस ग्राफिक्स कार्ड को उच्च घड़ी की गति प्राप्त करने में सक्षम बनाया है, जो कि GPU बूस्ट तकनीक की नई पीढ़ी द्वारा समर्थित है। भले ही स्ट्रीम प्रोसेसर और टेक्सचर मॉड्यूल के रूप में कार्यात्मक ब्लॉकों की संख्या कम कर दी गई हो, लेकिन उनकी संख्या GTX 1070 के लिए सबसे अधिक लाभदायक और ऊर्जा कुशल समाधान बनने के लिए पर्याप्त है।

GDDR5 मेमोरी को GP104 चिप पर जारी किए गए Nvidia वीडियो कार्ड के एक जोड़े के सबसे छोटे पर स्थापित करना, GDDR5X के नए प्रकार के विपरीत, जो GTX 1080 को अलग करता है, इसे उच्च प्रदर्शन संकेतक प्राप्त करने से नहीं रोकता है। सबसे पहले, एनवीडिया ने GeForce GTX 1070 मॉडल की मेमोरी बस को नहीं काटने का फैसला किया, और दूसरी बात, उन्होंने 8 GHz की प्रभावी आवृत्ति के साथ उस पर सबसे तेज़ GDDR5 मेमोरी लगाई, जो कि GDDR5X में उपयोग किए जाने वाले GDDR5X के लिए केवल 10 GHz से थोड़ा कम है। पुराना मॉडल। बेहतर डेल्टा संपीड़न एल्गोरिदम को ध्यान में रखते हुए, GPU की प्रभावी मेमोरी बैंडविड्थ समान पैरामीटर से अधिक हो गई है समान मॉडलपिछली पीढ़ी के GeForce GTX 970।

GeForce GTX 1070 इस मायने में अच्छा है कि यह पुराने मॉडल की तुलना में बहुत कम कीमत पर नई सुविधाओं और एल्गोरिदम के लिए बहुत उच्च प्रदर्शन और समर्थन प्रदान करता है। यदि कुछ उत्साही लोग 55,000 में GTX 1080 खरीदने का जोखिम उठा सकते हैं, तो संभावित खरीदारों का एक बहुत बड़ा समूह बिल्कुल समान क्षमताओं वाले कम उत्पादक समाधान के केवल एक चौथाई के लिए 35,000 का भुगतान करने में सक्षम होगा। यह अपेक्षाकृत कम कीमत और उच्च प्रदर्शन का संयोजन था जिसने रिलीज के समय GeForce GTX 1070 को शायद सबसे अधिक लाभदायक खरीद बना दिया।

ग्राफिक्स त्वरक GeForce GTX 1060

पैरामीटरअर्थ
चिप कोड नामजीपी106
उत्पादन प्रौद्योगिकी16एनएम फिनफेट
ट्रांजिस्टर की संख्या4.4 अरब
मूल भाग200 मिमी²
आर्किटेक्चरकई प्रकार के डेटा के स्ट्रीम प्रोसेसिंग के लिए सामान्य प्रोसेसर की एक सरणी के साथ एकीकृत: कोने, पिक्सेल, आदि।
डायरेक्टएक्स हार्डवेयर सपोर्टDirectX 12, फ़ीचर स्तर 12_1 . के समर्थन के साथ
मेमोरी बस192-बिट: GDDR5 मेमोरी का समर्थन करने वाले छह स्वतंत्र 32-बिट मेमोरी कंट्रोलर
GPU आवृत्ति1506 (1708) मेगाहर्ट्ज
कंप्यूटिंग ब्लॉकआईईईई 754-2008 मानक के भीतर फ्लोटिंग पॉइंट गणना के लिए 1280 स्केलर एएलयू सहित 10 स्ट्रीमिंग मल्टीप्रोसेसर;
बनावट ब्लॉकबनावट में FP16 और FP32 घटकों के समर्थन के साथ 80 टेक्सचर एड्रेसिंग और फ़िल्टरिंग इकाइयाँ और सभी बनावट स्वरूपों के लिए ट्रिलिनियर और अनिसोट्रोपिक फ़िल्टरिंग के लिए समर्थन
रेखापुंज संचालन इकाइयां (आरओपी)प्रोग्राम करने योग्य और FP16 या FP32 फ्रेम बफर प्रारूप सहित विभिन्न एंटी-अलियासिंग मोड के समर्थन के साथ 6 चौड़े आरओपी (48 पिक्सल)। ब्लॉक में विन्यास योग्य एएलयू की एक सरणी होती है और गहराई निर्माण और तुलना, बहु-नमूनाकरण और सम्मिश्रण के लिए जिम्मेदार होते हैं।
मॉनिटर समर्थनडुअल लिंक डीवीआई, एचडीएमआई 2.0 बी और डिस्प्लेपोर्ट 1.2 (1.3/1.4 रेडी) के माध्यम से जुड़े अधिकतम चार मॉनिटरों के लिए एकीकृत समर्थन

GeForce GTX 1060 संदर्भ ग्राफिक्स निर्दिष्टीकरण
पैरामीटरअर्थ
कोर आवृत्ति1506 (1708) मेगाहर्ट्ज
यूनिवर्सल प्रोसेसर की संख्या1280
बनावट ब्लॉकों की संख्या80
सम्मिश्रण ब्लॉकों की संख्या48
प्रभावी स्मृति आवृत्ति8000 (4×2000) मेगाहर्ट्ज
मेमोरी प्रकारजीडीडीआर5
मेमोरी बस192-बिट
स्मृति6 जीबी
मेमोरी बैंडविड्थ192 जीबी/सेक
कम्प्यूटिंग प्रदर्शन (FP32)लगभग 4 टेराफ्लॉप्स
सैद्धांतिक अधिकतम भरण दर72 गीगापिक्सेल/सेक
सैद्धांतिक बनावट नमूनाकरण दर121 गीगाटेक्सेल/सेक
थका देनापीसीआई एक्सप्रेस 3.0
कनेक्टर्सएक डुअल लिंक डीवीआई, एक एचडीएमआई और तीन डिस्प्लेपोर्ट
विशिष्ट बिजली की खपत120 डब्ल्यू
अतिरिक्त भोजनएक 6-पिन कनेक्टर
सिस्टम चेसिस में व्याप्त स्लॉट्स की संख्या2
अनुशंसित मूल्ययूएस में $249 ($299) और रूस में 18,990 डॉलर

GeForce GTX 1060 वीडियो कार्ड को भी पिछली GeForce श्रृंखला के समान समाधान के समान एक नाम मिला, जो कि पीढ़ी के बदले हुए पहले अंक से केवल अपने प्रत्यक्ष पूर्ववर्ती GeForce GTX 960 के नाम से भिन्न है। कंपनी की वर्तमान पंक्ति में नवीनता पहले से जारी GeForce GTX 1070 समाधान से एक कदम कम हो गई है, जो नई श्रृंखला में गति के मामले में औसत है।

एनवीडिया के नए वीडियो कार्ड के लिए अनुशंसित मूल्य क्रमशः कंपनी के भागीदारों के नियमित संस्करणों और विशेष संस्थापक के संस्करण के लिए $ 249 और $ 299 हैं। दो पुराने मॉडलों की तुलना में, यह एक बहुत ही अनुकूल कीमत है, क्योंकि नया जीटीएक्स 1060 मॉडल, हालांकि टॉप-एंड मदरबोर्ड से कम है, कहीं भी उतना सस्ता नहीं है जितना सस्ता है। घोषणा के समय, नवीनता निश्चित रूप से अपनी श्रेणी में सर्वश्रेष्ठ प्रदर्शन समाधान बन गई और इस मूल्य सीमा में सबसे अधिक लाभदायक प्रस्तावों में से एक बन गई।

एनवीडिया के पास्कल परिवार वीडियो कार्ड का यह मॉडल प्रतिद्वंद्वी कंपनी एएमडी के ताजा निर्णय का मुकाबला करने के लिए सामने आया, जिसने कुछ समय पहले राडेन आरएक्स 480 जारी किया था। आप इस वीडियो कार्ड के साथ नए एनवीडिया वीडियो कार्ड की तुलना कर सकते हैं, हालांकि काफी सीधे नहीं, क्योंकि वे अभी भी कीमत में काफी भिन्न हैं। GeForce GTX 1060 अधिक महंगा है ($249-299 बनाम $199-229), लेकिन यह स्पष्ट रूप से अपने प्रतिद्वंद्वी से भी तेज है।

GP106 ग्राफिक्स प्रोसेसर में 192-बिट मेमोरी बस है, इसलिए ऐसी बस वाले वीडियो कार्ड पर स्थापित मेमोरी की मात्रा 3 या 6 जीबी हो सकती है। आधुनिक परिस्थितियों में एक छोटा मूल्य स्पष्ट रूप से पर्याप्त नहीं है, और कई गेम प्रोजेक्ट, यहां तक ​​​​कि पूर्ण एचडी रिज़ॉल्यूशन में, वीडियो मेमोरी की कमी का सामना करेंगे, जो रेंडरिंग स्मूथनेस को गंभीर रूप से प्रभावित करेगा। उच्च सेटिंग्स पर नए समाधान के अधिकतम प्रदर्शन को सुनिश्चित करने के लिए, GeForce GTX 1060 मॉडल 6 जीबी वीडियो मेमोरी से लैस था, जो कि किसी भी गुणवत्ता सेटिंग्स के साथ किसी भी 3D एप्लिकेशन को चलाने के लिए पर्याप्त है। इसके अलावा, आज केवल 6 और 8 जीबी के बीच कोई अंतर नहीं है, और इस तरह के समाधान से कुछ पैसे बचेंगे।

नए उत्पाद के लिए सामान्य बिजली खपत मूल्य 120 डब्ल्यू है, जो जीटीएक्स 1070 के मूल्य से 20% कम है और पिछली पीढ़ी के जीईफ़ोर्स जीटीएक्स 960 ग्राफिक्स कार्ड की बिजली खपत के बराबर है, जिसमें बहुत कम प्रदर्शन और क्षमताएं हैं। संदर्भ बोर्ड में छवि आउटपुट उपकरणों को जोड़ने के लिए कनेक्टर्स का सामान्य सेट होता है: एक डुअल-लिंक डीवीआई, एक एचडीएमआई और तीन डिस्प्लेपोर्ट। इसके अलावा, एचडीएमआई और डिस्प्लेपोर्ट के नए संस्करणों के लिए समर्थन था, जिसके बारे में हमने जीटीएक्स 1080 मॉडल की समीक्षा में लिखा था।

GeForce GTX 1060 संदर्भ बोर्ड की लंबाई 9.8 इंच (25 सेमी) है, और पुराने विकल्पों के अंतर से, हम अलग से ध्यान दें कि GeForce GTX 1060 SLI मल्टी-चिप रेंडरिंग कॉन्फ़िगरेशन का समर्थन नहीं करता है, और इसमें एक नहीं है इसके लिए विशेष कनेक्टर। चूंकि बोर्ड पुराने मॉडलों की तुलना में कम बिजली की खपत करता है, अतिरिक्त बिजली के लिए बोर्ड पर एक 6-पिन पीसीआई-ई बाहरी पावर कनेक्टर स्थापित किया गया था।

कंपनी के भागीदारों से उत्पादों के रूप में घोषणा के दिन से GeForce GTX 1060 वीडियो कार्ड बाजार में दिखाई दिए हैं: Asus, EVGA, Gainward, Gigabyte, Innovision 3D, MSI, Palit, Zotac। GeForce GTX 1060 के संस्थापक संस्करण का एक विशेष संस्करण, जो कि एनवीडिया द्वारा ही निर्मित है, सीमित मात्रा में जारी किया जाएगा, जिसे विशेष रूप से एनवीडिया वेबसाइट पर $ 299 की कीमत पर बेचा जाएगा और आधिकारिक तौर पर रूस में प्रस्तुत नहीं किया जाएगा। संस्थापक का संस्करण इस तथ्य से अलग है कि यह एल्यूमीनियम के मामले सहित उच्च गुणवत्ता वाली सामग्री और घटकों से बना है, और एक कुशल शीतलन प्रणाली, साथ ही कम प्रतिरोध पावर सर्किट और विशेष रूप से डिज़ाइन किए गए वोल्टेज नियामकों का उपयोग करता है।

वास्तु परिवर्तन

GeForce GTX 1060 वीडियो कार्ड पूरी तरह से नए ग्राफिक्स प्रोसेसर मॉडल GP106 पर आधारित है, जो कार्यात्मक रूप से GP104 चिप के रूप में पास्कल आर्किटेक्चर के पहले जन्म से अलग नहीं है, जिस पर GeForce GTX 1080 और GTX 1070 मॉडल वर्णित हैं। ऊपर आधारित हैं। यह वास्तुकला मैक्सवेल में वापस काम किए गए समाधानों पर आधारित थी, लेकिन इसमें कुछ कार्यात्मक अंतर भी हैं, जिनके बारे में हमने पहले विस्तार से लिखा था।

GP106 वीडियो चिप अपने डिजाइन में टॉप-एंड पास्कल चिप और मैक्सवेल आर्किटेक्चर के समान समाधानों के समान है, और आप पिछले एनवीडिया समाधानों की हमारी समीक्षाओं में आधुनिक जीपीयू के डिजाइन के बारे में विस्तृत जानकारी पा सकते हैं। पिछले GPU की तरह, नए आर्किटेक्चर के चिप्स में ग्राफिक्स प्रोसेसिंग क्लस्टर (GPC), स्ट्रीमिंग मल्टीप्रोसेसर (SM) और मेमोरी कंट्रोलर का एक अलग कॉन्फ़िगरेशन है:

GP106 ग्राफिक्स प्रोसेसर में दो GPC क्लस्टर शामिल हैं, जिसमें 10 स्ट्रीमिंग मल्टीप्रोसेसर (स्ट्रीमिंग मल्टीप्रोसेसर - SM) शामिल हैं, जो कि GP104 का ठीक आधा है। पुराने जीपीयू की तरह, प्रत्येक मल्टीप्रोसेसर में 128 कोर, 8 टीएमयू बनावट इकाइयां, 256 केबी प्रत्येक शामिल हैं मेमोरी रजिस्टर करें, 96 केबी की साझा मेमोरी और 48 केबी की एल1 कैशे। नतीजतन, GeForce GTX 1060 में कुल 1,280 कंप्यूट कोर और 80 बनावट इकाइयां हैं, जो GTX 1080 से आधी हैं।

लेकिन GeForce GTX 1060 के मेमोरी सबसिस्टम को शीर्ष समाधान के सापेक्ष आधा नहीं किया गया था, इसमें छह 32-बिट मेमोरी कंट्रोलर शामिल हैं, जो अंतिम 192-बिट मेमोरी बस देते हैं। GeForce GTX 1060 के लिए 8 GHz के बराबर GDDR5 वीडियो मेमोरी की प्रभावी आवृत्ति के साथ, बैंडविड्थ 192 GB / s तक पहुंच जाता है, जो इस मूल्य खंड में समाधान के लिए काफी अच्छा है, विशेष रूप से पास्कल में इसके उपयोग की उच्च दक्षता को देखते हुए। प्रत्येक मेमोरी कंट्रोलर में आठ ROP और 256 KB L2 कैश जुड़ा होता है, इसलिए कुल मिलाकर पूर्ण संस्करण GP106 GPU में 48 ROP और 1536 KB L2 कैश है।

मेमोरी बैंडविड्थ आवश्यकताओं को कम करने और उपलब्ध पास्कल आर्किटेक्चर का अधिक कुशल उपयोग करने के लिए, दोषरहित ऑन-चिप डेटा संपीड़न में और सुधार किया गया है, जो बफ़र्स में डेटा को संपीड़ित करने, दक्षता और प्रदर्शन लाभ प्राप्त करने में सक्षम है। विशेष रूप से, नए 4:1 और 8:1 डेल्टा संपीड़न विधियों को चिप्स के नए परिवार में जोड़ा गया है, जो मैक्सवेल परिवार के पिछले समाधानों की तुलना में बैंडविड्थ दक्षता में अतिरिक्त 20% प्रदान करता है।

नए GPU की आधार आवृत्ति 1506 MHz है - सिद्धांत रूप में आवृत्ति इस चिह्न से नीचे नहीं गिरनी चाहिए। ठेठ टर्बो घड़ी (बूस्ट क्लॉक) 1708 मेगाहर्ट्ज पर बहुत अधिक है, जो वास्तविक आवृत्ति का औसत है जो कि GeForce GTX 1060 ग्राफिक्स चिप गेम और 3D अनुप्रयोगों की एक विस्तृत श्रृंखला में चलता है। वास्तविक बूस्ट फ़्रीक्वेंसी खेल और उन स्थितियों पर निर्भर करती है जिनमें परीक्षण होता है।

पास्कल परिवार के बाकी लोगों की तरह, GeForce GTX 1060 न केवल उच्च घड़ी की गति से संचालित होता है, बल्कि उच्च प्रदर्शन प्रदान करता है, बल्कि ओवरक्लॉकिंग के लिए एक अच्छा मार्जिन भी है। पहले प्रयोग 2 GHz के क्रम की आवृत्तियों तक पहुँचने की संभावना का संकेत देते हैं। यह आश्चर्य की बात नहीं है कि कंपनी के सहयोगी जीटीएक्स 1060 वीडियो कार्ड के फैक्ट्री ओवरक्लॉक संस्करण भी तैयार कर रहे हैं।

इसलिए, नई वास्तुकला में मुख्य परिवर्तन 16 एनएम फिनफेट प्रक्रिया थी, जिसके उपयोग से जीपी106 के उत्पादन में 200 मिमी² के अपेक्षाकृत कम क्षेत्र को बनाए रखते हुए चिप की जटिलता में काफी वृद्धि करना संभव हो गया। इसलिए इस पास्कल आर्किटेक्चर चिप में 28 एनएम प्रक्रिया प्रौद्योगिकी का उपयोग करके उत्पादित समान स्थिति के मैक्सवेल चिप की तुलना में निष्पादन इकाइयों की एक बड़ी संख्या है।

यदि 227 मिमी² के क्षेत्रफल वाले GM206 (GTX 960) में 3 बिलियन ट्रांजिस्टर और 1024 ALU, 64 TMU, 32 ROP और एक 128-बिट बस है, तो नए GPU में 4.4 बिलियन ट्रांजिस्टर, 1280 ALU शामिल हैं। 192-बिट बस के साथ 200 मिमी², 80 टीएमयू और 48 आरओपी। इसके अलावा, लगभग डेढ़ गुना अधिक आवृत्ति पर: 1506 (1708) बनाम 1126 (1178) मेगाहर्ट्ज। और यह 120 वाट की समान बिजली खपत के साथ है! नतीजतन, GP106 GPU GP104 के साथ सबसे अधिक ऊर्जा कुशल GPU में से एक बन गया है।

न्यू एनवीडिया टेक्नोलॉजीज

कंपनी की सबसे दिलचस्प तकनीकों में से एक, जो GeForce GTX 1060 और पास्कल परिवार के अन्य समाधानों द्वारा समर्थित है, तकनीक है एनवीडिया एक साथ बहु-प्रोजेक्शन. हमने इस तकनीक के बारे में GeForce GTX 1080 समीक्षा में पहले ही लिखा है, यह आपको प्रतिपादन को अनुकूलित करने के लिए कई नई तकनीकों का उपयोग करने की अनुमति देता है। विशेष रूप से - एक साथ दो आंखों के लिए एक वीआर छवि को एक साथ प्रोजेक्ट करने के लिए, आभासी वास्तविकता में जीपीयू का उपयोग करने की दक्षता में काफी वृद्धि हुई है।

एसएमपी का समर्थन करने के लिए, पास्कल परिवार के सभी जीपीयू में एक विशेष इंजन होता है, जो रास्टराइज़र से पहले ज्यामितीय पाइपलाइन के अंत में पॉलीमॉर्फ इंजन में स्थित होता है। इसके साथ, GPU एक साथ एक बिंदु से कई अनुमानों पर एक ज्यामितीय आदिम प्रोजेक्ट कर सकता है, जबकि ये अनुमान स्टीरियो हो सकते हैं (यानी, एक साथ 16 या 32 अनुमानों का समर्थन किया जाता है)। यह सुविधा पास्कल जीपीयू को वीआर रेंडरिंग के लिए एक घुमावदार सतह को सटीक रूप से पुन: पेश करने की अनुमति देती है, साथ ही मल्टी-मॉनिटर सिस्टम पर सही ढंग से प्रदर्शित होती है।

यह महत्वपूर्ण है कि एक साथ बहु-प्रोजेक्शन तकनीक को पहले से ही लोकप्रिय गेम इंजन (अवास्तविक इंजन और एकता) और खेलों में एकीकृत किया जा रहा है, और आज तक, इस तरह के प्रसिद्ध सहित विकास में 30 से अधिक खेलों के लिए प्रौद्योगिकी के समर्थन की घोषणा की गई है। अवास्तविक टूर्नामेंट, पूलनेशन वीआर, एवरेस्ट वीआर, अपहरण, एडीआर 1 फीट और कच्चे डेटा के रूप में परियोजनाएं। दिलचस्प बात यह है कि हालांकि अवास्तविक टूर्नामेंट वीआर गेम नहीं है, यह बेहतर दृश्य और प्रदर्शन प्राप्त करने के लिए एसएमपी का उपयोग करता है।

खेलों में स्क्रीनशॉट बनाने के लिए एक और लंबे समय से प्रतीक्षित तकनीक एक शक्तिशाली उपकरण है। एनवीडिया एंसेली. यह टूल आपको गेम से असामान्य और बहुत उच्च-गुणवत्ता वाले स्क्रीनशॉट बनाने की अनुमति देता है, पहले से अनुपलब्ध सुविधाओं के साथ, उन्हें बहुत उच्च रिज़ॉल्यूशन में सहेजता है और उन्हें विभिन्न प्रभावों के साथ पूरक करता है, और अपनी रचनाओं को साझा करता है। Ansel आपको सचमुच एक स्क्रीनशॉट बनाने की अनुमति देता है जिस तरह से कलाकार चाहता है, जिससे आप दृश्य में कहीं भी किसी भी पैरामीटर के साथ एक कैमरा स्थापित कर सकते हैं, छवि के लिए शक्तिशाली पोस्ट-फिल्टर लागू कर सकते हैं, या यहां तक ​​​​कि एक में देखने के लिए 360-डिग्री शॉट भी ले सकते हैं। आभासी वास्तविकता हेलमेट।

एनवीडिया ने गेम में एंसेल यूआई के एकीकरण को मानकीकृत किया है, और ऐसा करना कोड की कुछ पंक्तियों को जोड़ने जितना आसान है। खेलों में इस सुविधा के प्रकट होने की प्रतीक्षा करना अब आवश्यक नहीं है, आप अभी मिरर एज: कैटालिस्ट में एंसेल की क्षमताओं का मूल्यांकन कर सकते हैं, और थोड़ी देर बाद यह विचर 3: वाइल्ड हंट में उपलब्ध हो जाएगा। इसके अलावा, कई एंसल-सक्षम गेम प्रोजेक्ट विकास में हैं, जिनमें फ़ोर्टनाइट, पैरागॉन और अवास्तविक टूर्नामेंट, ऑबडक्शन, द विटनेस, लॉब्रेकर्स, टॉम क्लैंसी की द डिवीजन, नो मैन्स स्काई, और बहुत कुछ शामिल हैं।

नया GeForce GTX 1060 GPU भी टूलकिट का समर्थन करता है एनवीडिया वीआरवर्क्स, जो डेवलपर्स को आभासी वास्तविकता के लिए प्रभावशाली प्रोजेक्ट बनाने में मदद करता है। इस पैकेज में VRWorks ऑडियो सहित डेवलपर्स के लिए कई उपयोगिताओं और उपकरण शामिल हैं, जो आपको GPU रे ट्रेसिंग का उपयोग करके दृश्य वस्तुओं से ध्वनि तरंगों के प्रतिबिंबों की बहुत सटीक गणना करने की अनुमति देता है। पैकेज में दृश्य में वस्तुओं के शारीरिक रूप से सही व्यवहार को सुनिश्चित करने के लिए VR और PhysX भौतिकी प्रभावों में एकीकरण भी शामिल है।

VRWorks से लाभान्वित होने वाले सबसे रोमांचक VR गेमों में से एक VR Funhouse, Nvidia का अपना VR गेम है, जो वाल्व की स्टीम सेवा पर निःशुल्क उपलब्ध है। यह गेम अवास्तविक इंजन 4 (एपिक गेम्स) द्वारा संचालित है और HTC Vive VR हेडसेट्स के संयोजन में GeForce GTX 1080, 1070 और 1060 ग्राफिक्स कार्ड पर चलता है। इसके अलावा, इस गेम का स्रोत कोड सार्वजनिक रूप से उपलब्ध होगा, जो अन्य डेवलपर्स को अपने वीआर आकर्षण में पहले से ही तैयार विचारों और कोड का उपयोग करने की अनुमति देगा। इसके लिए हमारा शब्द लें, यह आभासी वास्तविकता की संभावनाओं के सबसे प्रभावशाली प्रदर्शनों में से एक है।

SMP और VRWorks प्रौद्योगिकियों के लिए धन्यवाद सहित, VR अनुप्रयोगों में GeForce GTX 1060 GPU का उपयोग काफी कुछ प्रदान करता है प्रवेश स्तरआभासी वास्तविकता प्रदर्शन, और विचाराधीन GPU न्यूनतम आवश्यक हार्डवेयर स्तर को पूरा करता है, जिसमें स्टीमवीआर भी शामिल है, जो सिस्टम में उपयोग के लिए सबसे सफल अधिग्रहणों में से एक बन गया है। आधिकारिक समर्थनवी.आर.

चूंकि GeForce GTX 1060 मॉडल GP106 चिप पर आधारित है, जो किसी भी तरह से GP104 ग्राफिक्स प्रोसेसर से कमतर नहीं है, जो पुराने संशोधनों का आधार बन गया, यह ऊपर वर्णित सभी तकनीकों का बिल्कुल समर्थन करता है।

GeForce GTX 1060, पास्कल परिवार पर आधारित एनवीडिया के ग्राफिक्स प्रोसेसर की नई लाइन में तीसरा मॉडल है। नई 16nm FinFET प्रक्रिया प्रौद्योगिकी और आर्किटेक्चर ऑप्टिमाइजेशन ने सभी नए ग्राफिक्स कार्ड को उच्च घड़ी की गति प्राप्त करने और पिछली पीढ़ी के वीडियो चिप्स की तुलना में स्ट्रीम प्रोसेसर, बनावट मॉड्यूल और अन्य के रूप में GPU में अधिक कार्यात्मक ब्लॉक रखने की अनुमति दी है। यही कारण है कि जीटीएक्स 1060 अपनी कक्षा में और सामान्य रूप से सबसे अधिक लाभदायक और ऊर्जा कुशल समाधान बन गया है।

यह विशेष रूप से महत्वपूर्ण है कि GeForce GTX 1060 GP104 पर आधारित पुराने समाधानों की तुलना में काफी कम कीमत पर नई सुविधाओं और एल्गोरिदम के लिए पर्याप्त रूप से उच्च प्रदर्शन और समर्थन प्रदान करता है। नए मॉडल में प्रयुक्त GP106 ग्राफिक्स चिप सर्वश्रेष्ठ-इन-क्लास प्रदर्शन और पावर दक्षता प्रदान करता है। GeForce GTX 1060 विशेष रूप से डिज़ाइन किया गया है और 1920x1080 के रिज़ॉल्यूशन पर उच्च और अधिकतम ग्राफिक्स सेटिंग्स पर सभी आधुनिक खेलों के लिए पूरी तरह से अनुकूल है और यहां तक ​​​​कि विभिन्न तरीकों (FXAA, MFAA या MSAA) द्वारा सक्षम पूर्ण-स्क्रीन एंटी-अलियासिंग के साथ।

और जो लोग अल्ट्रा-हाई-रिज़ॉल्यूशन डिस्प्ले के साथ और भी अधिक प्रदर्शन चाहते हैं, उनके लिए एनवीडिया में टॉप-ऑफ-द-लाइन GeForce GTX 1070 और GTX 1080 ग्राफिक्स कार्ड हैं जो प्रदर्शन और शक्ति दक्षता के मामले में भी काफी अच्छे हैं। और फिर भी, कम कीमत और पर्याप्त प्रदर्शन का संयोजन पुराने समाधानों की पृष्ठभूमि से GeForce GTX 1060 को काफी अनुकूल रूप से अलग करता है। प्रतिस्पर्धी Radeon RX 480 की तुलना में, Nvidia का समाधान कम जटिलता और GPU पदचिह्न के साथ थोड़ा तेज है, और इसमें काफी बेहतर बिजली दक्षता है। सच है, यह थोड़ा अधिक महंगा बेचा जाता है, इसलिए प्रत्येक वीडियो कार्ड का अपना स्थान होता है।

NVIDIA GeForce GTX 780 वीडियो कार्ड की समीक्षा | GeForce अनुभव और शैडोप्ले

GeForce अनुभव

कंप्यूटर के प्रति उत्साही के रूप में, हम विभिन्न सेटिंग्स के संयोजन की सराहना करते हैं जो गेम के प्रदर्शन और गुणवत्ता को प्रभावित करते हैं। सबसे आसान तरीका यह है कि नए वीडियो कार्ड पर बहुत सारा पैसा खर्च किया जाए और सभी ग्राफिक्स सेटिंग्स को अधिकतम पर सेट किया जाए। लेकिन जब कोई पैरामीटर कार्ड के लिए बहुत भारी हो जाता है और इसे कम या बंद करना पड़ता है, तो एक अप्रिय भावना होती है और यह अहसास होता है कि खेल बहुत बेहतर काम कर सकता है।

हालाँकि, इष्टतम सेटिंग्स सेट करना इतना आसान नहीं है। कुछ सेटिंग्स दूसरों की तुलना में बेहतर दृश्य उत्पन्न करती हैं, और प्रदर्शन पर प्रभाव बहुत भिन्न हो सकता है। GeForce एक्सपीरियंस प्रोग्राम NVIDIA का प्रयास है कि कॉन्फ़िगरेशन के डेटाबेस के विरुद्ध आपके CPU, GPU और रिज़ॉल्यूशन की तुलना करके गेम सेटिंग्स को चुनना आसान बनाना है। उपयोगिता का दूसरा भाग आपको यह निर्धारित करने में मदद करता है कि ड्राइवरों को अपडेट की आवश्यकता है या नहीं।

यह संभावना है कि उत्साही लोग स्वयं सेटिंग्स का चयन करना जारी रखेंगे और नकारात्मक रूप से अनुभव करेंगे अतिरिक्त कार्यक्रम. हालांकि, अधिकांश गेमर्स जो गेम इंस्टॉल करना चाहते हैं और ड्राइवरों की जांच किए बिना और विभिन्न सेटिंग्स से गुजरे बिना तुरंत खेलना शुरू कर देते हैं, निश्चित रूप से इस अवसर से खुश होंगे। किसी भी तरह से, NVIDIA का GeForce अनुभव लोगों को उनके गेमिंग अनुभव का अधिकतम लाभ उठाने में मदद करता है, और इसलिए यह पीसी गेमिंग के लिए एक उपयोगी उपयोगिता है।

GeForce अनुभव ने हमारे परीक्षण प्रणाली पर स्थापित सभी नौ खेलों की पहचान की। स्वाभाविक रूप से उन्होंने डिफ़ॉल्ट सेटिंग्स को नहीं सहेजा क्योंकि हमने परीक्षण के लिए कुछ सेटिंग्स लागू की थीं। लेकिन यह अभी भी दिलचस्प है कि कैसे GeForce अनुभव हमारे द्वारा चुने गए विकल्पों को बदल देता।

टॉम्ब रेडर के लिए, GeForce अनुभव TressFX तकनीक को अक्षम करना चाहता था, भले ही NVIDIA GeForce GTX 780फ़ंक्शन सक्षम होने के साथ, इसने प्रति सेकंड औसतन 40 फ़्रेम दिखाए। किसी कारण से, प्रोग्राम कॉन्फ़िगरेशन निर्धारित करने में असमर्थ था फार क्राय 3, हालांकि उसके द्वारा सुझाई गई सेटिंग्स काफी अधिक थीं। स्किरिम के अज्ञात कारणों से, उपयोगिता FXAA को अक्षम करना चाहती थी।

छवि गुणवत्ता पर एक निश्चित सेटिंग के प्रभाव का वर्णन करने वाले प्रत्येक गेम के लिए स्क्रीनशॉट का एक सेट प्राप्त करना अच्छा है। हमने जिन नौ उदाहरणों की समीक्षा की, उनमें से हमारी राय में, GeForce अनुभव इष्टतम सेटिंग्स के करीब आया। हालाँकि, उपयोगिता भी पक्षपाती है, NVIDIA- विशिष्ट सुविधाओं जैसे कि PhysX (जो प्रोग्राम को रखा गया है) का संरक्षण करता है ऊँचा स्तरबॉर्डरलैंड 2 में) और एएमडी (टॉम्ब रेडर में ट्रेसएफएक्स सहित) की सुविधाओं को सक्षम होने से रोकना। Skyrim में FXAA को अक्षम करने का कोई मतलब नहीं है, क्योंकि खेल का औसत 100 FPS है। यह संभव है कि एनवीआईडीआईए शील्ड सिस्टम शिप होने के बाद उत्साही लोग GeForce अनुभव स्थापित करना चाहेंगे, क्योंकि गेम स्ट्रीमिंग सुविधा एनवीआईडीआईए ऐप के माध्यम से उपलब्ध प्रतीत होती है।

शैडोप्ले: गेमिंग के लिए ऑलवेज-ऑन वीडियो रिकॉर्डर

वाह प्रशंसक अक्सर अपने छापे रिकॉर्ड करते हैं, लेकिन इसके लिए काफी शक्तिशाली प्रणाली, फ्रैप्स और बहुत सारे डिस्क स्थान की आवश्यकता होती है।

NVIDIA ने हाल ही में घोषणा की नयी विशेषताशैडोप्ले, जो रिकॉर्डिंग प्रक्रिया को बहुत सरल कर सकता है।

सक्रिय होने पर, शैडोप्ले केप्लर जीपीयू में निर्मित एनवीएनसी फिक्स्ड डिकोडर का उपयोग करता है, जो स्वचालित रूप से अंतिम 20 मिनट के गेमप्ले को रिकॉर्ड करता है। या आप शैडोप्ले को मैन्युअल रूप से शुरू और बंद कर सकते हैं। इस प्रकार, प्रौद्योगिकी की जगह लेता है सॉफ़्टवेयर समाधानफ्रैप्स की तरह, जो सीपीयू पर अधिक भार देते हैं।

संदर्भ के लिए: NVEnc केवल 4096x4096 पिक्सेल तक के रिज़ॉल्यूशन पर H.264 एन्कोडिंग के साथ काम करता है। शैडोप्ले अभी बाजार में उपलब्ध नहीं है, लेकिन एनवीआईडीआईए का कहना है कि यह इस गर्मी में लॉन्च होने तक 30 एफपीएस तक 1080p वीडियो रिकॉर्ड करने में सक्षम होगा। हम एक उच्च रिज़ॉल्यूशन देखना चाहते हैं क्योंकि पहले कहा गया था कि एन्कोडर में हार्डवेयर में इसका समर्थन करने की क्षमता है।

NVIDIA GeForce GTX 780 वीडियो कार्ड की समीक्षा | GPU बूस्ट 2.0 और संभावित ओवरक्लॉकिंग मुद्दे

जीपीयू बूस्ट 2.0

रिव्यू में GeForce GTX टाइटनहमें दूसरी पीढ़ी की NVIDIA GPU बूस्ट तकनीक का व्यापक परीक्षण करने को नहीं मिला, लेकिन अब यह यहाँ है NVIDIA GeForce GTX 780. यहाँ इस तकनीक का संक्षिप्त विवरण दिया गया है:

GPU बूस्ट एक NVIDIA तंत्र है जो संसाधित किए जा रहे कार्य के प्रकार के आधार पर ग्राफिक्स कार्ड के प्रदर्शन को बदलता है। जैसा कि आप शायद जानते हैं, गेम में अलग-अलग GPU संसाधन आवश्यकताएं होती हैं। ऐतिहासिक रूप से, सबसे खराब स्थिति के लिए आवृत्ति को ट्यून किया जाना चाहिए। लेकिन "प्रकाश" को संसाधित करते समय GPU कार्यकुछ नहीं के लिए काम किया। GPU बूस्ट विभिन्न मापदंडों की निगरानी करता है और एप्लिकेशन की जरूरतों और वर्तमान स्थिति के आधार पर आवृत्तियों को बढ़ाता या घटाता है।

GPU बूस्ट का पहला कार्यान्वयन एक निश्चित पावर थ्रेशोल्ड (के मामले में 170 W) के तहत काम करता है GeForce GTX 680) हालांकि, कंपनी के इंजीनियरों ने पाया है कि अगर GPU का तापमान काफी कम है तो वे सुरक्षित रूप से इस स्तर को पार कर सकते हैं। इस प्रकार, प्रदर्शन को और अधिक अनुकूलित किया जा सकता है।

व्यवहार में, GPU बूस्ट 2.0 केवल इसमें भिन्न है कि NVIDIA अब बिजली की सीमा के आधार पर आवृत्ति को तेज करता है, लेकिन एक निश्चित तापमान पर, जो कि 80 डिग्री सेल्सियस है। इसका मतलब है कि उच्च आवृत्ति और वोल्टेज मान अब चिप के तापमान तक 80 डिग्री तक उपयोग किए जाएंगे। यह मत भूलो कि तापमान मुख्य रूप से प्रोफ़ाइल और प्रशंसक सेटिंग्स पर निर्भर करता है: उच्च गति, कम तापमान और इसलिए, उच्च GPU बूस्ट मान (और शोर स्तर, दुर्भाग्य से, भी)। तकनीक अभी भी हर 100ms में एक बार स्थिति का मूल्यांकन करती है, इसलिए भविष्य के संस्करणों में NVIDIA के पास और काम करने के लिए है।

तापमान पर निर्भर सेटिंग्स GPU बूस्ट के पहले संस्करण की तुलना में परीक्षण प्रक्रिया को और भी कठिन बना देती हैं। GK110 के तापमान को बढ़ाने या घटाने वाली कोई भी चीज चिप की घड़ी को बदल देती है। इसलिए रनों के बीच लगातार परिणाम हासिल करना काफी मुश्किल होता है। प्रयोगशाला स्थितियों में, कोई केवल स्थिर परिवेश के तापमान की आशा कर सकता है।

उपरोक्त के अलावा, यह ध्यान देने योग्य है कि आप तापमान सीमा बढ़ा सकते हैं। उदाहरण के लिए, यदि आप चाहते हैं NVIDIA GeForce GTX 780आवृत्ति और वोल्टेज को 85 या 90 डिग्री सेल्सियस के स्तर पर कम किया, इसे मापदंडों में कॉन्फ़िगर किया जा सकता है।

GK110 को अपनी चुनी हुई तापमान सीमा से यथासंभव दूर रखना चाहते हैं? पंखा वक्र NVIDIA GeForce GTX 780पूरी तरह से समायोज्य, आपको तापमान मूल्यों के अनुसार कर्तव्य चक्र को समायोजित करने की अनुमति देता है।

संभावित ओवरक्लॉकिंग समस्याएं

हमारे परिचित के दौरान GeForce GTX टाइटनकंपनी के प्रतिनिधियों ने हमें स्थिति को पढ़ने में सक्षम एक आंतरिक उपयोगिता दिखाई विभिन्न सेंसर: इसलिए यह कार्ड के गैर-मानक व्यवहार के निदान की प्रक्रिया को सरल करता है। यदि ओवरक्लॉकिंग के दौरान GK110 का तापमान बहुत अधिक बढ़ जाता है, तो थ्रॉटलिंग के दौरान भी, यह जानकारी लॉग में दर्ज की जाएगी।

अब कंपनी इस फ़ंक्शन को प्रेसिजन एक्स एप्लिकेशन के माध्यम से लागू करती है, जो एक चेतावनी एल्गोरिदम "कारण" लॉन्च करती है यदि त्वरण के दौरान ऐसी क्रियाएं होती हैं जो इसकी प्रभावी निरंतरता को रोकती हैं। यह एक बड़ी विशेषता है क्योंकि अब आपको संभावित बाधाओं के बारे में अनुमान लगाने की आवश्यकता नहीं है। एक OV मैक्स लिमिट इंडिकेटर भी है जो आपको बताएगा कि क्या आप GPU के पूर्ण पीक वोल्टेज तक पहुँच चुके हैं। ऐसे में कार्ड के जलने का खतरा रहता है। आप इसे ओवरक्लॉकिंग मापदंडों को कम करने के सुझाव के रूप में मान सकते हैं।

NVIDIA GeForce GTX 780 वीडियो कार्ड की समीक्षा | टेस्ट स्टैंड और बेंचमार्क


टेस्ट बेंच कॉन्फ़िगरेशन
CPU इंटेल कोर i7-3770K (आइवी ब्रिज) 3.5GHz @ 4.0GHz (40 * 100MHz), LGA 1155, 8MB साझा L3 कैश, हाइपर-थ्रेडिंग सक्षम, पावर-बचत सक्षम
मदरबोर्ड गीगाबाइट Z77X-UD5H (LGA 1155), Z77 एक्सप्रेस चिपसेट, BIOS F15q
टक्कर मारना G.Skill 16GB (4 x 4GB) DDR3-1600, F3-12800CL9Q2-32GBZL @ 9-9-9-24 1.5V पर
भंडारण युक्ति महत्वपूर्ण m4 SSD 256GB SATA 6Gb/s
वीडियो कार्ड एनवीडिया GeForce GTX 780 3 जीबी

एएमडी रेडियन एचडी 7990 6 जीबी

AMD Radeon HD 7970 GHz संस्करण 3 GB

एनवीडिया GeForce GTX 580 1.5 जीबी

एनवीडिया GeForce GTX 680 2 जीबी

एनवीडिया GeForce GTX टाइटन 6 जीबी

एनवीडिया GeForce GTX 690 4 जीबी

बिजली की आपूर्ति कूलर मास्टर UCP-1000W
सिस्टम सॉफ्टवेयर और ड्राइवर
ओएस विंडोज 8 प्रोफेशनल 64-बिट
डायरेक्टएक्स डायरेक्टएक्स 11
ग्राफ। ड्राइवरों एएमडी उत्प्रेरक 13.5 (बीटा 2)
एनवीडिया GeForce रिलीज 320.00
एनवीडिया GeForce रिलीज 320.18 (GeForce GTX 780 के लिए)

सही फ्रेम दर मान प्राप्त करना

पर्यवेक्षक पाठक देखेंगे कि निम्नलिखित पृष्ठों के आंकड़े समीक्षा की तुलना में अधिक मामूली हैं। एएमडी रेडियन एचडी 7990, और उसके लिए एक कारण है। पहले, हमने सिंथेटिक और वास्तविक फ्रेम दर प्रस्तुत की, और फिर गिराए गए और छोटे फ्रेम के साथ फ्रेम के बीच समय में उतार-चढ़ाव दिखाया। तथ्य यह है कि यह विधि वीडियो कार्ड के संचालन की वास्तविक भावनाओं को प्रतिबिंबित नहीं करती है, और हमारी ओर से फ्रेम के बीच समय की देरी के सिंथेटिक संकेतकों पर भरोसा करते हुए, एएमडी की निंदा करना अनुचित होगा।

इसलिए, फ़्रेम दर में उतार-चढ़ाव के साथ, अब हम अधिक व्यावहारिक गतिशील फ़्रेम दर मीट्रिक प्रदान कर रहे हैं। परिणाम उतने अधिक नहीं हैं, लेकिन साथ ही वे उन खेलों में बहुत वाक्पटु हैं जहां एएमडी कठिनाइयों का सामना कर रहा है।

परीक्षण और सेटिंग्स
रणभूमि 3 ग्राफिक्स क्वालिटी - अल्ट्रा, वी-सिंक ऑफ, 2560x1440, डायरेक्टएक्स 11, गोइंग हंटिंग, 90-सेकंड, एफसीएटी
फार क्राय 3 ग्राफिक्स गुणवत्ता - अल्ट्रा, डायरेक्टएक्स 11, वी-सिंक ऑफ, 2560x1440, अपना खुद का मार्ग चलाएं, 50-सेकंड, एफसीएटी
सीमावर्तीभूमि 2 ग्राफिक्स गुणवत्ता - उच्चतम, PhysX निम्न, 16x अनिसोट्रोपिक फ़िल्टरिंग, 2560x1440, अपना स्वयं का मार्ग चलाएं, FCAT
हत्यारे को क्षमादान ग्राफिक्स गुणवत्ता - अल्ट्रा, एमएसएए ऑफ, 2560x1440, बिल्ट-इन बेंचमार्क, एफसीएटी
द एल्डर स्क्रॉल वी: स्किरिम ग्राफिक्स गुणवत्ता - अल्ट्रा, एफएक्सएए सक्षम, 2560x1440, अपना खुद का मार्ग चलाएं, 25-सेकंड, एफसीएटी
3dmark फायर स्ट्राइक बेंचमार्क
अनंत बायोशॉक ग्राफिक्स गुणवत्ता - अल्ट्रा, डायरेक्टएक्स 11, डिफ्यूज़र डेप्थ ऑफ़ फील्ड, 2560x1440, बिल्ट-इन बेंचमार्क, FCAT
क्राईसिस 3 ग्राफिक्स गुणवत्ता - बहुत अधिक, MSAA: निम्न (2x), उच्च रिज़ॉल्यूशन टेक्स्ट, 2560x1440, अपने स्वयं के मार्ग पर चलाएं, 60-सेकंड, FCAT
टॉम्ब रेडर ग्राफिक्स गुणवत्ता - अल्टीमेट, एफएक्सएए सक्षम, 16x अनिसोट्रोपिक फ़िल्टरिंग, ट्रेसएफएक्स हेयर, 2560x1440, अपना खुद का मार्ग चलाएं, 45-सेकंड, एफसीएटी
लक्स मार्क 2.0 64-बिट बाइनरी, संस्करण 2.0, साला सीन
सिसॉफ्टवेयर सैंड्रा 2013 प्रोफेशनल सैंड्रा टेक सपोर्ट (इंजीनियर) 2013.SP1, क्रिप्टोग्राफी, वित्तीय विश्लेषण प्रदर्शन


विषय