Mājas / Mobilā OS / nvidia gpu boost 2.0 tehnoloģija. Video kartes. Ansel spēles ekrānuzņēmumu platforma

nvidia gpu boost 2.0 tehnoloģija. Video kartes. Ansel spēles ekrānuzņēmumu platforma

GPU Boost 2.0

Ar NVIDIA GeForce GTX 680 grafisko karti mums ir svarīga jauna funkcija: GPU Boost. Un jaunais NVIDIA GeForce GTX Titan iet vienu soli tālāk, paplašinot šo funkciju līdz GPU Boost 2.0. Pirmā GPU Boost 1.0 versija koncentrējās uz maksimālo enerģijas patēriņu, kas sasniegts visprasīgākajās mūsdienu spēlēs. Tajā pašā laikā GPU temperatūrai nebija īpašas nozīmes, izņemot, iespējams, ja tā tuvojās kritiskajam slieksnim. Maksimālā pulksteņa frekvence tika noteikta, pamatojoties uz relatīvo spriegumu. Trūkums bija diezgan acīmredzams: GPU Boost 1.0 nevarēja novērst situācijas, kad pat pie nekritiskiem spriegumiem temperatūra pārmērīgi paaugstinājās.

NVIDIA GeForce GTX Titan — GPU Boost 2.0

GeForce GTX Titan jau ir novērtējis divus parametrus: spriegumu un temperatūru. Tas ir, relatīvais spriegums (Vref) jau ir noteikts, pamatojoties uz šiem diviem parametriem. Protams, paļaušanās uz atsevišķiem GPU paliks, jo pastāv atšķirības mikroshēmu ražošanā, tāpēc katra videokarte atšķirsies no citām. Taču NVIDIA norāda, ka tehniski temperatūras pievienošana ļāva vidēji par 3–7 procentiem palielināt Boost pārspīlēšanu. GPU Boost 2.0 tehnoloģiju teorētiski varētu pārnest uz vecākām grafiskajām kartēm, taču maz ticams, ka tas notiks.

NVIDIA GeForce GTX Titan — GPU Boost 2.0

Sīkāk apskatīsim GPU Boost 2.0. Utilītas, piemēram, EVGA Precision Tool vai MSI Afterburner, jau atbalsta GPU Boost 2.0. Mēs izmantojām EVGA Precision Tool 4.0 versijā.

NVIDIA GeForce GTX Titan — GPU Boost 2.0

GPU Boost 2.0 apzinās temperatūru, un zemā temperatūrā tehnoloģija var ievērojami palielināt veiktspēju. Mērķa temperatūra (Ttarget) pēc noklusējuma ir iestatīta uz 80 °C.

NVIDIA GeForce GTX Titan — GPU Boost 2.0

GPU Boost 2.0 tehnoloģija satur visas funkcijas, kas mums ir pazīstamas no pirmās paaudzes tehnoloģiju, bet tajā pašā laikā papildus ļauj iestatīt augstāku spriegumu un līdz ar to augstākas pulksteņa frekvences. Overclockeriem ir iespēja mainīt iestatījumus. Varat iespējot GPU pārspriegumu, taču ņemiet vērā iespējamo grafikas kartes darbības laika samazināšanos.

NVIDIA GeForce GTX Titan — GPU Boost 2.0

Overclockers var paaugstināt Vref un Vmax (OverVoltaging). Daudzi lietotāji to vēlējās uz GK104, taču NVIDIA neuzticēja šādu iespēju ne lietotājiem, ne ražotājiem. Un mūsu pārbaudītā EVGA GTX 680 Classified videokarte (pārbaude un apskata) ir tikai lielisks piemērs. Ar šo videokarti īpašs EVGA Evbot modulis nodrošināja lietotājiem kontroli pār spriegumiem. Taču NVIDIA steidzami pieprasīja, lai EVGA no savām grafikas kartēm noņem papildu aparatūru. GPU Boost 2.0 un OverVoltaging gadījumā NVIDIA pati spēra soli šajā virzienā. Tātad grafisko karšu ražotāji var izlaist vairākus GeForce GTX Titan modeļus, piemēram, standarta versijas un rūpnīcas pārspīlētās versijas. OverVoltaging aktivizēšana tiek veikta, izmantojot VBIOS slēdzi (tas ir, tieši lietotājam, lai viņš apzinātos iespējamās sekas).

ParametrsNozīme
Mikroshēmas koda nosaukumsGP104
Ražošanas tehnoloģija16nm FinFET
Tranzistoru skaits7,2 miljardi
Galvenā zona314 mm²
Arhitektūra
DirectX aparatūras atbalsts
Atmiņas kopne
1607 (1733) MHz
Skaitļošanas bloki20 straumēšanas daudzprocesori, tostarp 2560 IEEE 754-2008 peldošā komata skalāra ALU;
Tekstūras bloki160 tekstūras adresācijas un filtrēšanas vienības ar atbalstu FP16 un FP32 komponentiem tekstūrās un atbalstu trilineārai un anizotropai filtrēšanai visiem tekstūras formātiem
Monitora atbalsts
GeForce GTX 1080 atsauces grafikas specifikācijas
ParametrsNozīme
Pamatfrekvence1607 (1733) MHz
2560
Tekstūras bloku skaits160
Sajaukšanas bloku skaits64
Efektīvā atmiņas frekvence10000 (4×2500) MHz
Atmiņas veidsGDDR5X
Atmiņas kopne256 bitu
Atmiņa8 GB
320 GB/s
apmēram 9 teraflopi
103 gigapikseļi/s
257 gigatekseli/s
RiepaPCI Express 3.0
Savienotāji
enerģijas patēriņšlīdz 180 W
Papildu ēdiensViens 8 kontaktu savienotājs
2
Ieteicamā cena599–699 $ (ASV), 54 990 RUB (Krievija)

Jaunais GeForce GTX 1080 videokartes modelis ieguva loģisku nosaukumu jaunās GeForce sērijas pirmajam risinājumam - no tiešā priekšgājēja tas atšķiras tikai ar mainītu paaudzes numuru. Jaunums ne tikai aizstāj augstākās klases risinājumus pašreizējā uzņēmuma līnijā, bet arī kādu laiku kļuva par jaunās sērijas flagmani, līdz Titan X tika izlaists uz vēl jaudīgākiem GPU. Zem tā hierarhijā ir arī jau izziņotais modelis GeForce GTX 1070, kura pamatā ir GP104 mikroshēmas attīrīta versija, kuru mēs apsvērsim tālāk.

Nvidia jaunās grafiskās kartes ieteicamās cenas ir attiecīgi 599 USD un 699 USD parastajiem un Founders izdevumiem (skatīt zemāk), kas ir diezgan labs darījums, ņemot vērā, ka GTX 1080 apsteidz ne tikai GTX 980 Ti, bet arī Titan X. Šodien jaunais produkts ir labākais risinājums veiktspējas ziņā viena mikroshēmas videokaršu tirgū bez jebkādiem jautājumiem, un tajā pašā laikā tas ir lētāks nekā jaudīgākās iepriekšējās paaudzes videokartes. Līdz šim GeForce GTX 1080 būtībā nav konkurentu no AMD, tāpēc Nvidia varēja noteikt sev piemērotu cenu.

Attiecīgās videokartes pamatā ir GP104 mikroshēma, kurai ir 256 bitu atmiņas kopne, bet jaunā tipa GDDR5X atmiņa darbojas ar ļoti augstu efektīvo frekvenci 10 GHz, kas nodrošina augstu maksimālo joslas platumu 320 GB/s. - kas ir gandrīz līdzvērtīgs GTX 980 Ti ar 384 bitu kopni. Videokartei ar šādu kopni uzstādītās atmiņas apjoms varētu būt 4 vai 8 GB, taču būtu stulbi mūsdienu apstākļos uzstādīt mazāku apjomu tik jaudīgam risinājumam, tāpēc GTX 1080 ieguva 8 GB atmiņu, un šī summa ir pietiekama, lai vairākus gadus palaistu jebkuru 3D lietojumprogrammu ar jebkādiem kvalitātes iestatījumiem.

GeForce GTX 1080 PCB, saprotams, diezgan atšķiras no uzņēmuma iepriekšējiem PCB. Tipiskā jaudas patēriņa vērtība jauniem elementiem ir 180 vati - nedaudz augstāka nekā GTX 980, bet ievērojami zemāka nekā mazāk jaudīgajiem Titan X un GTX 980 Ti. Atsauces platei ir parastais savienotāju komplekts attēla izvades ierīču pievienošanai: viens Dual-Link DVI, viens HDMI un trīs DisplayPort.

Dibinātāju izdevuma atsauces dizains

Pat līdz ar GeForce GTX 1080 izziņošanu maija sākumā tika izziņots videokartes īpašais izdevums ar nosaukumu Founders Edition, kuram ir augstāka cena nekā parastajām kompānijas partneru videokartēm. Faktiski šis izdevums ir kartes un dzesēšanas sistēmas atsauces dizains, un to ražo pati Nvidia. Var būt dažāda attieksme pret šādām videokaršu opcijām, taču uzņēmuma inženieru izstrādātajam un, izmantojot kvalitatīvus komponentus, ražotajam atsauces dizainam ir savi piekritēji.

Bet vai viņi maksās vairākus tūkstošus rubļu vairāk par pašas Nvidia videokarti, ir jautājums, uz kuru var atbildēt tikai prakse. Jebkurā gadījumā sākumā tās būs atsauces videokartes no Nvidia, kas pārdošanā parādīsies par paaugstinātu cenu, un nav no kā izvēlēties - tas notiek ar katru paziņojumu, taču atsauces GeForce GTX 1080 atšķiras ar to, ka šādā veidā plānots pārdot visu tā kalpošanas laiku līdz nākamās paaudzes risinājumu izlaišanai.

Nvidia uzskata, ka šim izdevumam ir savi nopelni pat pār labākajiem partneru darbiem. Piemēram, dzesētāja divu slotu dizains ļauj viegli salikt gan spēļu datorus ar salīdzinoši mazu formas faktoru, gan vairāku mikroshēmu video sistēmas, kuru pamatā ir šī jaudīgā videokarte (pat neskatoties uz to, ka trīs un četru mikroshēmu režīms nav ieteicams ko uzņēmums). GeForce GTX 1080 Founders Edition ir dažas priekšrocības efektīva dzesētāja veidā, izmantojot iztvaikošanas kameru, un ventilatoru, kas izspiež sakarsētu gaisu no korpusa – šis ir pirmais šāds Nvidia risinājums, kas patērē mazāk par 250 vatiem jaudas.

Salīdzinot ar uzņēmuma iepriekšējiem atsauces izstrādājumu dizainiem, strāvas ķēde ir modernizēta no četrfāzu uz piecu fāžu. Nvidia runā arī par uzlabotajiem komponentiem, uz kuriem balstīts jaunais produkts, samazināts arī elektriskais troksnis, lai uzlabotu sprieguma stabilitāti un pārspīlēšanas potenciālu. Visu uzlabojumu rezultātā atsauces plates jaudas efektivitāte ir palielinājusies par 6%, salīdzinot ar GeForce GTX 980.

Un, lai atšķirtos no "parastajiem" GeForce GTX 1080 modeļiem un ārēji, Founders Edition tika izstrādāts neparasts "sasmalcināts" korpusa dizains. Kas tomēr, iespējams, arī noveda pie iztvaikošanas kameras un radiatora formas sarežģījumiem (skat. foto), kas, iespējams, bija viens no iemesliem, kāpēc par šādu īpašo izdevumu jāmaksā 100 USD. Atkārtojam, ka izpārdošanas sākumā pircējiem nebūs lielas izvēles, taču turpmāk būs iespēja izvēlēties gan risinājumu ar savu dizainu no kāda no uzņēmuma partneriem, gan paša Nvidia izpildītu.

Jaunās paaudzes Pascal grafikas arhitektūra

Videokarte GeForce GTX 1080 ir kompānijas pirmais risinājums, kas balstīts uz GP104 mikroshēmu, kas pieder pie Nvidia Pascal grafiskās arhitektūras jaunās paaudzes. Lai gan jaunā arhitektūra ir balstīta uz Maxwell izstrādātajiem risinājumiem, tai ir arī būtiskas funkcionālas atšķirības, par kurām rakstīsim vēlāk. Galvenās izmaiņas no globālā viedokļa bija jaunas tehnoloģiskais process Uz kura ir izgatavots jaunais GPU.

16 nm FinFET procesa tehnoloģijas izmantošana GP104 GPU ražošanā Taivānas uzņēmuma TSMC rūpnīcās ļāva būtiski palielināt mikroshēmas sarežģītību, saglabājot salīdzinoši zemu platību un izmaksas. Salīdziniet tranzistoru skaitu un GP104 un GM204 mikroshēmu laukumu - tie ir tuvu laukumam (jaunuma mikroshēma ir pat fiziski mazāka), bet Pascal arhitektūras mikroshēmā ir ievērojami lielāks tranzistoru skaits un attiecīgi , izpildes vienības, tostarp tās, kas nodrošina jaunu funkcionalitāti.

No arhitektūras viedokļa pirmais spēļu Pascal ir ļoti līdzīgs līdzīgiem Maxwell arhitektūras risinājumiem, lai gan ir dažas atšķirības. Tāpat kā Maxwell, Pascal arhitektūras procesoriem būs dažādas grafikas apstrādes klasteru (GPC), straumēšanas daudzprocesoru (SM) un atmiņas kontrolleru konfigurācijas. SM daudzprocesors ir ļoti paralēls daudzprocesors, kas plāno un palaiž deformācijas (velki, 32 instrukciju plūsmu grupas) uz CUDA kodoliem un citām izpildes vienībām daudzprocesorā. Detalizētu informāciju par visu šo bloku dizainu varat atrast mūsu iepriekšējo Nvidia risinājumu apskatos.

Katrs no SM daudzprocesoriem ir savienots pārī ar PolyMorph Engine, kas apstrādā tekstūras paraugu ņemšanu, teselāciju, transformāciju, virsotņu atribūtu iestatīšanu un perspektīvas korekciju. Atšķirībā no uzņēmuma iepriekšējiem risinājumiem, PolyMorph Engine GP104 mikroshēmā satur arī jaunu vienlaicīgu daudzprojekcijas bloku, par kuru mēs runāsim tālāk. SM daudzprocesora kombinācija ar vienu Polymorph Engine tradicionāli tiek saukta par TPC — Texture Processor Cluster for Nvidia.

Kopumā GeForce GTX 1080 GP104 mikroshēmā ir četri GPC klasteri un 20 SM daudzprocesori, kā arī astoņi atmiņas kontrolleri, kas apvienoti ar 64 ROP. Katram GPC klasterim ir īpašs rastrizācijas dzinējs, un tajā ir iekļauti pieci SM. Katrs daudzprocesors savukārt sastāv no 128 CUDA kodoliem, 256 KB reģistra faila, 96 KB koplietojamās atmiņas, 48 ​​KB L1 kešatmiņas un astoņām TMU tekstūras vienībām. Tas nozīmē, ka kopumā GP104 satur 2560 CUDA kodolus un 160 TMU vienības.

Turklāt grafikas procesors, uz kura ir balstīts GeForce GTX 1080, satur astoņus 32 bitu (atšķirībā no iepriekš izmantotajiem 64 bitu) atmiņas kontrolieriem, kas dod mums pēdējo 256 bitu atmiņas kopni. Astoņi ROP un 256 KB L2 kešatmiņa ir piesaistīti katram atmiņas kontrollerim. Tas nozīmē, ka kopumā GP104 mikroshēmā ir 64 ROP un 2048 KB L2 kešatmiņas.

Pateicoties arhitektūras optimizācijai un jaunai procesa tehnoloģijai, pirmais spēļu Pascal ir kļuvis par visu laiku energoefektīvāko GPU. Turklāt to veicina gan viens no progresīvākajiem tehnoloģiskajiem procesiem 16 nm FinFET, gan arhitektūras optimizācijas, kas veiktas Pascal, salīdzinot ar Maxwell. Nvidia spēja palielināt pulksteņa ātrumu pat vairāk, nekā viņi gaidīja, pārejot uz jaunu procesa tehnoloģiju. GP104 darbojas ar lielāku frekvenci nekā hipotētiskais GM204, kas izgatavots, izmantojot 16 nm procesu. Lai to izdarītu, Nvidia inženieriem bija rūpīgi jāpārbauda un jāoptimizē visas iepriekšējo risinājumu vājās vietas, kas neļauj pārspīlēt virs noteikta sliekšņa. Rezultātā jaunais GeForce GTX 1080 darbojas ar vairāk nekā 40% lielāku takts frekvenci nekā GeForce GTX 980. Taču tas vēl nav viss, kas saistīts ar GPU pulksteņa izmaiņām.

GPU Boost 3.0 tehnoloģija

Kā mēs labi zinām no iepriekšējām Nvidia grafiskajām kartēm, tās savos GPU izmanto GPU Boost aparatūras tehnoloģiju, kas paredzēta, lai palielinātu GPU darbības takts ātrumu režīmos, kuros tas vēl nav sasniedzis enerģijas patēriņa un termiskās robežas. Gadu gaitā šis algoritms ir piedzīvojis daudzas izmaiņas, un Pascal arhitektūras video mikroshēmā tiek izmantota jau trešā šīs tehnoloģijas paaudze - GPU Boost 3.0, kuras galvenais jauninājums ir smalkāks turbo frekvenču iestatījums atkarībā no sprieguma.

Ja atceraties, kā tas darbojas iepriekšējās versijas tehnoloģija, tad starpība starp bāzes frekvenci (garantēta minimālā vērtība frekvence, zem kuras GPU nekrītas, vismaz spēlēs) un turbo frekvence tika fiksēta. Tas ir, turbo frekvence vienmēr bija pie noteiktu daudzumu megaherci virs bāzes. GPU Boost 3.0 ieviesa iespēju iestatīt turbo frekvences nobīdes katram spriegumam atsevišķi. Vienkāršākais veids, kā to saprast, ir ilustrācija:

Kreisajā pusē ir otrās versijas GPU Boost, labajā pusē - trešā, kas parādījās Pascal. Fiksētā atšķirība starp bāzes un turbo frekvencēm neļāva atklāt visas GPU iespējas, dažos gadījumos iepriekšējo paaudžu GPU varēja strādāt ātrāk iestatīt spriegumu, taču fiksēts turbo frekvences pārsniegums neļāva to izdarīt. Programmā GPU Boost 3.0 šī funkcija parādījās, un turbo frekvenci var iestatīt katrai atsevišķai sprieguma vērtībai, pilnībā izspiežot visu sulu no GPU.

Lai pārvaldītu pārspīlēšanu un iestatītu turbo frekvences līkni, ir nepieciešamas ērtas utilītas. Pati Nvidia to nedara, bet palīdz saviem partneriem izveidot šādas utilītas, lai atvieglotu pārspīlēšanu (protams, saprātīgās robežās). Piemēram, jauns funkcionalitāte GPU Boost 3.0 jau ir atklāts EVGA Precision XOC, kas ietver īpašu virstaktēšanas skeneri, kas automātiski atrod un iestata nelineāro atšķirību starp bāzes frekvenci un turbo frekvenci dažādiem spriegumiem, veicot iebūvēto veiktspējas un stabilitātes testu. Rezultātā lietotājs iegūst turbo frekvences līkni, kas lieliski atbilst konkrētas mikroshēmas iespējām. Kuru turklāt var jebkādā veidā modificēt manuālais režīms.

Kā redzat utilīta ekrānuzņēmumā, papildus informācijai par GPU un sistēmu ir arī virstaktēšanas iestatījumi: Power Target (nosaka tipisku enerģijas patēriņu overtaktēšanas laikā, procentos no standarta), GPU Temp Target. (maksimālā pieļaujamā kodola temperatūra), GPU pulksteņa nobīde (pārsniedzot bāzes frekvenci visām sprieguma vērtībām), atmiņas nobīde (pārsniedzot video atmiņas frekvenci virs noklusējuma vērtības), pārspriegums (papildu iespēja palielināt spriegumu).

Precision XOC utilīta ietver trīs pārspīlēšanas režīmus: pamata, lineāro un manuālo. Galvenajā režīmā varat iestatīt vienu overclock vērtību (fiksētu turbo frekvenci) virs pamata, kā tas bija iepriekšējos GPU. Lineārais režīms ļauj iestatīt frekvences rampu no minimālās uz maksimālo GPU sprieguma vērtībām. Manuālajā režīmā katram grafikas sprieguma punktam varat iestatīt unikālas GPU frekvences vērtības.

Lietderība ietver arī īpašu skeneri automātiskai pārspīlēšanai. Varat iestatīt savus frekvenču līmeņus vai ļaut Precision XOC skenēt GPU pie visiem spriegumiem un pilnīgi automātiski atrast stabilākās frekvences katram sprieguma un frekvences līknes punktam. Skenēšanas procesa laikā Precision XOC pakāpeniski palielina GPU frekvenci un pārbauda tā darbību, lai noteiktu stabilitāti vai artefaktus, izveidojot ideālu frekvences un sprieguma līkni, kas būs unikāla katrai konkrētai mikroshēmai.

Šo skeneri var pielāgot savām prasībām, iestatot laika intervālu katras sprieguma vērtības pārbaudei, minimālo un maksimālo pārbaudāmo frekvenci un tā pakāpi. Ir skaidrs, ka, lai sasniegtu stabilus rezultātus, labāk būtu noteikt nelielu soli un pienācīgu testēšanas ilgumu. Testēšanas laikā var novērot nestabilu video draivera un sistēmas darbību, taču, ja skeneris nesasaldēs, tas atjaunos darbību un turpinās atrast optimālās frekvences.

Jauna veida video atmiņa GDDR5X un uzlabota kompresija

Tātad GPU jauda ir ievērojami augusi, un atmiņas kopne ir palikusi tikai 256 bitu — vai atmiņas joslas platums ierobežos kopējo veiktspēju un ko ar to darīt? Šķiet, ka daudzsološais otrās paaudzes HBM joprojām ir pārāk dārgs ražošanai, tāpēc bija jāmeklē citi varianti. Kopš GDDR5 atmiņas ieviešanas 2009. gadā Nvidia inženieri ir pētījuši iespējas izmantot jaunus atmiņas veidus. Rezultātā ir ieviesti jauni atmiņas standarti GDDR5X – līdz šim vissarežģītākais un progresīvākais standarts, kas nodrošina pārsūtīšanas ātrumu 10 Gbps.

Nvidia sniedz interesantu piemēru tam, cik ātri tas ir. Starp pārraidītajiem bitiem paiet tikai 100 pikosekundes — šajā laikā gaismas stars virzīsies tikai vienas collas (apmēram 2,5 cm) attālumā. Un, izmantojot GDDR5X atmiņu, datu saņemšanas shēmām ir jāizvēlas pārraidītā bita vērtība mazāk nekā pusē no šī laika, pirms tiek nosūtīts nākamais - tas ir tikai tāpēc, lai jūs saprastu, pie kā ir nonākušas mūsdienu tehnoloģijas.

Lai sasniegtu šo ātrumu, bija jāizstrādā jauna I/O sistēmas arhitektūra, kas prasīja vairākus gadus kopīga izstrāde ar atmiņas mikroshēmu ražotājiem. Papildus palielinātajam datu pārraides ātrumam ir palielinājusies arī energoefektivitāte - GDDR5X atmiņas mikroshēmas izmanto zemāku 1,35 V spriegumu un tiek ražotas, izmantojot jaunas tehnoloģijas, kas dod tādu pašu enerģijas patēriņu par 43% augstāku frekvenci.

Uzņēmuma inženieriem bija jāpārstrādā datu pārraides līnijas starp GPU kodolu un atmiņas mikroshēmām, pievēršot lielāku uzmanību signāla zuduma un signāla pasliktināšanās novēršanai no atmiņas līdz GPU un atpakaļ. Tātad iepriekš redzamajā ilustrācijā uzņemtais signāls ir parādīts kā liela simetriska "acs", kas norāda uz labu visas ķēdes optimizāciju un relatīvo vieglumu datu uztveršanai no signāla. Turklāt iepriekš aprakstītās izmaiņas ir radījušas ne tikai iespēju izmantot GDDR5X pie 10 GHz, bet arī tām vajadzētu palīdzēt iegūt lielu atmiņas joslas platumu turpmākajos produktos, izmantojot pazīstamāko GDDR5 atmiņu.

Izmantojot jauno atmiņu, atmiņas joslas platums ir palielinājies par vairāk nekā 40%. Bet vai ar to nepietiek? Lai vēl vairāk palielinātu atmiņas joslas platuma efektivitāti, Nvidia turpināja uzlabot uzlaboto datu saspiešanu, kas ieviesta iepriekšējās arhitektūrās. GeForce GTX 1080 atmiņas apakšsistēmā tiek izmantotas uzlabotas un vairākas jaunas bezzudumu datu saspiešanas metodes, kas paredzētas joslas platuma prasību samazināšanai – jau ceturtās paaudzes mikroshēmas saspiešanai.

Algoritmi datu saspiešanai atmiņā vienlaikus sniedz vairākus pozitīvus aspektus. Saspiešana samazina atmiņā ierakstīto datu apjomu, tas pats attiecas uz datiem, kas tiek pārsūtīti no video atmiņas uz L2 kešatmiņu, kas uzlabo L2 kešatmiņas izmantošanas efektivitāti, jo saspiestai flīzei (vairāku kadru bufera pikseļu blokam) ir mazāks izmērs nekā nesaspiestu. Tas arī samazina datu apjomu, kas tiek nosūtīts starp dažādiem punktiem, piemēram, TMU tekstūras moduli un kadru buferi.

Datu kompresijas konveijers GPU izmanto vairākus algoritmus, kas tiek noteikti atkarībā no datu "saspiežamības" – tiem tiek izvēlēts labākais pieejamais algoritms. Viens no svarīgākajiem ir delta krāsu saspiešanas algoritms. Šī saspiešanas metode kodē datus kā atšķirību starp secīgām vērtībām, nevis pašus datus. GPU aprēķina krāsu vērtību atšķirību starp pikseļiem blokā (flīzē) un saglabā bloku kā vidējo krāsu visam blokam, kā arī datus par vērtību atšķirībām katram pikselim. Grafiskajiem datiem šī metode parasti ir labi piemērota, jo krāsa mazajās flīzēs visiem pikseļiem bieži neatšķiras pārāk daudz.

GeForce GTX 1080 GP104 GPU atbalsta vairāk saspiešanas algoritmu nekā iepriekšējās Maxwell mikroshēmas. Tādējādi 2:1 saspiešanas algoritms ir kļuvis efektīvāks, un papildus tam ir parādījušies divi jauni algoritmi: 4:1 saspiešanas režīms, kas piemērots gadījumiem, kad bloka pikseļu krāsu vērtības atšķirība ir ļoti liela. mazs, un 8:1 režīms, kas apvieno pastāvīgu 4:1 saspiešanu 2 × 2 pikseļu blokos ar 2x delta saspiešanu starp blokiem. Ja saspiešana vispār nav iespējama, to neizmanto.

Tomēr patiesībā pēdējais notiek ļoti reti. To var redzēt no spēles Project CARS ekrānuzņēmumu piemēriem, kurus Nvidia minēja, lai ilustrētu palielināto saspiešanas pakāpi programmā Pascal. Ilustrācijās tās kadru bufera flīzes, kuras varēja saspiest ar GPU, ir iekrāsotas purpursarkanā krāsā, un tās, kuras nevar saspiest bez zaudējumiem, palika sākotnējā krāsā (augšpusē - Maxwell, apakšā - Pascal).

Kā redzat, jaunie saspiešanas algoritmi GP104 patiešām darbojas daudz labāk nekā Maxwell. Lai gan vecā arhitektūra spēja saspiest arī lielāko daļu no ainas redzamajām flīzēm, daudzus zālienus un kokus ap malām, kā arī automašīnu detaļas nepakļauj mantotie saspiešanas algoritmi. Bet, iekļaujot jaunas metodes Pascal, ļoti neliels skaits attēla apgabalu palika nesaspiesti — ir acīmredzama uzlabota efektivitāte.

Datu kompresijas uzlabojumu rezultātā GeForce GTX 1080 spēj ievērojami samazināt vienā kadrā nosūtīto datu apjomu. Skaitļos, uzlabota saspiešana ietaupa papildu 20% no faktiskā atmiņas joslas platuma. Papildus GeForce GTX 1080 atmiņas joslas platuma palielinājumam par vairāk nekā 40% salīdzinājumā ar GTX 980, izmantojot GDDR5X atmiņu, tas viss kopā nodrošina aptuveni 70% faktiskā atmiņas joslas platuma pieaugumu salīdzinājumā ar iepriekšējās paaudzes modeli.

Async Compute atbalsts

Lielākajā daļā mūsdienu spēļu papildus grafikai tiek izmantoti sarežģīti aprēķini. Piemēram, aprēķinus, aprēķinot fizisko ķermeņu uzvedību, var veikt nevis pirms vai pēc grafiskiem aprēķiniem, bet gan vienlaikus ar tiem, jo ​​tie nav saistīti viens ar otru un nav atkarīgi viens no otra vienā kadrā. Vēl viens piemērs ir jau renderētu kadru pēcapstrāde un audio datu apstrāde, ko var veikt arī paralēli renderēšanai.

Vēl viens spilgts funkcionalitātes izmantošanas piemērs ir Asynchronous Time Warp tehnika, ko izmanto VR sistēmās, lai mainītu izvades kadru atbilstoši atskaņotāja galvas kustībai tieši pirms tā izvadīšanas, pārtraucot nākamā renderēšanu. Šāda GPU jaudu asinhronā ielāde ļauj palielināt tā izpildes vienību izmantošanas efektivitāti.

Šīs darba slodzes rada divus jaunus GPU lietošanas scenārijus. Pirmais no tiem ietver slodzes, kas pārklājas, jo daudzu veidu uzdevumi pilnībā neizmanto GPU iespējas, un daži resursi ir dīkstāvē. Šādos gadījumos vienā GPU var vienkārši palaist divus dažādus uzdevumus, atdalot tā izpildes vienības, lai efektīvāk izmantotu, piemēram, PhysX efektus, kas darbojas kopā ar kadra 3D renderēšanu.

Lai uzlabotu šī scenārija veiktspēju, Pascal arhitektūra ieviesa dinamisku slodzes līdzsvarošanu. Iepriekšējā Maxwell arhitektūrā pārklājošās darba slodzes tika ieviestas kā statisks GPU resursu sadalījums starp grafiku un aprēķinu. Šī pieeja ir efektīva, ja līdzsvars starp abām darba slodzēm aptuveni atbilst resursu sadalījumam un uzdevumi tiek izpildīti vienādi laikā. Ja negrafiskie aprēķini aizņem ilgāku laiku nekā grafiskie un abi gaida kopējā darba pabeigšanu, tad daļa GPU atlikušo laiku būs dīkstāvē, kas izraisīs kopējās veiktspējas samazināšanos un anulēs visas priekšrocības. Savukārt aparatūras dinamiskā slodzes līdzsvarošana ļauj izmantot atbrīvotos GPU resursus, tiklīdz tie kļūst pieejami – izpratnei sniegsim ilustrāciju.

Ir arī uzdevumi, kas ir kritiski laika ziņā, un šis ir otrais asinhronās skaitļošanas scenārijs. Piemēram, asinhronā laika kropļojumu algoritma izpilde VR ir jāpabeidz pirms skenēšanas, pretējā gadījumā kadrs tiks atmests. Šādā gadījumā GPU ir jāatbalsta ļoti ātra uzdevuma pārtraukšana un pārslēgšanās uz citu uzdevumu, lai no GPU izpildes izņemtu mazāk kritisku uzdevumu, atbrīvojot tā resursus kritisko uzdevumu veikšanai – to sauc par priekšrocību.

Viena atveidošanas komanda no spēles dzinēja var ietvert simtiem izsaukumu, savukārt katrs zīmēšanas izsaukums satur simtiem renderētu trīsstūru, katrs satur simtiem pikseļu, kas jāaprēķina un jāzīmē. Tradicionālā GPU pieeja izmanto tikai augsta līmeņa uzdevumu pārtraukšanu, un grafikas konveijeram ir jāgaida, līdz tiek pabeigts viss darbs, pirms pārslēdzat uzdevumus, kā rezultātā rodas ļoti liels latentums.

Lai to labotu, Pascal arhitektūra vispirms ieviesa iespēju pārtraukt uzdevumu pikseļu līmenī - Pixel Level Preemption. Pascal GPU izpildes vienības var pastāvīgi uzraudzīt renderēšanas uzdevumu gaitu, un, kad tiek pieprasīts pārtraukums, tās var apturēt izpildi, saglabājot kontekstu vēlākai pabeigšanai, ātri pārslēdzoties uz citu uzdevumu.

Pavedienu līmeņa pārtraukums un pārslēgšana skaitļošanas operācijām darbojas līdzīgi pikseļu līmeņa pārtraukumam grafiskai skaitļošanai. Aprēķinu darba slodzes sastāv no vairākiem režģiem, no kuriem katrs satur vairākus pavedienus. Kad tiek saņemts pārtraukšanas pieprasījums, pavedieni, kas darbojas daudzprocesorā, pārtrauc to izpildi. Citi bloki saglabā savu stāvokli, lai turpmāk turpinātu no tā paša punkta, un GPU pārslēdzas uz citu uzdevumu. Viss uzdevumu pārslēgšanas process aizņem mazāk nekā 100 mikrosekundes pēc tam, kad darbojas pavedieni.

Spēļu darba slodzēm pikseļu līmeņa pārtraukumu grafikai un pavedienu līmeņa pārtraukumu kombinācija skaitļošanas uzdevumiem sniedz Pascal arhitektūras GPU iespēju ātri pārslēgties starp uzdevumiem ar minimālu laika zudumu. Un skaitļošanas uzdevumiem CUDA ir iespējams arī pārtraukt ar minimālu precizitāti - instrukciju līmenī. Šajā režīmā visi pavedieni uzreiz pārtrauc izpildi, nekavējoties pārslēdzoties uz citu uzdevumu. Šī pieeja prasa saglabāt vairāk informācijas par katra pavediena visu reģistru stāvokli, taču dažos negrafisko aprēķinu gadījumos tas ir diezgan pamatoti.

Ātro pārtraukumu un uzdevumu pārslēgšanas izmantošana grafiskos un skaitļošanas uzdevumos tika pievienota Pascal arhitektūrai, lai grafiskos un negrafiskos uzdevumus varētu pārtraukt atsevišķu instrukciju līmenī, nevis veselu pavedienu līmenī, kā tas bija Maksvela un Keplera gadījumā. . Šīs tehnoloģijas var uzlabot dažādu GPU darba slodžu asinhrono izpildi un uzlabot atsaucību, vienlaikus izpildot vairākus uzdevumus. Nvidia pasākumā viņi demonstrēja asinhrono aprēķinu darbu, izmantojot fizisko efektu aprēķināšanas piemēru. Ja bez asinhroniem aprēķiniem veiktspēja bija 77-79 FPS līmenī, tad, iekļaujot šīs funkcijas, kadru ātrums palielinājās līdz 93-94 FPS.

Mēs jau esam snieguši piemēru vienai no iespējām izmantot šo funkcionalitāti spēlēs asinhronā laika izkropļojuma veidā VR. Attēlā parādīta šīs tehnoloģijas darbība ar tradicionālu pārtraukumu (preemption) un ātru. Pirmajā gadījumā asinhrono laika kropļojumu procesu mēģina veikt pēc iespējas vēlāk, bet pirms attēla atjaunināšanas displejā. Bet algoritma darbs ir jānodod izpildei GPU dažas milisekundes agrāk, jo bez ātra pārtraukuma nav iespējams precīzi izpildīt darbu īstajā laikā, un GPU kādu laiku ir dīkstāvē.

Precīza pārtraukuma gadījumā pikseļu un pavedienu līmenī (parādīts labajā pusē), šī iespēja nodrošina lielāku precizitāti pārtraukuma brīža noteikšanā, un asinhrono laika deformāciju var sākt daudz vēlāk, ar pārliecību par darba pabeigšanu pirms sākas informācijas atjaunināšana displejā. Un dīkstāvē kādu laiku pirmajā gadījumā GPU var ielādēt ar kādu papildu grafisko darbu.

Vienlaicīgas vairāku projekcijas tehnoloģija

Jaunais GP104 GPU tagad atbalsta jauna tehnoloģija vairāku projekciju (Simultaneous Multi-Projection — SMP), kas ļauj GPU efektīvāk renderēt datus par mūsdienu attēlveidošanas sistēmām. SMP ļauj video mikroshēmai vienlaicīgi attēlot datus vairākās projekcijās, kas prasīja GPU kā daļu no PolyMorph dzinēja ieviest jaunu aparatūras bloku ģeometriskā konveijera beigās pirms rastrizācijas bloka. Šis bloks ir atbildīgs par darbu ar vairākām projekcijām vienai ģeometrijas straumei.

Vairāku projekciju dzinējs vienlaikus apstrādā ģeometriskos datus 16 iepriekš konfigurētām projekcijām, kas apvieno projekcijas punktu (kameras), šīs projekcijas var neatkarīgi pagriezt vai noliekt. Tā kā katrs ģeometrijas primitīvs var parādīties vienlaicīgi vairākās projekcijās, SMP dzinējs nodrošina šo funkcionalitāti, ļaujot lietojumprogrammai dot norādījumus video mikroshēmai replicēt ģeometriju līdz 32 reizēm (16 projekcijas divos projekciju centros) bez papildu apstrādes.

Viss apstrādes process tiek paātrināts ar aparatūru, un, tā kā daudzprojekcija darbojas pēc ģeometrijas dzinēja, tai nav nepieciešams vairākas reizes atkārtot visus ģeometrijas apstrādes posmus. Saglabātie resursi ir svarīgi, ja renderēšanas ātrumu ierobežo ģeometrijas apstrādes veiktspēja, piemēram, teselācija, kad viens un tas pats ģeometriskais darbs tiek veikts vairākas reizes katrai projekcijai. Attiecīgi pīķa gadījumā daudzprojekcija var samazināt vajadzību pēc ģeometrijas apstrādes līdz pat 32 reizēm.

Bet kāpēc tas viss ir vajadzīgs? Ir vairāki labi piemēri, kur var būt noderīga vairāku projekciju tehnoloģija. Piemēram, vairāku monitoru sistēma ar trim displejiem, kas uzstādīti leņķī viens pret otru pietiekami tuvu lietotājam (telpiskā konfigurācija). Tipiskā situācijā aina tiek atveidota vienā projekcijā, kas noved pie ģeometriskiem izkropļojumiem un nepareizas ģeometrijas atveidošanas. Pareizais veids ir trīs dažādas projekcijas katram monitoram atkarībā no leņķa, kādā tie atrodas.

Ar video karti mikroshēmā ar Pascal arhitektūru to var izdarīt vienā ģeometrijas piegājienā, norādot trīs dažādas projekcijas, katra citam monitoram. Un lietotājs līdz ar to varēs mainīt leņķi, kādā monitori atrodas viens pret otru ne tikai fiziski, bet arī virtuāli - pagriežot sānu monitoru projekcijas, lai 3D sižetā iegūtu pareizo perspektīvu ar ievērojami plašāks skata leņķis (FOV). Tiesa, šeit ir ierobežojums – šādam atbalstam aplikācijai ir jāspēj renderēt sižetu ar plašu FOV un tā iestatīšanai jāizmanto speciāli SMP API izsaukumi. Tas ir, jūs nevarat to izdarīt katrā spēlē, jums ir nepieciešams īpašs atbalsts.

Jebkurā gadījumā laiki, kad viena plakanā monitorā bija viena projicēšana, ir beigušies, tagad ir daudz vairāku monitoru konfigurāciju un izliektu displeju, kas var izmantot arī šo tehnoloģiju. Nemaz nerunājot par virtuālās realitātes sistēmām, kurās starp ekrāniem un lietotāja acīm tiek izmantotas īpašas lēcas, kurām nepieciešamas jaunas metodes 3D attēla projicēšanai 2D attēlā. Daudzas no šīm tehnoloģijām un paņēmieniem joprojām ir izstrādes sākumā, galvenais ir tas, ka vecāki GPU nevar efektīvi izmantot vairāk nekā vienu plakanu projekciju. Tiem ir nepieciešamas vairākas renderēšanas kārtas, vienas un tās pašas ģeometrijas vairākkārtēja apstrāde utt.

Maxwell mikroshēmām bija ierobežots Multi-Resolution atbalsts, lai palīdzētu palielināt efektivitāti, taču Pascal SMP var darīt daudz vairāk. Maksvels varēja pagriezt projekciju par 90 grādiem kubu kartēšanai vai dažādām projekcijas izšķirtspējām, taču tas bija noderīgi tikai ierobežotā lietojumprogrammu diapazonā, piemēram, VXGI.

Citas SMP izmantošanas iespējas ietver renderēšanu ar dažādām izšķirtspējām un vienas kārtas stereo renderēšanu. Piemēram, spēlēs var izmantot renderēšanu dažādās izšķirtspējās (Multi-Res Shading), lai optimizētu veiktspēju. Lietojot, kadra centrā tiek izmantota augstāka izšķirtspēja, bet perifērijā tā tiek samazināta, lai iegūtu ātrāku renderēšanas ātrumu.

VR tiek izmantota vienas piespēles stereo renderēšana, tā jau ir pievienota VRWorks pakotnei un izmanto vairāku projekcijas funkciju, lai samazinātu VR renderēšanā nepieciešamā ģeometriskā darba apjomu. Ja šī funkcija tiek izmantota, GeForce GTX 1080 GPU apstrādā ainas ģeometriju tikai vienu reizi, ģenerējot divas projekcijas katrai acij uzreiz, kas samazina GPU ģeometrisko slodzi uz pusi, kā arī samazina draivera un OS radītos zaudējumus.

Vēl progresīvāks paņēmiens VR renderēšanas efektivitātes uzlabošanai ir Lens Matched Shading, kas izmanto vairākas projekcijas, lai modelētu VR renderēšanai nepieciešamos ģeometriskos kropļojumus. Šī metode izmanto vairāku projicēšanu, lai atveidotu 3D sižetu uz virsmas, kas tuvināta objektīvam pielāgotajai virsmai, kad tiek renderēta VR austiņu izvadei, izvairoties no daudziem papildu pikseļiem perifērijā, kas tiktu izmesti. Metodes būtību visvieglāk izprast ar ilustrāciju – katras acs priekšā tiek izmantotas četras nedaudz paplašinātas projekcijas (Paskālā katrai acij var izmantot 16 projekcijas – lai precīzāk simulētu izliektu lēcu), nevis viena:

Šī pieeja var radīt ievērojamus veiktspējas ietaupījumus. Piemēram, tipisks Oculus Rift attēls uz vienu aci ir 1,1 megapikseļi. Bet projekciju atšķirību dēļ, lai to renderētu, sākotnējais attēls ir 2,1 megapikseļi - par 86% vairāk nekā nepieciešams! Pascal arhitektūrā ieviestā daudzprojekcijas izmantošana ļauj samazināt renderētā attēla izšķirtspēju līdz 1,4 megapikseļiem, iegūstot 1,5 reizes mazāku pikseļu apstrādes ātrumu, kā arī ietaupa atmiņas joslas platumu.

Un līdztekus divkāršam ģeometrijas apstrādes ātruma ietaupījumam, pateicoties vienas piespēles stereo renderēšanai, GeForce GTX 1080 grafikas procesors spēj nodrošināt ievērojamu VR renderēšanas veiktspējas pieaugumu, kas ir ļoti prasīgs ģeometrijas apstrādes ātrumam un vēl jo vairāk. pikseļu apstrāde.

Uzlabojumi video izvadē un apstrādes blokos

Papildus veiktspējai un jaunajai funkcionalitātei, kas saistīta ar 3D renderēšanu, ir nepieciešams uzturēt labu attēla izvades līmeni, kā arī video dekodēšanu un kodēšanu. Un pirmais Pascal arhitektūras grafikas procesors nepievīla - tas atbalsta visus mūsdienu standartus šajā ziņā, tostarp HEVC formāta aparatūras dekodēšanu, kas nepieciešama 4K video skatīšanai datorā. Arī nākamie GeForce GTX 1080 grafisko karšu īpašnieki drīzumā savās sistēmās varēs baudīt 4K video straumēšanu no Netflix un citiem pakalpojumu sniedzējiem.

Runājot par displeja izvadi, GeForce GTX 1080 atbalsta HDMI 2.0b ar HDCP 2.2, kā arī DisplayPort. Pagaidām DP 1.2 versija ir sertificēta, bet GPU ir gatavs sertifikācijai jaunākām standarta versijām: DP 1.3 Ready un DP 1.4 Ready. Pēdējais ļauj attēlot 4K ekrānus ar frekvenci 120 Hz un 5K un 8K displejus ar frekvenci 60 Hz, izmantojot DisplayPort 1.3 kabeļu pāri. Ja GTX 980 maksimālā atbalstītā izšķirtspēja bija 5120x3200 pie 60Hz, tad jaunajam GTX 1080 modelim tā ir izaugusi līdz 7680x4320 pie tiem pašiem 60Hz. Atsauces GeForce GTX 1080 ir trīs DisplayPort izejas, viena HDMI 2.0b un viena digitālā Dual-Link DVI.

Jaunais Nvidia videokartes modelis saņēma arī uzlabotu bloku video datu dekodēšanai un kodēšanai. Tādējādi GP104 mikroshēma atbilst augstajiem PlayReady 3.0 (SL3000) standartiem video straumēšanas atskaņošanai, kas ļauj būt pārliecinātiem, ka augstas kvalitātes satura atskaņošana no pazīstamiem pakalpojumu sniedzējiem, piemēram, Netflix, būs visaugstākā kvalitāte un energoefektīvākā. . Sīkāka informācija par dažādu video formātu atbalstu kodēšanas un dekodēšanas laikā ir sniegta tabulā, jaunais produkts skaidri atšķiras no iepriekšējiem risinājumiem, lai labāk:

Taču vēl interesantāks jaunums ir atbalsts tā sauktajiem High Dynamic Range (HDR) displejiem, kas drīzumā sāks izplatīties tirgū. Televizori tiek pārdoti jau 2016. gadā (paredzams, ka tikai viena gada laikā tiks pārdoti četri miljoni HDR televizoru), un monitori nākamgad. HDR ir lielākais sasniegums displeju tehnoloģijā pēdējos gados, nodrošinot divkāršus krāsu toņus (75% redzamā spektra salīdzinājumā ar 33% RGB), spilgtākus displejus (1000 niti) ar lielāku kontrastu (10000:1) un bagātīgas krāsas.

Parādoties iespējai atskaņot saturu ar lielāku spilgtuma atšķirību un bagātīgākām un piesātinātākām krāsām, attēls ekrānā tiks tuvināts realitātei, melnā krāsa kļūs dziļāka, spilgtā gaisma apžilbinās, tāpat kā reālajā pasaulē. . Attiecīgi lietotāji redzēs vairāk detaļu gaišajos un tumšajos attēlu apgabalos, salīdzinot ar standarta monitoriem un televizoriem.

Lai atbalstītu HDR displejus, GeForce GTX 1080 ir viss nepieciešamais — 12 bitu krāsu izvade, BT.2020 un SMPTE 2084 standartu atbalsts un HDMI 2.0b 10/12 bitu 4K HDR izvades izšķirtspēja, kā tas bija gadījumā Maksvels. Turklāt Pascal ir pievienojis atbalstu HEVC formāta dekodēšanai 4K izšķirtspējā 60 Hz un 10 vai 12 bitu krāsā, kas tiek izmantota HDR video, kā arī tāda paša formāta kodēšanai ar vienādiem parametriem, bet tikai 10 -bits HDR video ierakstīšanai vai straumēšanai. Tāpat jaunums ir gatavs DisplayPort 1.4 standartizācijai HDR datu pārraidei caur šo savienotāju.

Starp citu, nākotnē var būt nepieciešams HDR video kodējums, lai pārsūtītu šādus datus no mājas datora uz SHIELD spēļu konsoli, kas spēj atskaņot 10 bitu HEVC. Tas ir, lietotājs varēs pārraidīt spēli no datora HDR formātā. Pagaidiet, kur es varu dabūt spēles ar šādu atbalstu? Nvidia pastāvīgi sadarbojas ar spēļu izstrādātājiem, lai ieviestu šo atbalstu, sniedzot viņiem visu nepieciešamo (draivera atbalsts, koda paraugi utt.), lai pareizi renderētu ar esošajiem displejiem saderīgus HDR attēlus.

Videokartes GeForce GTX 1080 izlaišanas brīdī HDR izvadi atbalsta tādas spēles kā Obduction, The Witness, Lawbreakers, Rise of the Tomb Raider, Paragon, The Talos Principle un Shadow Warrior 2. Taču šis saraksts ir paredzēts papildināt tuvākajā nākotnē.

Izmaiņas vairāku mikroshēmu SLI renderēšanā

Bija arī dažas izmaiņas saistībā ar patentēto SLI vairāku mikroshēmu renderēšanas tehnoloģiju, lai gan neviens to negaidīja. SLI izmanto datorspēļu entuziasti, lai uzlabotu veiktspēju vai nu līdz galam, vienlaikus darbinot jaudīgākās viena mikroshēmas grafiskās kartes, vai arī, lai iegūtu ļoti augstu kadru nomaiņas ātrumu, ierobežojot sevi ar pāris vidēja līmeņa risinājumiem, kas dažkārt ir lētāki nekā viens top-end (strīdīgs lēmums, bet viņi to dara). Ar 4K monitoriem spēlētājiem gandrīz nav citu iespēju, kā vien uzstādīt pāris videokartes, jo pat top modeļi bieži vien šādos apstākļos nevar nodrošināt ērtu spēli maksimāli iestatījumos.

Viena no svarīgām Nvidia SLI sastāvdaļām ir tilti, kas savieno videokartes kopējā video apakšsistēmā un kalpo digitālā kanāla organizēšanai datu pārsūtīšanai starp tām. GeForce grafiskajām kartēm tradicionāli ir divi SLI savienotāji, kas kalpoja divu vai četru grafisko karšu savienošanai 3-Way un 4-Way SLI konfigurācijās. Katrai no videokartēm bija jābūt savienotām ar katru, jo visi GPU nosūtīja atveidotos kadrus uz galveno GPU, tāpēc katrā no platēm bija nepieciešamas divas saskarnes.

Sākot ar GeForce GTX 1080, visām Nvidia grafiskajām kartēm, kuru pamatā ir Pascal arhitektūra, ir divi kopā savienoti SLI interfeisi, lai palielinātu datu pārsūtīšanas veiktspēju starp grafikas kartēm, un šis jaunais divu kanālu SLI režīms uzlabo veiktspēju un komfortu, attēlojot vizuālo informāciju ļoti augstas izšķirtspējas displeji vai vairāku monitoru sistēmas.

Šim režīmam bija nepieciešami arī jauni tilti, ko sauc par SLI HB. Tie apvieno GeForce GTX 1080 video karšu pāri, izmantojot divus SLI kanālus vienlaikus, lai gan jaunās videokartes ir saderīgas arī ar vecākiem tiltiem. 1920×1080 un 2560×1440 pikseļu izšķirtspējai ar atsvaidzes intensitāti 60 Hz var izmantot standarta tiltus, bet prasīgākos režīmos (4K, 5K un vairāku monitoru sistēmās) labākus rezultātus ziņā nodrošinās tikai jauni tilti. no gludas rāmja maiņas, lai gan derēs vecie, bet nedaudz sliktāk.

Turklāt, izmantojot SLI HB tiltus, GeForce GTX 1080 datu saskarne darbojas ar 650 MHz, salīdzinot ar 400 MHz parastajiem SLI tiltiem vecākos GPU. Turklāt dažiem izturīgiem veciem tiltiem ir pieejams arī lielāks datu pārraides ātrums, izmantojot Pascal arhitektūras video mikroshēmas. Palielinoties datu pārraides ātrumam starp GPU, izmantojot dubultotu SLI interfeisu ar palielinātu darbības biežumu, tiek nodrošināts arī vienmērīgāks kadru attēlojums ekrānā, salīdzinot ar iepriekšējiem risinājumiem:

Tāpat jāatzīmē, ka atbalsts vairāku mikroshēmu renderēšanai programmā DirectX 12 nedaudz atšķiras no tā, kas bija ierasts iepriekš. AT jaunākā versija grafikas API, Microsoft ir veikusi daudzas izmaiņas saistībā ar šādu video sistēmu darbību. Programmatūras izstrādātājiem DX12 ir pieejamas divas vairāku GPU opcijas: vairāku displeja adaptera (MDA) un saistītā displeja adaptera (LDA) režīmi.

Turklāt LDA režīmam ir divas formas: Implicit LDA (ko Nvidia izmanto SLI) un Explicit LDA (kad spēles izstrādātājs uzņemas uzdevumu pārvaldīt vairāku mikroshēmu renderēšanu. MDA un Explicit LDA režīmi tika tikko ieviesti DirectX 12 lai spēļu izstrādātājiem būtu vairāk brīvības un iespēju, izmantojot vairāku mikroshēmu video sistēmas. Atšķirība starp režīmiem ir skaidri redzama šajā tabulā:

LDA režīmā katra GPU atmiņu var savienot ar cita atmiņu un parādīt kā lielu kopējo apjomu, protams, ar visiem veiktspējas ierobežojumiem, kad dati tiek ņemti no "svešas" atmiņas. MDA režīmā katra GPU atmiņa darbojas atsevišķi, un dažādi GPU nevar tieši piekļūt datiem no cita GPU atmiņas. LDA režīms ir paredzēts vairāku mikroshēmu sistēmām ar līdzīgu veiktspēju, savukārt MDA režīms ir mazāk ierobežojošs un var darboties kopā ar diskrētiem un integrētiem GPU vai diskrētiem risinājumiem ar dažādu ražotāju mikroshēmām. Taču šis režīms arī prasa lielāku uzmanību un darbu no izstrādātājiem, programmējot sadarbību, lai GPU varētu sazināties savā starpā.

Pēc noklusējuma uz GeForce GTX 1080 balstītā SLI sistēma atbalsta tikai divus GPU, un trīs un četru GPU konfigurācijas ir oficiāli novecojušas, jo mūsdienu spēlēm kļūst arvien grūtāk sasniegt veiktspējas pieaugumu, pievienojot trešo un ceturto GPU. Piemēram, daudzas spēles paļaujas uz sistēmas centrālā procesora iespējām, darbinot vairāku mikroshēmu video sistēmas, un jaunās spēlēs arvien vairāk tiek izmantotas temporālās (temporālās) metodes, kurās tiek izmantoti dati no iepriekšējiem kadriem, kuros vienlaikus tiek nodrošināta efektīva vairāku GPU darbība. vienkārši neiespējami.

Tomēr joprojām ir iespējama sistēmu darbība citās (bez SLI) vairāku mikroshēmu sistēmās, piemēram, MDA vai LDA Explicit režīmos DirectX 12 vai divu mikroshēmu SLI sistēmā ar īpašu trešo GPU PhysX fiziskajiem efektiem. Bet kā ir ar etalonu ierakstiem, vai Nvidia tiešām tos pilnībā atsakās? Nē, protams, nē, bet tā kā šādas sistēmas pasaulē pieprasa teju daži lietotāji, tad šādiem ultraentuziastiem tika izgudrots īpašs Enthusiast Key, kuru var lejupielādēt no Nvidia vietnes un atbloķēt šo funkciju. Lai to izdarītu, vispirms ir jāiegūst unikāls GPU ID, palaižot īpašu lietojumprogrammu, pēc tam vietnē jāpieprasa entuziastu atslēga un pēc tās lejupielādes jāinstalē atslēga sistēmā, tādējādi atbloķējot 3-Way un 4-Way. SLI konfigurācijas.

Ātrās sinhronizācijas tehnoloģija

Sinhronizācijas tehnoloģijās, kad tiek parādīta informācija displejā, ir notikušas dažas izmaiņas. Raugoties nākotnē, G-Sync nav nekā jauna, kā arī netiek atbalstīta Adaptive Sync tehnoloģija. Bet Nvidia nolēma uzlabot izvades vienmērīgumu un sinhronizāciju spēlēm, kuras rāda ļoti augsta veiktspēja kad kadru ātrums ievērojami pārsniedz monitora atsvaidzes intensitāti. Tas ir īpaši svarīgi spēlēm, kurām nepieciešams minimāls latentums un ātra reakcija, un kuras ir vairāku spēlētāju cīņas un sacensības.

Ātrā sinhronizācija ir jauna alternatīva vertikālajai sinhronizācijai, kurai nav vizuālu artefaktu attēla plīsuma veidā, un tā nav saistīta ar fiksētu atsvaidzes intensitāti, kas palielina aizkavi. Kāda ir vertikālās sinhronizācijas problēma tādās spēlēs kā Counter-Strike: Global Offensive? Šī spēle ar jaudīgiem mūsdienu GPU darbojas ar vairākiem simtiem kadru sekundē, un spēlētājam ir iespēja izvēlēties, vai iespējot v-sinhronizāciju vai ne.

Vairāku spēlētāju spēlēs lietotāji visbiežāk dzenas pēc minimālas aizkaves un atspējo VSync, iegūstot skaidri redzamu attēla plīsumu, kas ir ārkārtīgi nepatīkami pat pie liela kadru ātruma. Ja ieslēdzat v-sinhronizāciju, spēlētājs piedzīvos ievērojamu aizkaves pieaugumu starp viņa darbībām un attēlu ekrānā, kad grafikas cauruļvads palēnināsies līdz monitora atsvaidzes intensitātei.

Šādi darbojas tradicionālais cauruļvads. Taču Nvidia nolēma atdalīt attēla renderēšanas un parādīšanas procesu ekrānā, izmantojot Fast Sync tehnoloģiju. Tas ļauj jums turpināt, cik vien iespējams efektīvs darbs tai GPU daļai, kas renderē kadrus pilnā ātrumā, saglabājot šos kadrus īpašā pagaidu pēdējā renderētā buferī.

Šī metode ļauj mainīt displeja metodi un izmantot labāko no VSync On un VSync Off režīmiem, iegūstot zemu latentumu, bet bez attēla artefaktiem. Izmantojot Fast Sync, nav kadru plūsmas kontroles, spēles dzinējs darbojas sinhronizācijas izslēgšanas režīmā un netiek likts gaidīt, lai uzzīmētu vēl vienu, tāpēc latentumi ir gandrīz tikpat zemi kā VSync Off režīmā. Bet, tā kā Fast Sync neatkarīgi izvēlas buferi rādīšanai ekrānā un parāda visu kadru, attēla pārtraukumu arī nav.

Fast Sync izmanto trīs dažādus buferus, no kuriem pirmie divi darbojas līdzīgi kā dubultā buferizācija klasiskajā konveijerā. Primārais buferis (Front Buffer - FB) ir buferis, no kura informācija tiek parādīta displejā, pilnībā renderēts rāmis. Aizmugurējais buferis (Back Buffer — BB) ir buferis, kas renderēšanas laikā saņem informāciju.

Izmantojot vertikālo sinhronizāciju augsta kadru ātruma apstākļos, spēle gaida, līdz tiek sasniegts atsvaidzināšanas intervāls, lai apmainītu primāro buferi ar sekundāro buferi, lai ekrānā parādītu viena kadra attēlu. Tas palēnina darbību, un papildu buferu pievienošana, piemēram, tradicionālā trīskāršā buferizācija, tikai palielinās aizkavi.

Izmantojot ātro sinhronizāciju, tiek pievienots trešais pēdējais renderētais buferis (LRB), kas tiek izmantots, lai sekundārajā buferī saglabātu visus tikko renderētos kadrus. Bufera nosaukums runā pats par sevi, tajā ir pēdējā pilnībā renderētā kadra kopija. Un, kad pienāks laiks atjaunināt primāro buferi, šis LRB buferis tiek kopēts uz primāro pilnībā, nevis pa daļām, kā no sekundārā ar atspējotu vertikālo sinhronizāciju. Tā kā informācijas kopēšana no buferiem ir neefektīva, tie tiek vienkārši apmainīti (vai pārdēvēti, kā tas būs ērtāk saprotams), un jaunā buferu maiņas loģika, kas ieviesta GP104, pārvalda šo procesu.

Praksē jaunas sinhronizācijas metodes Fast Sync iekļaušana joprojām nodrošina nedaudz lielāku aizkavi, salīdzinot ar pilnībā atspējotu vertikālo sinhronizāciju – vidēji par 8 ms vairāk, taču tā monitorā parāda kadrus pilnībā, bez nepatīkamiem artefaktiem ekrānā, kas saplēst attēlu. Jauno metodi var iespējot no Nvidia vadības paneļa grafikas iestatījumiem vertikālās sinhronizācijas vadības sadaļā. Tomēr noklusējuma vērtība joprojām ir lietojumprogrammu vadība, un ātrās sinhronizācijas iespējošana visās 3D lietojumprogrammās vienkārši nav nepieciešama, labāk izvēlēties šo metodi spēlēm ar augstu FPS.

Virtuālās realitātes tehnoloģija Nvidia VRWorks

Šajā rakstā mēs vairāk nekā vienu reizi esam pieskārušies aktuālajai VR tēmai, taču tas galvenokārt ir bijis par kadru ātruma palielināšanu un zema latentuma nodrošināšanu, kas ir ļoti svarīgi VR. Tas viss ir ļoti svarīgi un patiešām ir progress, taču līdz šim VR spēles ne tuvu neizskatās tik iespaidīgas kā labākās no "parastajām" mūsdienu 3D spēlēm. Tas notiek ne tikai tāpēc, ka vadošie spēļu izstrādātāji vēl īpaši nenodarbojas ar VR aplikācijām, bet arī tāpēc, ka VR ir prasīgāks pret kadru ātrumu, kas neļauj izmantot daudzas no ierastajām tehnikām šādās spēlēs augsto prasību dēļ.

Lai samazinātu kvalitātes atšķirību starp VR spēlēm un parastajām spēlēm, Nvidia nolēma izlaist veselu saistīto VRWorks tehnoloģiju paketi, kas ietvēra lielu skaitu API, bibliotēku, dzinēju un tehnoloģiju, kas var būtiski uzlabot gan spēles kvalitāti, gan veiktspēju. VR- lietojumprogrammas. Kā tas ir saistīts ar paziņojumu par pirmo spēļu risinājumu Pascal? Tas ir ļoti vienkārši – tajā ir ieviestas dažas tehnoloģijas, kas palīdz palielināt produktivitāti un uzlabot kvalitāti, un par tām jau esam rakstījuši.

Un, lai gan tas attiecas ne tikai uz grafiku, vispirms mēs par to nedaudz parunāsim. VRWorks Graphics tehnoloģiju komplektā ir iekļautas iepriekš minētās tehnoloģijas, piemēram, Lens Matched Shading, izmantojot vairāku projekcijas funkciju, kas parādījās GeForce GTX 1080. Jaunais produkts ļauj iegūt veiktspējas pieaugumu 1,5-2 reizes attiecībā pret risinājumus, kuriem šāda atbalsta nav. Mēs pieminējām arī citas tehnoloģijas, piemēram, MultiRes Shading, kas paredzētas renderēšanai dažādās izšķirtspējās kadra centrā un tā perifērijā.

Taču daudz negaidītāks bija paziņojums par tehnoloģiju VRWorks Audio, kas paredzēta augstas kvalitātes skaņas datu aprēķināšanai 3D ainās, kas ir īpaši svarīgi virtuālās realitātes sistēmās. Parastos dzinējos skaņas avotu novietojums virtuālajā vidē tiek aprēķināts diezgan pareizi, ja ienaidnieks šauj no labās puses, tad skaņa ir skaļāka no šīs audiosistēmas puses, un šāds aprēķins nav pārāk prasīgs skaitļošanas jaudai. .

Taču patiesībā skaņas iet ne tikai pret atskaņotāju, bet visos virzienos un atlec no dažādiem materiāliem, līdzīgi kā atlec gaismas stari. Un patiesībā mēs dzirdam šos atspulgus, lai gan ne tik skaidri kā tiešos skaņas viļņus. Šie netiešie skaņas atspīdumi parasti tiek simulēti ar īpašiem reverb efektiem, taču šī ir ļoti primitīva pieeja uzdevumam.

VRWorks Audio renderēšanā izmanto skaņas viļņu renderēšanu, kas ir līdzīga staru izsekošanai, kur gaismas staru ceļš tiek izsekots līdz vairākiem atspīdumiem no objektiem virtuālajā ainā. VRWorks Audio arī simulē skaņas viļņu izplatīšanos vidē, kad tiek izsekoti tiešie un atstarotie viļņi, atkarībā no to krišanas leņķa un atstarojošo materiālu īpašībām. Savā darbā VRWorks Audio izmanto augstas veiktspējas Nvidia OptiX staru izsekošanas dzinēju, kas pazīstams ar grafikas uzdevumiem. OptiX var izmantot dažādiem uzdevumiem, piemēram, netiešā apgaismojuma aprēķināšanai un gaismas kartēšanai, un tagad arī skaņas viļņu izsekošanai programmā VRWorks Audio.

Nvidia savā VR Funhouse demonstrācijā ir iestrādājusi precīzu skaņas viļņu aprēķinu, kas izmanto vairākus tūkstošus staru un aprēķina līdz pat 12 atspīdumiem no objektiem. Un, lai, izmantojot skaidru piemēru, uzzinātu tehnoloģijas priekšrocības, iesakām noskatīties video par tehnoloģijas darbību krievu valodā:

Ir svarīgi, lai Nvidia pieeja atšķirtos no tradicionālajiem skaņas dzinējiem, tostarp aparatūras paātrinātā metode no galvenā konkurenta, izmantojot īpašu bloku GPU. Visas šīs metodes nodrošina tikai precīzu skaņas avotu pozicionēšanu, bet neaprēķina skaņas viļņu atstarojumu no objektiem 3D ainā, lai gan tās var simulēt to, izmantojot reverb efektu. Taču staru izsekošanas tehnoloģijas izmantošana var būt daudz reālistiskāka, jo tikai šāda pieeja nodrošinās precīzu dažādu skaņu atdarināšanu, ņemot vērā ainā esošo objektu izmēru, formu un materiālus. Grūti pateikt, vai šāda skaitļošanas precizitāte ir nepieciešama tipiskam spēlētājam, taču mēs varam teikt droši: VR tas var pievienot lietotājiem to pašu reālismu, kas joprojām trūkst parastajās spēlēs.

Nu atliek stāstīt tikai par VR SLI tehnoloģiju, kas darbojas gan OpenGL, gan DirectX. Tās princips ir ārkārtīgi vienkāršs: divu GPU video sistēma VR lietojumprogrammā darbosies tā, ka katrai acij tiek piešķirts atsevišķs GPU, atšķirībā no SLI konfigurācijām pazīstamā AFR renderēšanas. Tas ievērojami uzlabo vispārējo veiktspēju, kas ir tik svarīgi virtuālās realitātes sistēmām. Teorētiski var izmantot vairāk GPU, taču to skaitam jābūt vienmērīgam.

Šāda pieeja bija nepieciešama, jo AFR nav labi piemērots VR, jo ar tā palīdzību pirmais GPU uzzīmēs vienmērīgu kadru abām acīm, bet otrais veidos nepāra kadru, kas nesamazina aizkavi, kas ir kritiska virtuālajam. realitātes sistēmas. Lai gan kadru ātrums būs diezgan augsts. Tātad ar VR SLI palīdzību darbs pie katra kadra tiek sadalīts divos GPU - viens darbojas uz daļu no rāmja kreisajai acij, otrs ar labo, un tad šīs kadra puses tiek apvienotas veselā.

Šāda darba sadalīšana starp GPU pāri nodrošina 2x veiktspējas pieaugumu, kā rezultātā palielinās kadru nomaiņas ātrums un mazāks latentums, salīdzinot ar sistēmām, kuru pamatā ir viena grafiskā karte. Tiesa, VR SLI lietošanai ir nepieciešams īpašs lietojumprogrammas atbalsts, lai izmantotu šo mērogošanas metodi. Taču VR SLI tehnoloģija jau ir iebūvēta VR demonstrācijas lietotnēs, piemēram, Valve's The Lab un ILMxLAB's Trials vietnē Tatooine, un tas ir tikai sākums — Nvidia sola drīzumā parādīties arī citas lietojumprogrammas, kā arī šīs tehnoloģijas ieviešanu spēļu dzinējos Unreal Engine 4. , Unity un Max Play.

Ansel spēles ekrānuzņēmumu platforma

Viens no interesantākajiem paziņojumiem saistībā ar programmatūru bija viena slavenā fotogrāfa Ansela vārdā nosauktās tehnoloģijas izlaišana augstas kvalitātes ekrānuzņēmumu tveršanai spēļu lietojumprogrammās. Spēles jau sen ir ne tikai spēles, bet arī vieta, kur izmantot rotaļīgas rokas dažādām radošām personībām. Kāds maina spēļu skriptus, kāds izlaiž augstas kvalitātes spēļu tekstūru komplektus un kāds veido skaistus ekrānuzņēmumus.

Nvidia nolēma palīdzēt pēdējam, prezentējot jauna platforma izveidot (proti, izveidot, jo tas nav tik viegls process) kvalitatīvus kadrus no spēlēm. Viņi uzskata, ka Ansels var palīdzēt radīt jauna veida laikmetīgo mākslu. Galu galā jau ir diezgan daudz mākslinieku, kuri lielāko daļu savas dzīves pavada datorā, veidojot skaistus ekrānuzņēmumus no spēlēm, un viņiem joprojām nebija ērta rīka.

Ansel ļauj ne tikai iemūžināt attēlu spēlē, bet arī mainīt to pēc radītāja vajadzībām. Izmantojot šo tehnoloģiju, varat pārvietot kameru pa ainu, pagriezt un noliekt to jebkurā virzienā, lai iegūtu vēlamo kadra kompozīciju. Piemēram, spēlēs, piemēram, pirmās personas šāvēja, jūs varat tikai pārvietot atskaņotāju, jūs nevarat īsti mainīt neko citu, tāpēc visi ekrānuzņēmumi ir diezgan vienmuļi. Ar bezmaksas kameru Anselā jūs varat sasniegt daudz tālāk spēļu kamera, izvēloties leņķi, kas nepieciešams labam attēlam, vai pat uzņemt pilnvērtīgu 360 grādu stereo attēlu no vajadzīgā punkta, un augstā izšķirtspējā vēlākai apskatei VR ķiverē.

Ansel darbojas pavisam vienkārši – ar speciālas bibliotēkas no Nvidia palīdzību šī platforma ir iestrādāta spēles kodā. Lai to izdarītu, tā izstrādātājam savam projektam jāpievieno tikai neliels koda fragments, lai Nvidia video draiveris varētu pārtvert bufera un ēnotāja datus. Ir ļoti maz darāmā darba, Ansel iesaistīšana spēlē aizņem mazāk nekā vienu dienu. Tātad šīs funkcijas iekļaušana programmā The Witness aizņēma apmēram 40 koda rindiņas, bet The Witcher 3 - apmēram 150 koda rindiņas.

Ansel nāks ar atvērtu izstrādes pakotni - SDK. Galvenais ir tas, ka lietotājs saņem līdzi standarta iestatījumu komplektu, kas ļauj mainīt kameras pozīciju un leņķi, pievienot efektus utt. Ansel platforma darbojas šādi: tā aptur spēli, ieslēdz bezmaksas kameru. un ļauj mainīt kadru uz vēlamo skatu, ierakstot rezultātu parasta ekrānuzņēmuma, 360 grādu attēla, stereo pāra vai vienkārši augstas izšķirtspējas panorāmas veidā.

Vienīgais brīdinājums ir tāds, ka ne visas spēles saņems atbalstu visām Ansel spēļu ekrānuzņēmumu platformas funkcijām. Daži spēļu izstrādātāji viena vai otra iemesla dēļ nevēlas savās spēlēs iekļaut pilnīgi bezmaksas kameru - piemēram, tāpēc, ka krāpnieki var izmantot šo funkcionalitāti. Vai arī viņi vēlas ierobežot skata leņķa maiņu tā paša iemesla dēļ - lai neviens neiegūtu negodīgas priekšrocības. Nu vai lai lietotāji fonā neredzētu nožēlojamus spraitus. Tas viss ir diezgan normālas spēļu veidotāju vēlmes.

Viena no interesantākajām Ansel funkcijām ir vienkārši milzīgas izšķirtspējas ekrānuzņēmumu izveide. Tas nekas, ka spēle atbalsta izšķirtspēju, piemēram, līdz 4K, un lietotāja monitors ir Full HD. Izmantojot ekrānuzņēmumu platformu, varat uzņemt daudz augstākas kvalitātes attēlu, ko drīzāk ierobežo diskdziņa izmērs un veiktspēja. Platforma viegli uzņem ekrānuzņēmumus līdz 4,5 gigapikseļiem, kas ir savienoti kopā no 3600 gabaliem!

Skaidrs, ka šādos attēlos var redzēt visas detaļas, līdz pat tekstam uz tālumā guļošām avīzēm, ja tāds detalizācijas līmenis principā ir paredzēts spēlē - Ansels var arī kontrolēt detalizācijas līmeni, iestatiet maksimālo līmeni, lai iegūtu vislabāko attēla kvalitāti. Bet jūs joprojām varat iespējot supersampling. Tas viss ļauj jums izveidot attēlus no spēlēm, kurus varat droši drukāt uz lieliem baneriem un būt mierīgiem par to kvalitāti.

Interesanti, ka lielu attēlu savienošanai tiek izmantots īpašs aparatūras paātrināts kods, kura pamatā ir CUDA. Galu galā neviena videokarte nevar atveidot vairāku gigapikseļu attēlu kopumā, bet tā var to izdarīt gabalos, kas jums vienkārši jāapvieno vēlāk, ņemot vērā iespējamo atšķirību apgaismojumā, krāsās utt.

Pēc šādu panorāmu sašūšanas visam kadram tiek izmantota īpaša pēcapstrāde, kas arī tiek paātrināta uz GPU. Un, lai uzņemtu attēlus augstākā dinamiskā diapazonā, varat izmantot īpašu attēla formātu - EXR, atvērto standartu no Industrial Light and Magic, kura krāsu vērtības katrā kanālā tiek ierakstītas 16 bitu peldošā komata formātā. (FP16).

Šis formāts ļauj mainīt spilgtumu un dinamiskais diapazons attēlus pēcapstrādes ceļā, katram konkrētajam displejam pieskaņojot to īstā tādā pašā veidā, kā tas tiek darīts ar RAW formātiem no kamerām. Un turpmākai pēcapstrādes filtru izmantošanai attēlu apstrādes programmās šis formāts ir ļoti noderīgs, jo tajā ir daudz vairāk datu nekā parastajos attēlu formātos.

Bet pašā Ansel platformā ir daudz pēcapstrādes filtru, kas ir īpaši svarīgi, jo tai ir pieeja ne tikai gala attēlam, bet arī visiem spēles renderēšanas laikā izmantotajiem buferiem, kurus var izmantot ļoti interesantiem efektiem. , piemēram, lauka dziļums. Lai to izdarītu, Ansel ir īpašs pēcapstrādes API, un ar šīs platformas atbalstu spēlē var iekļaut jebkuru no efektiem.

Ansel pēcfiltri ietver: krāsu līknes, krāsu telpu, transformāciju, piesātinājuma samazināšanos, spilgtumu/kontrastu, plēves graudu, ziedēšanu, objektīva uzplaiksnījumu, anamorfisku atspīdumu, kropļojumu, karstuma efektu, zivju acs, krāsu aberāciju, toņu kartēšanu, objektīva netīrumus, gaismas vārpstas, vinjeti, gamma korekcija, konvolūcija, asināšana, malu noteikšana, izplūšana, sēpija, trokšņi, FXAA un citi.

Kas attiecas uz Ansel atbalsta parādīšanos spēlēs, tad mums būs nedaudz jāpagaida, līdz izstrādātāji to ieviesīs un testēs. Taču Nvidia sola, ka šāds atbalsts drīzumā parādīsies tādās pazīstamās spēlēs kā The Division, The Witness, Lawbreakers, The Witcher 3, Paragon, Fortnite, Obduction, No Man's Sky, Unreal Tournament un citās.

Jaunā 16nm FinFET procesa tehnoloģija un arhitektūras optimizācijas ir ļāvušas GeForce GTX 1080, kas balstīts uz GP104 GPU, sasniegt augstu takts frekvenci 1,6-1,7 GHz pat atsauces formā, un jaunā paaudze garantē darbību pēc iespējas augstākajās frekvencēs spēlēs. GPU Boost tehnoloģijas. Kopā ar palielinātu izpildes vienību skaitu šie uzlabojumi padara to ne tikai par visu laiku augstākās veiktspējas vienas mikroshēmas grafisko karti, bet arī par energoefektīvāko risinājumu tirgū.

GeForce GTX 1080 ir pirmā grafiskā karte, kas aprīkota ar jauno GDDR5X grafisko atmiņu — jaunas paaudzes ātrgaitas mikroshēmām, kas nodrošina ļoti lielu datu pārraides ātrumu. Modificēta GeForce GTX 1080 gadījumā šāda veida atmiņa darbojas ar 10 GHz efektīvo frekvenci. Apvienojumā ar uzlabotiem kadru bufera saspiešanas algoritmiem šī GPU efektīvā atmiņas joslas platums palielinājās par 1,7 reizēm, salīdzinot ar tā tiešo priekšgājēju GeForce GTX 980.

Nvidia apdomīgi nolēma neizlaist radikāli jaunu arhitektūru uz pilnīgi jaunas procesa tehnoloģijas, lai izstrādes un ražošanas laikā nesaskartos ar nevajadzīgām problēmām. Tā vietā viņi nopietni uzlaboja jau tā labo un ļoti efektīvo Maxwell arhitektūru, pievienojot dažas funkcijas. Rezultātā ar jauno GPU ražošanu viss ir kārtībā, un GeForce GTX 1080 modeļa gadījumā inženieri ir sasnieguši ļoti augstu frekvences potenciālu - pārtaktētās versijās no partneriem GPU frekvence tiek gaidīta līdz 2 GHz! Šāda iespaidīga frekvence kļuva par realitāti, pateicoties perfektajam tehniskajam procesam un Nvidia inženieru rūpīgajam darbam Pascal GPU izstrādē.

Lai gan Paskāls ir tiešs Maksvela sekotājs un šīs grafiskās arhitektūras būtībā neatšķiras viena no otras, Nvidia ir ieviesusi daudzas izmaiņas un uzlabojumus, tostarp displeja iespējas, video kodēšanas un dekodēšanas dzinēju, uzlabotu dažādu veidu aprēķinu asinhrono izpildi. GPU, veica izmaiņas vairāku mikroshēmu renderēšanā un ieviesa jaunu sinhronizācijas metodi Fast Sync.

Nav iespējams neizcelt Simultaneous Multi-Projection tehnoloģiju, kas palīdz uzlabot virtuālās realitātes sistēmu veiktspēju, iegūt pareizāku sižetu attēlojumu vairāku monitoru sistēmās un ieviest jaunus veiktspējas optimizācijas paņēmienus. Taču VR lietojumprogrammas redzēs vislielāko ātruma palielinājumu, ja tās atbalstīs vairāku projekciju tehnoloģiju, kas palīdz ietaupīt GPU resursus uz pusi, apstrādājot ģeometriskos datus, un pusotru reizi pikseļa aprēķinos.

Starp tīri programmatūras izmaiņām izceļas platforma ekrānuzņēmumu veidošanai spēlēs ar nosaukumu Ansel - to būs interesanti izmēģināt praksē ne tikai tiem, kas spēlē daudz, bet arī tiem, kurus vienkārši interesē augstas kvalitātes 3D grafika. Jaunums ļauj paaugstināt ekrānuzņēmumu veidošanas un retušēšanas mākslu jaunā līmenī. Tādas pakotnes spēļu izstrādātājiem kā GameWorks un VRWorks, Nvidia tikai turpina soli pa solim pilnveidoties - tātad pēdējā ir parādījusies interesanta iespēja veikt augstas kvalitātes skaņas aprēķinus, ņemot vērā neskaitāmos skaņas viļņu atstarojumus, izmantojot aparatūras staru. izsekošana.

Kopumā Nvidia GeForce GTX 1080 videokartes veidā tirgū ienāca īsts līderis, kuram bija visas tam nepieciešamās īpašības: augsta veiktspēja un plaša funkcionalitāte, kā arī atbalsts jaunām funkcijām un algoritmiem. Pirmie šīs videokartes pircēji daudzas no minētajām priekšrocībām varēs novērtēt uzreiz, un citas risinājuma iespējas atklāsies nedaudz vēlāk, kad būs plašs atbalsts no malas. programmatūra. Galvenais ir tas, ka GeForce GTX 1080 izrādījās ļoti ātrs un efektīvs, un, kā mēs ļoti ceram, Nvidia inženieriem izdevās novērst dažas problemātiskās vietas (tie paši asinhronie aprēķini).

Grafikas paātrinātājs GeForce GTX 1070

ParametrsNozīme
Mikroshēmas koda nosaukumsGP104
Ražošanas tehnoloģija16nm FinFET
Tranzistoru skaits7,2 miljardi
Galvenā zona314 mm²
ArhitektūraVienots, ar kopīgu procesoru masīvu daudzu veidu datu straumēšanai: virsotnes, pikseļi utt.
DirectX aparatūras atbalstsDirectX 12 ar 12_1. līmeņa funkciju atbalstu
Atmiņas kopne256 bitu: astoņi neatkarīgi 32 bitu atmiņas kontrolleri, kas atbalsta GDDR5 un GDDR5X atmiņu
GPU frekvence1506 (1683) MHz
Skaitļošanas bloki15 aktīvi (no 20 mikroshēmā) straumēšanas multiprocesori, tostarp 1920 (no 2560) skalārie ALU peldošā komata aprēķiniem IEEE 754-2008 standarta ietvaros;
Tekstūras bloki120 aktīvās (no 160 mikroshēmā) tekstūras adresācijas un filtrēšanas vienības ar atbalstu FP16 un FP32 komponentiem tekstūrās un atbalstu trilineārai un anizotropai filtrēšanai visiem tekstūras formātiem
Rastra operāciju vienības (ROP)8 plaši ROP (64 pikseļi) ar atbalstu dažādiem anti-aliasing režīmiem, tostarp programmējamiem un ar FP16 vai FP32 kadru bufera formātu. Bloki sastāv no konfigurējamu ALU masīva un ir atbildīgi par dziļuma ģenerēšanu un salīdzināšanu, vairāku paraugu ņemšanu un sajaukšanu.
Monitora atbalstsIntegrēts atbalsts līdz četriem monitoriem, kas savienoti, izmantojot Dual Link DVI, HDMI 2.0b un DisplayPort 1.2 (1.3/1.4 Ready)

GeForce GTX 1070 atsauces grafikas specifikācijas
ParametrsNozīme
Pamatfrekvence1506 (1683) MHz
Universālo procesoru skaits1920
Tekstūras bloku skaits120
Sajaukšanas bloku skaits64
Efektīvā atmiņas frekvence8000 (4×2000) MHz
Atmiņas veidsGDDR5
Atmiņas kopne256 bitu
Atmiņa8 GB
Atmiņas joslas platums256 GB/s
Skaitļošanas veiktspēja (FP32)apmēram 6,5 teraflopi
Teorētiski maksimālais aizpildīšanas ātrums96 gigapikseļi/s
Teorētiskais tekstūras paraugu ņemšanas ātrums181 gigateksels/s
RiepaPCI Express 3.0
SavienotājiViens Dual Link DVI, viens HDMI un trīs DisplayPort
enerģijas patēriņšlīdz 150 W
Papildu ēdiensViens 8 kontaktu savienotājs
Sistēmas šasijā aizņemto slotu skaits2
Ieteicamā cena379–449 USD (ASV), 34 990 (Krievija)

Arī GeForce GTX 1070 videokarte saņēma loģisku nosaukumu, kas līdzinās tam pašam risinājumam no iepriekšējās GeForce sērijas. No tiešā priekšgājēja GeForce GTX 970 tas atšķiras tikai ar mainītas paaudzes skaitli. Jaunums kļūst par soli zemāk par pašreizējo top risinājumu GeForce GTX 1080 pašreizējā uzņēmuma līnijā, kas kļuva par jaunās sērijas pagaidu flagmani līdz vēl jaudīgāku GPU risinājumu izlaišanai.

Nvidia jaunās augstākās klases grafiskās kartes ieteicamās cenas ir attiecīgi 379 USD un 449 USD par Nvidia partneru parastajiem un dibinātāju izdevumiem. Salīdzinot ar top modeli, tas ir ļoti laba cenaņemot vērā, ka GTX 1070 sliktākajā gadījumā atpaliek par aptuveni 25%. Un paziņojuma un izlaišanas brīdī GTX 1070 kļūst par labāko veiktspējas risinājumu savā klasē. Tāpat kā GeForce GTX 1080, arī GTX 1070 nav tiešu AMD konkurentu, un to var salīdzināt tikai ar Radeon R9 390X un Fury.

GP104 GPU GeForce GTX 1070 modifikācijā nolēma atstāt pilnu 256 bitu atmiņas kopni, lai gan viņi neizmantoja jauna veida GDDR5X atmiņu, bet gan ļoti ātru GDDR5, kas darbojas ar augstu efektīvo frekvenci 8 GHz. Videokartei ar šādu kopni uzstādītās atmiņas apjoms var būt 4 vai 8 GB, un, lai nodrošinātu maksimālu jaunā risinājuma veiktspēju augstu iestatījumu un renderēšanas izšķirtspējas apstākļos, tika aprīkots arī GeForce GTX 1070 videokartes modelis. ar 8 GB video atmiņu, tāpat kā tā vecākā māsa. Šis apjoms ir pietiekams, lai vairākus gadus palaistu visas 3D lietojumprogrammas ar maksimāliem kvalitātes iestatījumiem.

GeForce GTX 1070 Founders Edition

Līdz ar GeForce GTX 1080 izziņošanu maija sākumā tika izziņots videokartes īpašais izdevums ar nosaukumu Founders Edition, kuram ir augstāka cena nekā parastajām kompānijas partneru videokartēm. Tas pats attiecas uz jaunumu. Šajā rakstā mēs atkal runāsim par GeForce GTX 1070 videokartes īpašo izdevumu ar nosaukumu Founders Edition. Tāpat kā vecāka modeļa gadījumā, Nvidia nolēma izlaist šo ražotāja atsauces videokartes versiju par augstāku cenu. Viņi apgalvo, ka daudzi spēlētāji un entuziasti, kas pērk dārgas augstākās klases grafiskās kartes, vēlas produktu ar atbilstošu "premium" izskatu un sajūtu.

Attiecīgi tieši šādiem lietotājiem tirgū tiks izlaista GeForce GTX 1070 Founders Edition videokarte, kuru Nvidia inženieri projektējuši un izgatavojuši no premium materiāliem un komponentiem, piemēram, GeForce GTX 1070 Founders Edition alumīnija vāciņa, kā arī kā zema profila aizmugures plāksne, kas nosedz PCB aizmuguri un ir diezgan populāra entuziastu vidū.

Kā redzams no plates fotoattēliem, GeForce GTX 1070 Founders Edition ir mantojis tieši tādu pašu rūpniecisko dizainu no GeForce GTX 1080 Founders Edition atsauces versijas. Abos modeļos tiek izmantots radiālais ventilators, kas izpūš uzkarsētu gaisu, kas ir ļoti noderīgi gan mazos korpusos, gan vairāku mikroshēmu SLI konfigurācijās ar ierobežotu fizisko telpu. Izpūšot sakarsētu gaisu, nevis cirkulējot to korpusā, varat samazināt termisko stresu, uzlabot pārspīlēšanas rezultātus un pagarināt sistēmas komponentu kalpošanas laiku.

Zem atsauces dzesēšanas sistēmas GeForce GTX 1070 vāka slēpjas īpašas formas alumīnija radiators ar trim iebūvētām vara siltuma caurulēm, kas noņem siltumu no paša GPU. Siltuma cauruļu izkliedēto siltumu pēc tam izkliedē alumīnija radiators. Arī zema profila metāla plāksne dēļa aizmugurē ir paredzēta, lai nodrošinātu labāku siltuma veiktspēju. Tam ir arī ievelkama daļa labākai gaisa plūsmai starp vairākām grafiskajām kartēm SLI konfigurācijās.

Kas attiecas uz plates barošanas sistēmu, GeForce GTX 1070 Founders Edition ir četrfāzu barošanas sistēma, kas optimizēta stabilam barošanas avotam. Nvidia apgalvo, ka īpašu komponentu izmantošana GTX 1070 Founders Edition uzlabo jaudas efektivitāti, stabilitāti un uzticamību salīdzinājumā ar GeForce GTX 970, nodrošinot labāku pārspīlēšanas veiktspēju. Paša uzņēmuma testos GeForce GTX 1070 plates GPU viegli pārspēja 1,9 GHz, kas ir tuvu vecāka GTX 1080 modeļa rezultātiem.

Nvidia GeForce GTX 1070 grafiskā karte mazumtirdzniecības veikalos būs pieejama no 10. jūnija. GeForce GTX 1070 Founders Edition un partneru risinājumu ieteicamās cenas ir atšķirīgas, un tas ir galvenais šī īpašā izdevuma jautājums. Ja Nvidia partneri pārdod savas GeForce GTX 1070 grafiskās kartes tikai par USD 379 (ASV tirgū), tad Nvidia atsauces dizaina Founders Edition maksās tikai 449 USD. Vai ir daudz entuziastu, kuri ir gatavi pārmaksāt par, atzīsim, atsauces versijas apšaubāmajām priekšrocībām? Laiks rādīs, bet mēs uzskatām, ka atsauces maksa ir interesantāka kā iespēja iegādāties pašā pārdošanas sākumā, un vēlāk tās iegūšanas punkts (un pat par augstu cenu!) jau tiek samazināts līdz nullei.

Atliek piebilst, ka atsauces GeForce GTX 1070 iespiedshēmas plate ir līdzīga vecākajai videokartei, turklāt abas atšķiras no uzņēmuma iepriekšējo plates ierīces. Jaunā produkta tipiskā jaudas patēriņa vērtība ir 150 W, kas ir gandrīz par 20% mazāka nekā vērtība GTX 1080 un tuvu iepriekšējās paaudzes videokartes GeForce GTX 970 enerģijas patēriņam. Nvidia atsauces platei ir pazīstams komplekts. savienotāju skaits attēla izvades ierīču pievienošanai: viens Dual-Link DVI, viens HDMI un trīs DisplayPort. Turklāt ir atbalsts jaunajiem HDMI versijas un DisplayPort, par kuru mēs rakstījām iepriekš GTX 1080 modeļa pārskatā.

Arhitektūras izmaiņas

GeForce GTX 1070 pamatā ir GP104 mikroshēma, kas ir pirmā jaunās paaudzes Nvidia Pascal grafikas arhitektūra. Šīs arhitektūras pamatā bija jau Maxwell izstrādātie risinājumi, taču tai ir arī dažas funkcionālas atšķirības, par kurām mēs detalizēti rakstījām iepriekš - daļā, kas bija veltīta augstākajai GeForce GTX 1080 videokartei.

Galvenās jaunās arhitektūras izmaiņas bija tehnoloģiskais process, kurā tiks izpildīti visi jaunie GPU. 16 nm FinFET ražošanas procesa izmantošana GP104 ražošanā ļāva būtiski palielināt mikroshēmas sarežģītību, saglabājot salīdzinoši zemu laukumu un izmaksas, un pašai pirmajai Pascal arhitektūras mikroshēmai ir ievērojami lielāks izpildes skaits. vienības, tostarp tādas, kas nodrošina jaunu funkcionalitāti, salīdzinot ar līdzīgas pozicionēšanas Maxwell mikroshēmām.

GP104 video mikroshēma pēc dizaina ir līdzīga līdzīgiem Maxwell arhitektūras risinājumiem, un detalizētu informāciju par moderno GPU dizainu varat atrast mūsu iepriekšējo Nvidia risinājumu apskatos. Tāpat kā iepriekšējie GPU, arī jaunās arhitektūras mikroshēmām būs atšķirīga grafikas apstrādes klastera (GPC), straumēšanas daudzprocesora (SM) un atmiņas kontrolleru konfigurācija, un GeForce GTX 1070 jau ir notikušas dažas izmaiņas - daļa mikroshēmas tika bloķēta. un neaktīvs (izcelts pelēkā krāsā):

Lai gan GP104 GPU ietver četrus GPC klasterus un 20 SM daudzprocesorus, GeForce GTX 1070 versijā tas saņēma samazinātu modifikāciju ar vienu GPC klasteru, ko atspējoja aparatūra. Tā kā katram GPC klasterim ir īpašs rasterizācijas dzinējs un tajā ir iekļauti pieci SM, un katrs daudzprocesors sastāv no 128 CUDA kodoliem un astoņiem tekstūras TMU, šajā GP104 versijā ir aktīvi 1920 CUDA kodoli un 120 TMU no 2560 straumēšanas procesoriem un 160 fiziskās tekstūras vienības.

Grafikas procesors, uz kura pamatā ir GeForce GTX 1070, satur astoņus 32 bitu atmiņas kontrolierus, kā rezultātā kopējā atmiņas kopne ir 256 bitu – tieši tāpat kā vecāka GTX 1080 modeļa gadījumā. Atmiņas apakšsistēma nav apgriezta kārtībā nodrošināt pietiekami lielas joslas platuma atmiņu ar nosacījumu, ka GeForce GTX 1070 tiek izmantota GDDR5 atmiņa. Katram no atmiņas kontrolleriem ir astoņi ROP un 256 KB L2 kešatmiņas, tāpēc GP104 mikroshēma šajā modifikācijā satur arī 64 ROP un 2048 KB L2 kešatmiņas līmenis.

Pateicoties arhitektūras optimizācijai un jaunai procesa tehnoloģijai, GP104 GPU ir kļuvis par līdz šim energoefektīvāko GPU. Nvidia inženieri, pārejot uz jaunu procesu, varēja palielināt pulksteņa ātrumu vairāk, nekā viņi gaidīja, un tam bija smagi jāstrādā, rūpīgi pārbaudot un optimizējot visus iepriekšējo risinājumu vājās vietas, kas neļāva strādāt ar augstāku frekvenci. Attiecīgi GeForce GTX 1070 darbojas arī ļoti augstā frekvencē, kas ir par vairāk nekā 40% augstāka nekā GeForce GTX 970 atsauces vērtība.

Tā kā GeForce GTX 1070 būtībā ir tikai nedaudz mazāk produktīvs GTX 1080 ar GDDR5 atmiņu, tas atbalsta pilnīgi visas tehnoloģijas, kuras aprakstījām iepriekšējā sadaļā. Lai iegūtu papildinformāciju par Pascal arhitektūru, kā arī tās atbalstītajām tehnoloģijām, piemēram, uzlabotām izvades un video apstrādes vienībām, Async Compute atbalstu, vienlaicīgu vairāku projekcijas tehnoloģiju, SLI vairāku mikroshēmu renderēšanas izmaiņām un jauno Fast Sync sinhronizācijas veidu. , ir vērts izlasīt sadaļu par GTX 1080.

Augstas veiktspējas GDDR5 atmiņa un tās efektīva izmantošana

Iepriekš rakstījām par izmaiņām GP104 GPU atmiņas apakšsistēmā, uz kuras balstās GeForce GTX 1080 un GTX 1070 modeļi - šajā GPU iekļautie atmiņas kontrolleri atbalsta gan jauno GDDR5X videoatmiņas veidu, kas sīkāk aprakstīts GTX 1080 apskatu, kā arī veco labo GDDR5 atmiņu, ko pazīstam jau vairākus gadus.

Lai nezaudētu pārāk lielu atmiņas joslas platumu zemākajā modelī GTX 1070, salīdzinot ar vecāko GTX 1080, tajā tika atstāti aktīvi visi astoņi 32 bitu atmiņas kontrolleri, iegūstot pilnu 256 bitu kopējo video atmiņas interfeisu. Turklāt videokarte bija aprīkota ar ātrāko tirgū pieejamo GDDR5 atmiņu – ar efektīvo darbības frekvenci 8 GHz. Tas viss nodrošināja atmiņas joslas platumu 256 GB / s, atšķirībā no 320 GB / s vecākajam risinājumam - skaitļošanas iespējas tika samazinātas par aptuveni tikpat daudz, tāpēc līdzsvars tika saglabāts.

Ņemiet vērā: lai gan maksimālais teorētiskais joslas platums ir svarīgs GPU veiktspējai, jums jāpievērš uzmanība arī tā efektivitātei. Renderēšanas procesa laikā daudz dažādu vājo vietu var ierobežot kopējo veiktspēju, neļaujot izmantot visu pieejamo atmiņas joslas platumu. Lai samazinātu šīs vājās vietas, GPU izmanto īpašu datu saspiešanu bez zudumiem, lai uzlabotu datu lasīšanas un rakstīšanas efektivitāti.

Pascal arhitektūrā jau ir ieviesta bufera informācijas delta kompresijas ceturtā paaudze, kas ļauj GPU efektīvāk izmantot pieejamās video atmiņas kopnes iespējas. GeForce GTX 1070 un GTX 1080 atmiņas apakšsistēma izmanto uzlabotas vecās un vairākas jaunas bezzudumu datu saspiešanas metodes, kas izstrādātas, lai samazinātu joslas platuma prasības. Tas samazina atmiņā ierakstīto datu apjomu, uzlabo L2 kešatmiņas efektivitāti un samazina datu apjomu, kas tiek nosūtīts starp dažādiem GPU punktiem, piemēram, TMU un kadru buferi.

GPU Boost 3.0 un overclocking funkcijas

Lielākā daļa Nvidia partneru jau ir paziņojuši par rūpnīcas pārspīlētiem risinājumiem, kuru pamatā ir GeForce GTX 1080 un GTX 1070. īpaši komunālie pakalpojumi pārtaktēšanai, ļaujot izmantot jauno GPU Boost 3.0 tehnoloģijas funkcionalitāti. Viens no šādu utilītu piemēriem ir EVGA Precision XOC, kas ietver automātisku skeneri sprieguma-frekvences līknes noteikšanai – šajā režīmā katrai sprieguma vērtībai, veicot stabilitātes testu, tiek atrasta stabila frekvence, pie kuras GPU nodrošina. veiktspējas pieaugums. Tomēr šo līkni var mainīt arī manuāli.

Mēs labi zinām GPU Boost tehnoloģiju no iepriekšējām Nvidia grafiskajām kartēm. Savos GPU viņi izmanto šo aparatūras funkciju, kas ir paredzēta, lai palielinātu GPU darbības takts ātrumu režīmos, kuros tas vēl nav sasniedzis enerģijas patēriņa un siltuma izkliedes robežas. Pascal GPU šis algoritms ir piedzīvojis vairākas izmaiņas, no kurām galvenā ir smalkāks turbo frekvenču iestatījums atkarībā no sprieguma.

Ja agrāk starpība starp bāzes frekvenci un turbo frekvenci tika fiksēta, tad GPU Boost 3.0 kļuva iespējams iestatīt turbo frekvences nobīdes katram spriegumam atsevišķi. Tagad katrai atsevišķai sprieguma vērtībai var iestatīt turbo frekvenci, kas ļauj pilnībā izspiest visas pārtaktēšanas iespējas no GPU. Mēs detalizēti rakstījām par šo funkciju GeForce GTX 1080 pārskatā, un šim nolūkam varat izmantot utilītas EVGA Precision XOC un MSI Afterburner.

Tā kā dažas detaļas ir mainījušās virstaktēšanas metodoloģijā, izlaižot videokartes ar GPU Boost 3.0 atbalstu, Nvidia nācās sniegt papildu skaidrojumus jauno produktu pārtaktēšanas instrukcijās. Ir dažādi pārspīlēšanas paņēmieni ar dažādiem mainīgiem raksturlielumiem, kas ietekmē gala rezultātu. Katrai konkrētai sistēmai konkrēta metode var būt labāk piemērota, taču pamati vienmēr ir aptuveni vienādi.

Daudzi pārtaktētāji izmanto Unigine Heaven 4.0 etalonu, lai pārbaudītu sistēmas stabilitāti, kas labi noslogo GPU, ir elastīgi iestatījumi un to var palaist logu režīmā, kā arī tuvumā esošu pārspīlēšanas un uzraudzības utilīta logu, piemēram, EVGA Precision vai MSI Afterburner. Taču ar šādu pārbaudi pietiek tikai sākotnējām aplēsēm, un, lai stingri apstiprinātu virstaktēšanas stabilitāti, tā ir jāpārbauda vairākās spēļu aplikācijās, jo dažādām spēlēm ir nepieciešamas dažādas slodzes uz dažādām GPU funkcionālajām vienībām: matemātiskā, faktūra, ģeometriskā. Heaven 4.0 etalons ir ērts arī virstaktēšanai, jo tam ir cilpas darbības režīms, kurā ērti mainīt virstaktēšanas iestatījumus, un ir etalons ātruma pieauguma izvērtēšanai.

Nvidia iesaka lietot Heaven 4.0 un EVGA Precision XOC logus kopā, kad tiek pārspīlēta jaunās GeForce GTX 1080 un GTX 1070 grafikas kartes. Sākumā ir vēlams nekavējoties palielināt ventilatora ātrumu. Un nopietnai pārtaktēšanai uzreiz var iestatīt ātruma vērtību uz 100%, kas padarīs videokarti ļoti skaļu, bet tas maksimāli atdzesēs GPU un citus videokartes komponentus, pazeminot temperatūru līdz zemākajam iespējamajam līmenī, novēršot droseles darbību (frekvenču samazināšanos, ko izraisa GPU temperatūras paaugstināšanās virs noteiktas vērtības).

Tālāk jums ir jāiestata mērķa jaudas vērtība (Power Target) arī uz maksimālo. Šis iestatījums nodrošinās GPU ar maksimālo iespējamo jaudas daudzumu, palielinot enerģijas patēriņa līmeni un GPU mērķa temperatūru (GPU Temp Target). Dažiem nolūkiem otro vērtību var atdalīt no Power Target maiņas, un pēc tam šos iestatījumus var pielāgot atsevišķi - lai, piemēram, panāktu mazāku video mikroshēmas sildīšanu.

Nākamais solis ir palielināt GPU pulksteņa nobīdes vērtību – tas nozīmē, cik daudz augstāka būs turbo frekvence darbības laikā. Šī vērtība palielina frekvenci visiem spriegumiem un nodrošina labāku veiktspēju. Kā parasti, pārtaktējot, ir jāpārbauda stabilitāte, palielinot GPU frekvenci nelielos soļos - no 10 MHz līdz 50 MHz uz soli, pirms pamanāt karāšanos, draivera vai lietojumprogrammas kļūdu vai pat vizuālus artefaktus. Kad šī robeža ir sasniegta, jums jāsamazina frekvences vērtība par soli uz leju un vēlreiz jāpārbauda stabilitāte un veiktspēja virstaktēšanas laikā.

Papildus GPU frekvencei var palielināt arī video atmiņas frekvenci (Memory Clock Offset), kas ir īpaši svarīgi ar GDDR5 atmiņu aprīkotā GeForce GTX 1070 gadījumā, kas parasti pārspīlē labi. Process atmiņas frekvences gadījumā precīzi atkārto to, kas tiek darīts, atrodot stabilu GPU frekvenci, vienīgā atšķirība ir tā, ka soļus var padarīt lielākus - bāzes frekvencei pievienojot uzreiz 50-100 MHz.

Papildus iepriekšminētajām darbībām varat arī palielināt Overvoltage limitu, jo augstāka GPU frekvence bieži tiek sasniegta pie paaugstināta sprieguma, kad nestabilās GPU daļas saņem papildu jaudu. Tiesa, potenciālais trūkums palielināt dotā vērtība ir video mikroshēmas bojājuma iespēja un tās paātrināta atteice, tāpēc jums ir jāizmanto sprieguma palielināšana ļoti piesardzīgi.

Overclocking entuziasti izmanto nedaudz atšķirīgus paņēmienus, mainot parametrus citā secībā. Piemēram, daži virstaktētāji dalās eksperimentos, lai atrastu stabilu GPU un atmiņas frekvenci, lai tie netraucētu viens otram, un pēc tam pārbauda gan video mikroshēmas, gan atmiņas mikroshēmu kombinēto pārtaktēšanu, taču tās jau ir nenozīmīgas individuālās pieejas detaļas. .

Spriežot pēc forumos izskanējušajiem viedokļiem un rakstu komentāriem, daļai lietotāju nav paticis jaunais GPU Boost 3.0 darbības algoritms, kad GPU frekvence vispirms paceļas ļoti augstu, bieži vien augstāk par turbo frekvenci, bet pēc tam pieauguma iespaidā. ja GPU temperatūra vai palielināts enerģijas patēriņš virs iestatītās robežas, tas var samazināties līdz daudz zemākām vērtībām. Tā ir tikai atjauninātā algoritma specifika, ir jāpierod pie jaunās dinamiski mainīgās GPU frekvences uzvedības, taču tai nav nekādu negatīvu seku.

GeForce GTX 1070 ir otrais modelis pēc GTX 1080 Nvidia jaunajā grafikas procesoru līnijā, kuras pamatā ir Pascal saime. Jaunā 16nm FinFET procesa tehnoloģija un arhitektūras optimizācijas ir ļāvušas šai grafiskajai kartei sasniegt lielus takts frekvences, ko atbalsta jaunās paaudzes GPU Boost tehnoloģija. Lai arī ir samazināts funkcionālo bloku skaits straumes procesoru un tekstūras moduļu veidā, to skaits joprojām ir pietiekams, lai GTX 1070 kļūtu par ienesīgāko un energoefektīvāko risinājumu.

GDDR5 atmiņas instalēšana jaunākajiem Nvidia videokaršu modeļiem ar GP104 mikroshēmu atšķirībā no jaunā tipa GDDR5X, kas atšķir GTX 1080, neliedz tam sasniegt augstus veiktspējas rādītājus. Pirmkārt, Nvidia nolēma nepārgriezt GeForce GTX 1070 modeļa atmiņas kopni, un, otrkārt, viņi tai ievietoja ātrāko GDDR5 atmiņu ar efektīvo frekvenci 8 GHz, kas ir tikai nedaudz zemāka par 10 GHz GDDR5X, ko izmanto GDDR5X. vecāks modelis. Ņemot vērā uzlabotos delta saspiešanas algoritmus, GPU efektīvais atmiņas joslas platums ir kļuvis lielāks par to pašu parametru līdzīgs modelis iepriekšējās paaudzes GeForce GTX 970.

GeForce GTX 1070 ir labs ar to, ka piedāvā ļoti augstu veiktspēju un atbalstu jaunām funkcijām un algoritmiem par daudz zemāku cenu, salīdzinot ar vecāku modeli, par kuru tika paziņots nedaudz agrāk. Ja daži entuziasti var atļauties iegādāties GTX 1080 par 55 000, tad daudz lielāks potenciālo pircēju loks varēs maksāt 35 000 tikai par ceturtdaļu mazāk produktīva risinājuma ar tieši tādām pašām iespējām. Tas bija salīdzinoši zemās cenas un augstas veiktspējas kombinācija, kas padarīja GeForce GTX 1070 par visrentablāko pirkumu tā izlaišanas brīdī.

Grafikas paātrinātājs GeForce GTX 1060

ParametrsNozīme
Mikroshēmas koda nosaukumsGP106
Ražošanas tehnoloģija16nm FinFET
Tranzistoru skaits4,4 miljardi
Galvenā zona200 mm²
ArhitektūraVienots, ar kopīgu procesoru masīvu daudzu veidu datu straumēšanai: virsotnes, pikseļi utt.
DirectX aparatūras atbalstsDirectX 12 ar 12_1. līmeņa funkciju atbalstu
Atmiņas kopne192 bitu: seši neatkarīgi 32 bitu atmiņas kontrolleri, kas atbalsta GDDR5 atmiņu
GPU frekvence1506 (1708) MHz
Skaitļošanas bloki10 straumēšanas daudzprocesori, tostarp 1280 skalārie ALU peldošā komata aprēķiniem saskaņā ar IEEE 754-2008 standartu;
Tekstūras bloki80 tekstūras adresācijas un filtrēšanas vienības ar atbalstu FP16 un FP32 komponentiem tekstūrās un atbalstu trilineārai un anizotropai filtrēšanai visiem tekstūras formātiem
Rastra operāciju vienības (ROP)6 plaši ROP (48 pikseļi) ar atbalstu dažādiem anti-aliasing režīmiem, tostarp programmējamiem un ar FP16 vai FP32 kadru bufera formātu. Bloki sastāv no konfigurējamu ALU masīva un ir atbildīgi par dziļuma ģenerēšanu un salīdzināšanu, vairāku paraugu ņemšanu un sajaukšanu.
Monitora atbalstsIntegrēts atbalsts līdz četriem monitoriem, kas savienoti, izmantojot Dual Link DVI, HDMI 2.0b un DisplayPort 1.2 (1.3/1.4 Ready)

GeForce GTX 1060 atsauces grafikas specifikācijas
ParametrsNozīme
Pamatfrekvence1506 (1708) MHz
Universālo procesoru skaits1280
Tekstūras bloku skaits80
Sajaukšanas bloku skaits48
Efektīvā atmiņas frekvence8000 (4×2000) MHz
Atmiņas veidsGDDR5
Atmiņas kopne192 bitu
Atmiņa6 GB
Atmiņas joslas platums192 GB/s
Skaitļošanas veiktspēja (FP32)apmēram 4 teraflopi
Teorētiski maksimālais aizpildīšanas ātrums72 gigapikseļi/s
Teorētiskais tekstūras paraugu ņemšanas ātrums121 gigateksels/s
RiepaPCI Express 3.0
SavienotājiViens Dual Link DVI, viens HDMI un trīs DisplayPort
Tipisks enerģijas patēriņš120 W
Papildu ēdiensViens 6 kontaktu savienotājs
Sistēmas šasijā aizņemto slotu skaits2
Ieteicamā cena249 USD (299 USD) ASV un 18 990 Krievijā

Arī GeForce GTX 1060 videokarte saņēma nosaukumu, kas līdzīgs tam pašam risinājumam no iepriekšējās GeForce sērijas, kas no tiešā priekšgājēja GeForce GTX 960 nosaukuma atšķiras tikai ar mainīto paaudzes pirmo ciparu. Jaunums pašreizējā kompānijas līnijā ir kļuvis par soli zemāks par iepriekš izdoto GeForce GTX 1070 risinājumu, kas jaunajā sērijā ātruma ziņā ir vidējs.

Nvidia jaunās videokartes ieteicamās cenas ir attiecīgi 249 USD un 299 USD par uzņēmuma partneru parastajām versijām un īpašo Founder's Edition. Salīdzinot ar diviem vecākiem modeļiem, šī ir ļoti izdevīga cena, jo jaunais GTX 1060 modelis, lai gan ir zemāks par augstākās klases mātesplatēm, ne tuvu nav tik daudz, cik lētāks. Paziņojuma brīdī jaunums noteikti kļuva par labāko veiktspējas risinājumu savā klasē un vienu no izdevīgākajiem piedāvājumiem šajā cenu diapazonā.

Šis Nvidia Pascal ģimenes videokartes modelis iznāca, lai cīnītos pret konkurējošās kompānijas AMD svaigo lēmumu, kas nedaudz agrāk laida klajā Radeon RX 480. Varat salīdzināt jauno Nvidia videokarti ar šo videokarti, lai gan ne gluži tieši, jo tie joprojām diezgan būtiski atšķiras pēc cenas. GeForce GTX 1060 ir dārgāks (249–299 USD pret 199–229 USD), taču tas ir arī acīmredzami ātrāks nekā konkurents.

Grafikas procesoram GP106 ir 192 bitu atmiņas kopne, tāpēc videokartei ar šo kopni uzstādītās atmiņas apjoms var būt 3 vai 6 GB. Atklāti sakot, ar mazāku vērtību mūsdienu apstākļos nepietiek, un daudziem spēļu projektiem pat Full HD izšķirtspējā pietrūks video atmiņas, kas nopietni ietekmēs renderēšanas gludumu. Lai nodrošinātu maksimālu jaunā risinājuma veiktspēju pie augstiem iestatījumiem, GeForce GTX 1060 modelis tika aprīkots ar 6 GB video atmiņu, kas ir pietiekami, lai palaistu jebkuras 3D aplikācijas ar jebkādiem kvalitātes iestatījumiem. Turklāt šodien vienkārši nav atšķirības starp 6 un 8 GB, un šāds risinājums ietaupīs naudu.

Tipiskā jaudas patēriņa vērtība jaunajam produktam ir 120 W, kas ir par 20% mazāka nekā vērtība GTX 1070 un ir vienāda ar iepriekšējās paaudzes GeForce GTX 960 grafiskās kartes enerģijas patēriņu, kurai ir daudz zemāka veiktspēja un iespējas. Atsauces platei ir parastais savienotāju komplekts attēla izvades ierīču pievienošanai: viens Dual-Link DVI, viens HDMI un trīs DisplayPort. Turklāt tika atbalstītas jaunas HDMI un DisplayPort versijas, par kurām mēs rakstījām GTX 1080 modeļa apskatā.

GeForce GTX 1060 atsauces plates garums ir 9,8 collas (25 cm), un, ņemot vērā atšķirības no vecākām opcijām, mēs atsevišķi atzīmējam, ka GeForce GTX 1060 neatbalsta SLI vairāku mikroshēmu renderēšanas konfigurāciju un tai nav šim nolūkam īpašs savienotājs. Tā kā plate patērē mazāk enerģijas nekā vecāki modeļi, papildu jaudai uz tā tika uzstādīts viens 6 kontaktu PCI-E ārējā barošanas savienotājs.

GeForce GTX 1060 videokartes tirgū parādījušās kopš paziņojuma dienas produktu veidā no uzņēmuma partneriem: Asus, EVGA, Gainward, Gigabyte, Innovision 3D, MSI, Palit, Zotac. Ierobežotā daudzumā tiks izdots pašas Nvidia ražotais GeForce GTX 1060 Founder's Edition speciālais izdevums, kas tiks pārdots par cenu 299 USD ekskluzīvi Nvidia vietnē un oficiāli netiks prezentēts Krievijā. Founder's Edition izceļas ar to, ka tas ir izgatavots no augstas kvalitātes materiāliem un komponentiem, tostarp alumīnija korpusa, un tajā izmantota efektīva dzesēšanas sistēma, kā arī zemas pretestības strāvas ķēdes un īpaši izstrādāti sprieguma regulatori.

Arhitektūras izmaiņas

Videokartes GeForce GTX 1060 pamatā ir pilnīgi jauns grafiskā procesora modelis GP106, kas funkcionāli ne ar ko neatšķiras no Pascal arhitektūras pirmdzimtā GP104 mikroshēmas veidā, uz kura aprakstīja GeForce GTX 1080 un GTX 1070 modeļus. Šī arhitektūra tika balstīta uz Maxwell izstrādātajiem risinājumiem, taču tai ir arī dažas funkcionālas atšķirības, par kurām mēs detalizēti rakstījām iepriekš.

GP106 video mikroshēma pēc dizaina ir līdzīga augstākās klases Pascal mikroshēmai un līdzīgiem Maxwell arhitektūras risinājumiem, un detalizētu informāciju par moderno GPU dizainu varat atrast mūsu iepriekšējo Nvidia risinājumu apskatos. Tāpat kā iepriekšējiem GPU, jaunās arhitektūras mikroshēmām ir dažādas grafikas apstrādes klasteru (GPC), straumēšanas daudzprocesoru (SM) un atmiņas kontrolleru konfigurācijas:

Grafikas procesors GP106 ietver divus GPC klasterus, kas sastāv no 10 straumēšanas daudzprocesoriem (Streaming Multiprocessor - SM), tas ir, tieši puse no GP104. Tāpat kā vecākā GPU, katrs no daudzprocesoriem satur 128 kodolus, 8 TMU tekstūras vienības, katrs 256 KB. reģistra atmiņa, 96 KB koplietotās atmiņas un 48 KB L1 kešatmiņas. Rezultātā GeForce GTX 1060 kopā ir 1280 skaitļošanas kodoli un 80 tekstūras vienības, kas ir uz pusi mazāk nekā GTX 1080.

Bet GeForce GTX 1060 atmiņas apakšsistēma netika samazināta uz pusi salīdzinājumā ar labāko risinājumu, tajā ir seši 32 bitu atmiņas kontrolleri, kas nodrošina pēdējo 192 bitu atmiņas kopni. Ar efektīvo GDDR5 video atmiņas frekvenci GeForce GTX 1060, kas vienāda ar 8 GHz, joslas platums sasniedz 192 GB / s, kas ir diezgan labs risinājums šajā cenu segmentā, īpaši ņemot vērā tā izmantošanas augsto efektivitāti Pascal. Katram no atmiņas kontrolleriem ir saistīti astoņi ROP un 256 KB L2 kešatmiņa, tātad kopā pilna versija GP106 GPU satur 48 ROP un 1536 KB L2 kešatmiņu.

Lai samazinātu atmiņas joslas platuma prasības un efektīvāk izmantotu pieejamo Pascal arhitektūru, ir vēl vairāk uzlabota bezzudumu datu saspiešana mikroshēmā, kas spēj saspiest datus buferos, panākot efektivitāti un veiktspējas pieaugumu. Jo īpaši jaunajai mikroshēmu saimei ir pievienotas jaunas 4:1 un 8:1 delta saspiešanas metodes, kas nodrošina papildu 20% joslas platuma efektivitātes salīdzinājumā ar iepriekšējiem Maxwell saimes risinājumiem.

Jaunā GPU bāzes frekvence ir 1506 MHz – frekvencei principā nevajadzētu nokrist zem šīs atzīmes. Tipiskais pastiprināšanas pulkstenis ir daudz augstāks — 1708 MHz, kas ir vidējais reālās frekvences rādītājs, ar kādu GeForce GTX 1060 grafikas mikroshēma darbojas plašā spēļu un 3D lietojumprogrammu klāstā. Faktiskais pastiprināšanas biežums ir atkarīgs no spēles un apstākļiem, kādos notiek pārbaude.

Tāpat kā pārējie Pascal saimes risinājumi, GeForce GTX 1060 modelis ne tikai darbojas ar augstu takts frekvenci, nodrošinot augstu veiktspēju, bet arī tam ir pienācīga pārtaktēšanas rezerve. Pirmie eksperimenti liecina par iespēju sasniegt 2 GHz frekvences. Nav pārsteidzoši, ka uzņēmuma partneri gatavo arī GTX 1060 videokartes rūpnīcas pārtaktēšanas versijas.

Tātad galvenās izmaiņas jaunajā arhitektūrā bija 16 nm FinFET process, kura izmantošana GP106 ražošanā ļāva ievērojami palielināt mikroshēmas sarežģītību, vienlaikus saglabājot salīdzinoši zemu 200 mm² laukumu, tāpēc šai Pascal arhitektūras mikroshēmai ir ievērojami lielāks izpildes vienību skaits salīdzinājumā ar līdzīgas pozicionēšanas Maxwell mikroshēmu, kas ražota, izmantojot 28 nm procesa tehnoloģiju.

Ja GM206 (GTX 960) ar ​227 mm² laukumu bija 3 miljardi tranzistoru un 1024 ALU, 64 TMU, 32 ROP un 128 bitu kopne, tad jaunajā GPU bija 4,4 miljardi tranzistoru, 1280 ALU. 200 mm², 80 TMU un 48 ROP ar 192 bitu kopni. Turklāt gandrīz pusotru reizi augstākā frekvencē: 1506 (1708) pret 1126 (1178) MHz. Un tas ir ar tādu pašu enerģijas patēriņu 120 vati! Rezultātā GP106 GPU ir kļuvis par vienu no energoefektīvākajiem GPU kopā ar GP104.

Jaunās Nvidia tehnoloģijas

Viena no interesantākajām uzņēmuma tehnoloģijām, kuru atbalsta GeForce GTX 1060 un citi Pascal saimes risinājumi, ir tehnoloģija Nvidia vienlaicīga vairāku projicēšana. Par šo tehnoloģiju jau rakstījām GeForce GTX 1080 apskatā, tā ļauj izmantot vairākas jaunas tehnikas renderēšanas optimizēšanai. Jo īpaši - vienlaikus projicēt VR attēlu divām acīm, ievērojami palielinot GPU izmantošanas efektivitāti virtuālajā realitātē.

Lai atbalstītu SMP, visiem Pascal saimes GPU ir īpašs dzinējs, kas atrodas PolyMorph Engine ģeometriskā cauruļvada galā pirms rasterizētāja. Ar to GPU var vienlaicīgi projicēt ģeometrisku primitīvu uz vairākām projekcijām no viena punkta, savukārt šīs projekcijas var būt stereo (ti, vienlaikus tiek atbalstītas līdz 16 vai 32 projekcijām). Šī funkcija ļauj Pascal GPU precīzi reproducēt izliektu virsmu VR renderēšanai, kā arī pareizi attēlot vairāku monitoru sistēmās.

Svarīgi, ka Simultaneous Multi-Projection tehnoloģija jau tiek integrēta populārajos spēļu dzinējos (Unreal Engine un Unity) un spēlēs, un līdz šim ir paziņots par tehnoloģiju atbalstu vairāk nekā 30 izstrādes stadijā esošajām spēlēm, tostarp tādām labi zināmām. tādi projekti kā Unreal Tournament, Poolnation VR, Everest VR, Obduction, Adr1ft un Raw Data. Interesanti, ka, lai gan Unreal Tournament nav VR spēle, tā izmanto SMP, lai sasniegtu labākus vizuālos attēlus un veiktspēju.

Vēl viena ilgi gaidītā tehnoloģija ir spēcīgs rīks ekrānuzņēmumu izveidei spēlēs. Nvidia Ansel. Šis rīks ļauj izveidot neparastus un ļoti kvalitatīvus ekrānuzņēmumus no spēlēm, ar iepriekš nepieejamām funkcijām, saglabājot tos ļoti augstā izšķirtspējā un papildinot ar dažādiem efektiem, un dalīties ar saviem darbiem. Ansel ļauj burtiski izveidot ekrānuzņēmumu tā, kā to vēlas mākslinieks, ļaujot jebkurā ainas vietā uzstādīt kameru ar jebkādiem parametriem, attēlam lietot jaudīgus pēcfiltrus vai pat uzņemt 360 grādu attēlu, lai to skatītu virtuālās realitātes ķivere.

Nvidia ir standartizējusi Ansel UI integrāciju spēlēs, un to izdarīt ir tikpat vienkārši, kā pievienot dažas koda rindiņas. Jums vairs nav jāgaida, līdz šī funkcija parādīsies spēlēs, Ansela spējas varat novērtēt jau tagad spēlē Mirror’s Edge: Catalyst, un nedaudz vēlāk tā būs pieejama spēlē Witcher 3: Wild Hunt. Turklāt tiek izstrādāti daudzi Ansel iespējoti spēļu projekti, tostarp tādas spēles kā Fortnite, Paragon un Unreal Tournament, Obduction, The Witness, Lawbreakers, Tom Clancy's The Division, No Man's Sky un citas.

Jaunais GeForce GTX 1060 GPU atbalsta arī rīku komplektu Nvidia VRWorks, kas palīdz izstrādātājiem izveidot iespaidīgus projektus virtuālajai realitātei. Šajā pakotnē ir iekļautas daudzas izstrādātājiem paredzētas utilītas un rīki, tostarp VRWorks Audio, kas ļauj veikt ļoti precīzu skaņas viļņu atstarošanas aprēķinu no ainas objektiem, izmantojot GPU staru izsekošanu. Paketē ietilpst arī integrācija VR un PhysX fizikas efektos, lai nodrošinātu fiziski pareizu objektu uzvedību ainā.

Viena no aizraujošākajām VR spēlēm, kurā var izmantot VRWorks priekšrocības, ir VR Funhouse, pašas Nvidia VR spēle, kas bez maksas ir pieejama Valve Steam pakalpojumā. Šo spēli darbina Unreal Engine 4 (Epic Games), un tā darbojas uz GeForce GTX 1080, 1070 un 1060 grafikas kartēm kopā ar HTC Vive VR austiņām. Turklāt šīs spēles pirmkods būs publiski pieejams, kas ļaus citiem izstrādātājiem izmantot gatavas idejas un kodu jau savos VR atrakcijās. Ņemiet vērā, ka šis ir viens no iespaidīgākajiem virtuālās realitātes iespēju demonstrējumiem.

Tostarp, pateicoties SMP un VRWorks tehnoloģijām, GeForce GTX 1060 GPU izmantošana VR lietojumprogrammās nodrošina pietiekami daudz sākuma līmenis virtuālās realitātes veiktspēju, un attiecīgais GPU atbilst minimālajam nepieciešamajam aparatūras līmenim, tostarp SteamVR, kļūstot par vienu no veiksmīgākajiem iegādēm izmantošanai sistēmās ar oficiālais atbalsts VR.

Tā kā GeForce GTX 1060 modelis ir balstīts uz GP106 mikroshēmu, kas nekādā ziņā neatpaliek no GP104 grafikas procesora, kas kļuva par pamatu vecākām modifikācijām, tas atbalsta absolūti visas iepriekš aprakstītās tehnoloģijas.

GeForce GTX 1060 ir trešais modelis Nvidia jaunajā grafikas procesoru līnijā, kuras pamatā ir Pascal saime. Jaunā 16 nm FinFET procesa tehnoloģija un arhitektūras optimizācija ir ļāvusi visām jaunajām grafiskajām kartēm sasniegt lielus takts frekvences un izvietot GPU vairāk funkcionālu bloku straumēšanas procesoru, tekstūras moduļu un citu veidā, salīdzinot ar iepriekšējās paaudzes video mikroshēmām. Tāpēc GTX 1060 ir kļuvis par ienesīgāko un energoefektīvāko risinājumu savā klasē un kopumā.

Īpaši svarīgi ir tas, ka GeForce GTX 1060 piedāvā pietiekami augstu veiktspēju un atbalstu jaunām funkcijām un algoritmiem par daudz zemāku cenu, salīdzinot ar vecākiem risinājumiem, kuru pamatā ir GP104. Jaunajā modelī izmantotā GP106 grafikas mikroshēma nodrošina savā klasē labāko veiktspēju un jaudas efektivitāti. GeForce GTX 1060 ir īpaši izstrādāts un lieliski piemērots visām mūsdienu spēlēm ar augstiem un maksimāliem grafikas iestatījumiem ar izšķirtspēju 1920x1080 un pat ar pilnekrāna anti-aliasing, kas iespējots ar dažādām metodēm (FXAA, MFAA vai MSAA).

Un tiem, kas vēlas vēl lielāku veiktspēju ar īpaši augstas izšķirtspējas displejiem, Nvidia piedāvā augstākās klases GeForce GTX 1070 un GTX 1080 grafiskās kartes, kas arī ir diezgan labas veiktspējas un jaudas efektivitātes ziņā. Un tomēr zemās cenas un pietiekamas veiktspējas kombinācija diezgan labvēlīgi atšķir GeForce GTX 1060 no vecāku risinājumu fona. Salīdzinot ar konkurējošo Radeon RX 480, Nvidia risinājums ir nedaudz ātrāks ar mazāku sarežģītību un GPU nospiedumu, un tam ir ievērojami labāka enerģijas efektivitāte. Tiesa, to pārdod nedaudz dārgāk, tāpēc katrai videokartei ir sava niša.

NVIDIA GeForce GTX 780 videokartes apskats | GeForce Experience un ShadowPlay

GeForce pieredze

Kā datoru entuziasti mēs novērtējam dažādu iestatījumu kombināciju, kas ietekmē spēļu veiktspēju un kvalitāti. Vienkāršākais veids ir tērēt daudz naudas par jaunu videokarti un iestatīt visus grafikas iestatījumus uz maksimumu. Bet, kad kāds parametrs kartei izrādās par smagu un tas ir jāsamazina vai jāizslēdz, rodas nepatīkama sajūta un apziņa, ka spēle varētu darboties daudz labāk.

Tomēr optimālo iestatījumu iestatīšana nav tik vienkārša. Daži iestatījumi nodrošina labākus attēlus nekā citi, un ietekme uz veiktspēju var ievērojami atšķirties. Programma GeForce Experience ir NVIDIA mēģinājums atvieglot spēles iestatījumu izvēli, salīdzinot CPU, GPU un izšķirtspēju ar konfigurāciju datu bāzi. Lietderības otrā daļa palīdz noteikt, vai draiveriem ir nepieciešami atjauninājumi.

Visticamāk, entuziasti turpinās paši izvēlēties iestatījumus un uztvers negatīvi papildu programma. Tomēr lielākā daļa spēlētāju, kuri vēlas instalēt spēli un sākt spēlēt uzreiz, nepārbaudot draiverus un nepārbaudot dažādus iestatījumus, noteikti būs apmierināti ar šo iespēju. Jebkurā gadījumā NVIDIA GeForce Experience palīdz cilvēkiem maksimāli izmantot spēļu pieredzi, un tāpēc tā ir noderīga utilīta datorspēļu spēlēšanai.

GeForce Experience identificēja visas deviņas mūsu testa sistēmā instalētās spēles. Protams, viņi nesaglabāja noklusējuma iestatījumus, jo mēs izmantojām dažus iestatījumus testēšanas nolūkos. Bet joprojām ir interesanti, kā GeForce Experience būtu mainījis mūsu izvēlētās iespējas.

Tomēr Tomb Raider GeForce Experience vēlējās atspējot TressFX tehnoloģiju NVIDIA GeForce GTX 780 ar iespējotu funkciju, tas rādīja vidēji 40 kadrus sekundē. Kādu iemeslu dēļ programma nevarēja noteikt konfigurāciju Far Cry 3, lai gan viņas ieteiktie iestatījumi bija diezgan augsti. Nezināmu iemeslu dēļ Skyrim utilīta vēlējās atspējot FXAA.

Ir patīkami katrai spēlei iegūt ekrānuzņēmumu kopu, kas apraksta noteikta iestatījuma ietekmi uz attēla kvalitāti. Mūsuprāt, no deviņiem apskatītajiem piemēriem GeForce Experience bija tuvu optimālajiem iestatījumiem. Tomēr utilīta ir arī neobjektīva, patronējot NVIDIA specifiskās funkcijas, piemēram, PhysX (kuru programma ievietoja augsts līmenis Borderlands 2) un neļauj iespējot AMD funkcijas (tostarp TressFX programmā Tomb Raider). FXAA atspējošanai Skyrim vispār nav jēgas, jo spēle vidēji ir 100 FPS. Iespējams, ka entuziasti vēlēsies instalēt GeForce Experience, tiklīdz sistēma NVIDIA Shield tiks piegādāta, jo šķiet, ka spēļu straumēšanas funkcija ir pieejama, izmantojot NVIDIA lietotni.

ShadowPlay: vienmēr ieslēgts video ierakstītājs spēlēm

WoW fani bieži ieraksta savus reidus, taču tam ir nepieciešama diezgan jaudīga sistēma Fraps un daudz vietas diskā.

NVIDIA nesen paziņoja jauna funkcija ShadowPlay, kas var ievērojami vienkāršot ierakstīšanas procesu.

Kad tas ir aktivizēts, ShadowPlay izmanto fiksēto NVEnc dekodētāju, kas iebūvēts Kepler GPU, kas automātiski ieraksta pēdējās 20 spēles minūtes. Vai arī varat manuāli sākt un apturēt ShadowPlay. Tādējādi tehnoloģija aizstāj programmatūras risinājumi piemēram, Fraps, kas nodrošina lielāku CPU slodzi.

Uzziņai: NVEnc darbojas tikai ar H.264 kodējumu ar izšķirtspēju līdz 4096x4096 pikseļiem. ShadowPlay vēl nav pieejams tirgū, taču NVIDIA saka, ka līdz šīs vasaras izlaišanas brīdim tā varēs ierakstīt 1080p video ar ātrumu līdz 30 FPS. Mēs vēlētos redzēt augstāku izšķirtspēju, jo iepriekš tika teikts, ka kodētājs var to atbalstīt aparatūrā.

NVIDIA GeForce GTX 780 videokartes apskats | GPU Boost 2.0 un iespējamās overclocking problēmas

GPU Boost 2.0

Pārskatā GeForce GTX Titan Mums neizdevās plaši pārbaudīt 2. paaudzes NVIDIA GPU Boost tehnoloģiju, taču tagad tā ir klāt. NVIDIA GeForce GTX 780. Šeit ir īss šīs tehnoloģijas apraksts:

GPU Boost ir NVIDIA mehānisms, kas maina grafisko karšu veiktspēju atkarībā no apstrādājamā uzdevuma veida. Kā jūs droši vien zināt, spēlēm ir atšķirīgas GPU resursu prasības. Vēsturiski frekvence ir jāpielāgo sliktākajam scenārijam. Bet, apstrādājot "gaismu" GPU uzdevumi strādāja par velti. GPU Boost uzrauga dažādus parametrus un palielina vai samazina frekvences atkarībā no lietojumprogrammas vajadzībām un pašreizējās situācijas.

Pirmā GPU Boost ieviešana darbojās zem noteikta jaudas sliekšņa (170 W gadījumā GeForce GTX 680). Tomēr uzņēmuma inženieri ir atklājuši, ka viņi var droši pārsniegt šo līmeni, ja GPU temperatūra ir pietiekami zema. Tādējādi veiktspēju var vēl vairāk optimizēt.

Praksē GPU Boost 2.0 atšķiras tikai ar to, ka NVIDIA tagad paātrina frekvenci, pamatojoties nevis uz jaudas ierobežojumu, bet gan uz noteiktu temperatūru, kas ir 80 grādi pēc Celsija. Tas nozīmē, ka līdz mikroshēmas temperatūrai līdz 80 grādiem tagad tiks izmantotas augstākas frekvences un sprieguma vērtības. Neaizmirstiet, ka temperatūra galvenokārt ir atkarīga no ventilatora profila un iestatījumiem: jo lielāks ātrums, jo zemāka temperatūra un līdz ar to augstākas GPU Boost vērtības (un diemžēl arī trokšņa līmenis). Tehnoloģija joprojām novērtē situāciju reizi 100 ms, tāpēc NVIDIA turpmākajās versijās ir daudz darāmā.

No temperatūras atkarīgie iestatījumi padara testēšanas procesu vēl grūtāku salīdzinājumā ar pirmo GPU Boost versiju. Viss, kas paaugstina vai pazemina GK110 temperatūru, maina mikroshēmas pulksteni. Tāpēc konsekventu rezultātu sasniegšana starp skrējieniem ir diezgan sarežģīta. Laboratorijas apstākļos var cerēt tikai uz stabilu apkārtējās vides temperatūru.

Papildus iepriekšminētajam ir vērts atzīmēt, ka jūs varat palielināt temperatūras ierobežojumu. Piemēram, ja vēlaties NVIDIA GeForce GTX 780 pazemināts frekvence un spriegums 85 vai 90 grādu pēc Celsija līmenī, to var konfigurēt parametros.

Vai vēlaties, lai GK110 būtu pēc iespējas tālāk no izvēlētās temperatūras robežas? ventilatora līkne NVIDIA GeForce GTX 780 pilnībā regulējams, ļaujot pielāgot darba ciklu atbilstoši temperatūras vērtībām.

Iespējamas overclocking problēmas

Mūsu iepazīšanās laikā ar GeForce GTX Titan uzņēmuma pārstāvji mums parādīja iekšējo utilītu, kas spēj nolasīt statusu dažādi sensori: tādējādi tas vienkāršo kartes nestandarta darbības diagnostikas procesu. Ja GK110 temperatūra virstaktēšanas laikā paaugstinās pārāk augstu, pat droseles laikā, šī informācija tiks ierakstīta žurnālā.

Tagad uzņēmums ievieš šo funkciju, izmantojot Precision X aplikāciju, kas palaiž brīdinājuma algoritmu "iemeslē", ja paātrinājuma laikā ir bijušas darbības, kas neļauj to efektīvi turpināt. Šī ir lieliska funkcija, jo jums vairs nav jāuzmin iespējamās vājās vietas. Ir arī OV max limita indikators, kas jums paziņos, vai esat sasniedzis GPU absolūto maksimālo spriegumu. Šajā gadījumā pastāv kartes sadedzināšanas risks. Varat to uzskatīt par ieteikumu pazemināt virstaktēšanas parametrus.

NVIDIA GeForce GTX 780 videokartes apskats | Testa stends un etaloni


Testa stenda konfigurācija
Procesors Intel Core i7-3770K (Ivy Bridge) 3.5GHz @ 4.0GHz (40*100MHz), LGA 1155, 8MB koplietota L3 kešatmiņa, iespējota hipervītņu funkcija, iespējota enerģijas taupīšana
Mātesplate Gigabyte Z77X-UD5H (LGA 1155), Z77 Express mikroshēmojums, BIOS F15q
RAM G.Skill 16 GB (4 x 4 GB) DDR3-1600, F3-12800CL9Q2-32GBZL @ 9-9-9-24 pie 1,5 V
Uzglabāšanas ierīce Izšķirošais m4 SSD 256GB SATA 6Gb/s
Videokartes Nvidia GeForce GTX 780 3 GB

AMD Radeon HD 7990 6 GB

AMD Radeon HD 7970 GHz Edition 3 GB

Nvidia GeForce GTX 580 1,5 GB

Nvidia GeForce GTX 680 2 GB

Nvidia GeForce GTX Titan 6 GB

Nvidia GeForce GTX 690 4 GB

Enerģijas padeve Cooler Master UCP-1000W
Sistēmas programmatūra un draiveri
OS Windows 8 Professional 64 bitu versija
DirectX DirectX 11
Grafiks. vadītājiem AMD Catalyst 13.5 (Beta 2)
Nvidia GeForce Release 320.00
Nvidia GeForce Release 320.18 (paredzēts GeForce GTX 780)

Pareizas kadru ātruma vērtības iegūšana

Vērīgi lasītāji ievēros, ka skaitļi nākamajās lappusēs ir pieticīgāki nekā apskatā. AMD Radeon HD 7990, un tam ir iemesls. Iepriekš mēs prezentējām sintētisko un reālo kadru ātrumu, un pēc tam parādījām laika svārstības starp kadriem, kā arī nomestiem un īsiem kadriem. Fakts ir tāds, ka šī metode neatspoguļo patieso videokartes darbības sajūtu, un no mūsu puses būtu negodīgi nosodīt AMD, paļaujoties uz sintētiskiem laika aizkaves indikatoriem starp kadriem.

Tāpēc līdzās kadru ātruma svārstībām mēs tagad piedāvājam praktiskāku dinamisko kadru nomaiņas ātrumu. Rezultāti nav tik augsti, bet tajā pašā laikā tie ir ļoti daiļrunīgi spēlēs, kurās AMD piedzīvo grūtības.

Pārbaudes un iestatījumi
Battlefield 3 Grafikas kvalitāte — ultra, v-sinhronizācija izslēgta, 2560 x 1440, DirectX 11, medības, 90 sekundes, FCAT
Far Cry 3 Grafikas kvalitāte — Ultra, DirectX 11, v-sinhronizācija izslēgta, 2560 x 1440, izpildiet savu maršrutu, 50 sekundes, FCAT
Robežzemes 2 Grafikas kvalitāte — augstākā, PhysX zema, 16x anizotrops filtrs, 2560x1440, izpildiet savu maršrutu, FCAT
Hitmens: Absolūcija Grafikas kvalitāte - Ultra, MSAA izslēgts, 2560x1440, iebūvēts etalons, FCAT
The Elder Scrolls V: Skyrim Grafikas kvalitāte — Ultra, FXAA iespējots, 2560x1440, izpildiet savu maršrutu, 25 sekundes, FCAT
3DMark Fire Strike etalons
BioShock Infinite Grafikas kvalitāte - Ultra, DirectX 11, difuzora lauka dziļums, 2560x1440, iebūvēts etalons, FCAT
Crysis 3 Grafikas kvalitāte - ļoti augsta, MSAA: zema (2x), augstas izšķirtspējas teksts, 2560x1440, brauciet pa savu maršrutu, 60 sekundes, FCAT
kapeņu laupītāja Grafikas kvalitāte — izcila, iespējota FXAA, 16x anizotropiskā filtrēšana, TressFX Hair, 2560x1440, izpildiet savu maršrutu, 45 sekundes, FCAT
Lux Mark 2.0 64 bitu binārs, versija 2.0, Sala aina
SiSoftware Sandra 2013 Professional Sandra tehniskais atbalsts (inženiere) 2013.SP1, kriptogrāfija, finanšu analīzes veiktspēja


SATURS