Acasă / Console de jocuri / Plăci video. Configurarea testului, instrumentele și metodologia de testare

Plăci video. Configurarea testului, instrumentele și metodologia de testare

AMD a decis să înceapă o nouă bătălie pentru dominație pe piața GPU-urilor. Dar astăzi, ambii producători, AMD și Nvidia, trebuie să facă față unor noi provocări și să lucreze în condiții noi. În special, AMD trebuie să treacă la tehnologie nouă Producție de 28 nm și o arhitectură GPU complet nouă, așa cum sa dovedit. NVIDIA plănuiește să treacă și la 28 nm, dar numai în câteva luni, și cu o nouă arhitectură. Dar AMD a fost primul, iar în articolul nostru vom vorbi despre noua generație de GPU-uri sub forma AMD Radeon HD 7970.

AMD crede că jocurile pe computer sunt în plină expansiune, și pe termen scurt - mai ales având în vedere că consolele sunt actualizate pentru o perioadă destul de lungă. Și din moment ce motoarele grafice moderne beneficiază de capacitățile plăcilor grafice avansate, această dezvoltare nu va face decât să se intensifice. Piața de jocuri pentru PC a valorat 15 miliarde de dolari anul trecut și se preconizează că va crește la 20 de miliarde de dolari până în 2013. Și nu uitați că jucătorii de astăzi preferă să joace la rezoluții din ce în ce mai mari. Rezoluția 1080p a devenit deja standardul de facto, care este întărit de afișaje care devin rapid mai ieftine cu diagonala mare. În plus, AMD se concentrează pe o eficiență mai mare a GPU și pe capacități de calcul GPU. Acest din urmă domeniu este foarte important pentru AMD astăzi, deoarece compania dorește să rezolve limitările găsite în GPU-urile cu arhitectură Cayman.


În acest moment, AMD a introdus doar Radeon HD 7970, după cum puteți vedea pe slide, dar noi plăci grafice ar trebui să apară în linia Radeon HD 7900 în curând.

NVIDIA GeForce GTX 570

NVIDIA GeForce GTX 580

AMD Radeon HD 6950 AMD Radeon HD 6970 AMD Radeon HD 7970
GPU GF110 GF110 Cayman PRO Cayman XT Tahiti XT
Proces tehnologic 40 nm 40 nm 40 nm 40 nm 28 nm
Numărul de tranzistori 3 miliarde 3 miliarde 2,6 miliarde 2,6 miliarde 4,3 miliarde
Zona de cristal 530 mm² 530 mm² 389 mm² 389 mm² 365 mm²
Viteza de ceas GPU 732 MHz 772 MHz 800 MHz 880 MHz 925 MHz
Ceas cu memorie 950 MHz 1000 MHz 1250 MHz 1375 MHz 1375 MHz
Tipul memoriei GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Memorie 1280 MB 1536 MB 2048 MB 2048 MB 3072 MB
Lățimea magistralei de memorie 320 de biți 384 de biți 256 de biți 256 de biți 384 de biți
Lățimea de bandă a memoriei 152 GB/s 192 GB/s 160 GB/s 176 GB/s 264 GB/s
Model Shader 5.0 5.0 5.0 5.0 5.0
DirectX 11 11 11 11 11.1
Numărul de procesoare de flux 480(1D) 512(1D) 1408 (352 4D) 1536 (384 4D) 2048(1D)
Viteza de ceas a procesoarelor de flux 1464 MHz 1544 MHz 800 MHz 880 MHz 925 MHz
Numărul de blocuri de textură 60 64 88 96 128
Numărul de POR 40 48 32 32 32
Consum maxim de energie 219 W 244 W 200 W 250 W 250 W
Consum minim de energie - 30-32W 20 W 20 W 2,6 W
CrossFire/SLI SLI SLI CrossFireX CrossFireX CrossFireX

Placa grafică Radeon HD 7970 se bazează pe GPU-ul „Tahiti XT”, care este fabricat folosind o tehnologie de proces de 28 nm. Total GPU are 4,3 miliarde de tranzistori. Pentru comparație, procesoare Intel Sandy Bridge-E (excluzând modelele quad-core) are 2,27 miliarde de tranzistori. Iar predecesorul din familia Cayman Radeon HD 6900 a lucrat cu 2,6 miliarde de tranzistori. Suprafața cristalului este de 365 mm². După cum puteți vedea, aria este puțin mai mică de 389 mm² pentru GPU-urile „Cayman”, care sunt fabricate folosind tehnologia de proces de 40 nm. GPU-ul GF110 de la NVIDIA conține 3 miliarde de tranzistori într-o zonă de 530 mm². Cea mai mare parte a bugetului tranzistorului GPU a fost cheltuit pe 2048 procesoare de flux. Procesoarele GPU și stream funcționează la o viteză de ceas de 925 MHz. AMD a decis să păstreze aceeași memorie ca și Radeon HD 6970, adică GDDR5 la 1375 MHz. Dar interfața de memorie a fost extinsă de la 256 de biți la 384 de biți, mărind lățimea de bandă a memoriei la 264 GB/s. În plus, capacitatea a crescut de la 2048 MB la 3072 MB. Radeon HD 7970 are 128 de unități de textură și 32 de pipeline de operații raster (ROP) - obținem o creștere a unităților de textură în comparație cu Radeon HD 6970, dar numărul de ROP-uri rămâne același. AMD a enumerat consumul maxim de putere pentru Radeon HD 7970 la 250 W, care este și limita pentru PowerTune. Consumul obișnuit de energie al plăcii grafice este de 210 W. Să reamintim că Radeon HD 6970 a avut un consum maxim de energie de 250 de wați, iar unul tipic sub sarcină - 190 de wați. Datorită tehnologiei ZeroCore Power (mai multe despre asta mai jos), consumul de energie în modul inactiv nu depășește trei wați.

GPU-Z 0.5.7, după cum puteți vedea în captură de ecran, nu afișează corect toate datele AMD Radeon HD 7970. Pe sistemul nostru de testare, interfața Socket 1366 a fost listată ca PCI Express 3.0 x16 și viteza de ceas este de 500 MHz. De asemenea, au fost date valori incorecte pentru pixeli și lățimea de bandă a texturii. Valorile corecte sunt 925 MHz pentru GPU, 29,6 Gpixel/s și 118,4 Gtexel/s.

Zvonuri despre lansarea plăcii video actualizate Radeon HD 7970, iar la Computex 2012 doar leneșii nu au vorbit despre asta. Desigur, ne referim la Radeon HD 7970 GHz Edition. Între timp, AMD produce procesoare „Southern Island” în 28nm la TSMC de câteva luni, ceea ce este suficient timp pentru a face optimizări în procesul de producție și a crește randamentul cipurilor. Mai ales că performanta ridicata GeForce GTX 680 de la NVIDIA a forțat AMD să caute o nouă versiune mai rapidă a Radeon HD 7970 cu care să concureze. În recenzia noastră, ne vom uita la cât de demn va deveni un adversar Radeon HD 7970 GHz Edition în comparație cu GeForce GTX 680, ce îmbunătățiri vom obține în comparație cu modelul standard HD 7970.

Producătorii care și-au făcut deja un nume prin lansarea plăcilor grafice overclockate din fabrică intenționează să facă același lucru cu noua ediție Radeon HD 7970 GHz. AMD și-a pus în mod clar obiectivul de a putea împinge frecvențele GPU peste bara de 1 GHz, menținând în același timp aceleași niveluri de tensiune ca modelul original. Acest lucru se aplică atât overclocking-ului manual de către entuziaști, cât și overclocking-ului din fabrică de către producătorii de plăci video. „Vechiul” model Radeon HD 7970 va fi deocamdată la vânzare, dar AMD poziționează ediția GHz cu un pas mai sus în performanță și, în consecință, în preț.

Specificațiile tehnice sunt prezentate în următorul tabel:


NVIDIA GeForce GTX 680 AMD Radeon HD 7970 AMD Radeon HD 7970 GHz Edition
Preț de vânzare aproximativ 460 de euro în Europa
aproximativ 18,5 mii de ruble în Rusia
aproximativ 380 de euro în Europa
aproximativ 17 mii de ruble în Rusia
499 USD
Pagina web cu produse NVIDIA AMD AMD
Specificatii tehnice
GPU GK104 (GK104-400-A2) Tahiti XT Tahiti XT2
Proces tehnologic 28 nm 28 nm 28 nm
Numărul de tranzistori 3,54 miliarde 4,3 miliarde 4,3 miliarde
Viteza de ceas GPU 1006 MHz (Boost: 1058 MHz) 925 MHz 1000 MHz (Boost: 1050 MHz)
Ceas cu memorie 1502 MHz 1375 MHz 1500 MHz
Tipul memoriei GDDR5 GDDR5 GDDR5
Memorie 2048 MB 3072 MB 3072 MB
Lățimea magistralei de memorie 256 de biți 384 de biți 384 de biți
Lățimea de bandă a memoriei 192,3 GB/s 264 GB/s 288 GB/s
Versiunea DirectX 11.1 11.1 11.1
Procesoare de flux 1536(1D) 2048(1D) 2048(1D)
blocuri de textură 128 128 128
ROP 32 32 32
Rata de umplere a pixelilor 32,2 Gpixel/s 29,6 Gpixeli/s 33,6 Gpixel/s
Consum minim de energie 15 W 2,6 W 2,6 W
Consum maxim de energie 195 W 250 W 250 W
SLI/CrossFire SLI CrossFire CrossFire

Din punct de vedere arhitectural, noua versiune a ediției GHz nu diferă de Radeon HD 7970. AMD s-a bazat doar pe optimizarea procesului tehnic, pe capacitatea de a opera GPU-ul la o tensiune mai mică, ceea ce a făcut posibilă creșterea frecvenței nominale de ceas a GPU-ului de la 925 MHz la 1000 MHz. Interesant este că 1000 MHz corespunde frecvenței de bază, deoarece AMD a implementat un mod Boost. Va crește frecvența de ceas la 1050 MHz pentru placa video Radeon HD 7970 GHz Edition. Adică, în comparație cu frecvența inițială de 925 MHz, obținem un overclock de 13,5 la sută.

De asemenea, este frumos că GPU-ul „Tahiti XT2” în modul inactiv rulează doar la 0,807 V. Radeon HD 7970, ne amintim, tensiunea era de 0,85 V. Sub sarcină, vitezele de ceas cresc la nivelul promis de AMD 1050 MHz, în timp ce tensiunea GPU-ului 1.201 - 1.221 V. „vechiul” GPU Radeon HD 7970 rula la 1.139 V.

Mecanismul Powertune este bine cunoscut de la generațiile anterioare de GPU. Dar în cazul ediției Radeon HD 7970 GHz, tehnologia Powertune de la AMD oferă o creștere a vitezei de ceas Boost. În plus față de cunoscutul anterior „High P-State”, AMD adaugă un alt P-state „Boost P-State”. Vă permite să obțineți viteze de ceas și mai mari, care sunt posibile prin schimbările dinamice ale tensiunii.

Dar, spre deosebire de NVIDIA, AMD nu indică modul Boost minim - este fixat la 1050 MHz. În plus, tehnologia cunoscută de la procesoarele Trinity este folosită pentru a funcționa. Și anume, „Digital Temperature Estimation”, care evaluează în prealabil sarcina și setează frecvențele de ceas în consecință. La nivel arhitectural, cipurile Tahiti din cele două plăci video Radeon HD 7970 nu diferă unele de altele. Astfel, Powertune este implementat prin VBIOS și un driver; teoretic, tehnologia poate funcționa și pe plăci video mai vechi.

Memoria a fost, de asemenea, overclockată. După cum puteți vedea din specificațiile de mai sus, VRAM-ul este tactat la 1500 MHz, crescând debitul de la 264 GB la 288 GB pe secundă. Datorită interfeței de memorie mai largi, AMD a putut să se desprindă și mai mult de NVIDIA în acest sens.

Performanța teoretică a noutății este de 4,3 teraflopi cu precizie simplă și 1,08 teraflopi cu precizie dublă. NVIDIA a anunțat recent acceleratorul de calcul Tesla K10 bazat pe două GPU-uri GK104, care oferă 4,58 teraflopi de performanță cu o singură precizie. Dar performanța de precizie dublă GK104 este 1/24 din cea a preciziei simple. Această situație se va schimba doar cu cipul GK110 și Tesla K20, când ne putem aștepta la o creștere de trei ori a performanței de dublă precizie. Astfel, dacă Tesla M2090 bazat pe Fermi oferă 665 gigaflopi, atunci se poate aștepta ca GK110 să performeze 1,5 teraflopi sau mai mult.

Pentru mai multe detalii despre arhitectura „Graphics Core Next” și despre generația „Southern Island”, vă recomandăm să consultați .

Așa că a sosit momentul să înlocuim Palit GeForce GTX 460, care a funcționat cu onoare timp de trei ani.În înlocuire, am ales flagship-ul de la Radeon - HD 7970 de la Asus. S-a dovedit a fi foarte dificil să găsești un card pe acest cip, a existat un deficit mare în magazine, mai ales în Orientul nostru Îndepărtat. A reușit să cumpere ASUS Radeon HD 7970 DirectCU II doar pentru 18.000 de ruble, ceea ce astăzi, din păcate, este destul de mult.

Principala speranță: că placa video își va justifica prețul, mulțumindu-mă de performanța sa.

Specificația plăcii video:

Ambalaje si echipamente

O cutie mare cu un cavaler de marcă atrage imediat atenția unui potențial cumpărător. Producătorul se mândrește cu sistemul de răcire proprietar DirectCU II, o funcție unică VGA HotWire care vă permite să-l conectați la placa de bază din seria ROG. La fel vedem Informații importante, de care trebuie să țineți cont atunci când cumpărați: o unitate de alimentare de la 600 de wați. cu un curent de 42A de-a lungul liniei + 12v.

În cutie, placa video este ambalată în siguranță, iar transportul neglijent nu este groaznic pentru conținut atât de valoros.

Kitul include un disc cu drivere și utilitare, printre care se numără GPU Tweak, pe care l-am folosit ulterior.

Instrucțiuni detaliate cu imagini color. Un bridge CrossFireX flexibil, un adaptor de la DVI la HDMI, nu există o astfel de ieșire pe placa în sine. Un adaptor pentru un conector de alimentare PCI-E cu 8 pini, nu toate PSU-urile au doi astfel de conectori. Și există, de asemenea, un radiator care poate fi lipit cu bandă dublu față de unitatea de stabilizare a puterii dacă instalați răcire cu lichid.

Nu existau bonusuri sub formă de jocuri sau chei pentru jocuri.

Aspect

Cardul pare mare și solid, ocupă trei sloturi de expansiune. Dar se potrivește fără probleme în noua mea clădire și acolo este destul de spațioasă.

Puteți conecta până la 6 monitoare la placa video, pentru aceasta există 4 porturi Display și două DVI. Dar un port Display funcționează dacă un port DVI este comutat în modul Single-Link printr-un comutator special.

Sistemul de răcire proprietar face plăcile video ale acestui producător „gemeni”: dungi roșii în centru, două ventilatoare și o placă din spate care împiedică textolitul să se îndoaie și preia greutatea unui sistem masiv de răcire.



Acum este clar de ce există un cavaler pe cutie: placa video este toată îmbrăcată cu o armură groasă și puternică.

Puterea este furnizată plăcii prin doi conectori cu opt pini, care ar trebui să ofere o rezervă de putere.
Cardul este echipat cu 3 GB de memorie video GDDR5, rulând inițial la 5500 MHz. Există o magistrală lată de 384 de biți între memorie și cipul Tahiti XT. Cipul este fabricat conform tehnologiei de proces de 28 nm și include 2048 de conducte unificate, precum și 32 de unități de rasterizare.

Sistemul de răcire constă dintr-un bloc superior cu două ventilatoare de 90 mm.



Ventilatoarele sunt alimentate de două radiatoare din aluminiu care atrag căldura din cele șase conducte de căldură. Eficacitatea unui astfel de sistem s-a dovedit de mult și îl voi verifica în funcționare folosind MSI Afterburner.

Testare

Stand de testare:

Am incercat cardul in acest caz. Aici, când ventilatoarele sunt pornite la 100%, zgomotul este clar audibil sub forma unui bâzâit puternic. La overclockarea nucleului la 1100 și a memoriei la 1500, cardul a dat 615 MHash la minarea LTC. Cu complexitatea și cursul actual, acest lucru este de 100 USD pe lună, ceea ce în mod clar nu este rentabil.

constatări

Impresiile plăcii sunt foarte pozitive, cred că am găsit un înlocuitor demn pentru vechea mea placă video. Ventilatoarele, chiar și sub sarcină, nu accelerează cu 100%, așa că într-un caz bun sunt aproape inaudibile. Temperatura nu crește peste 70 de grade, iar încălzirea cardului nu afectează celelalte componente. În jocurile cu setări ridicate, cardul produce un număr foarte jucabil de cadre pe secundă. Când acest lucru nu este suficient, placa video poate fi overclockată, ceea ce îi va crește performanța cu douăzeci de procente.
Ei bine, dezavantajele enumerate mai jos sunt relative. Pentru o carcasă încăpătoare, dimensiunea plăcii video nu contează, dar poți aranja mai eficient un sistem de răcire pentru trei sloturi. Pretul este si el relativ; cand am fost astazi la alimentatie cu sotia mea, mi-am dat seama ca totul e in regula, fara supraplata: - ((|=:

Avantaje:
Liniște
productiv
Potențial bun de overclocking, capabil să mărească performanța cu până la 20%
Răcire eficientă

dezavantaje
Dimensiune mare, nu se potrivește în niciun caz
Preț mare

La sfârșitul anului trecut, AMD a dezvăluit codul sursă pentru noua sa arhitectură GPU, numită Insulele de Sud. Una dintre primele încarnări ale acestei inovații a fost placa grafică SAPPHIRE HD 7970 3GB GDDR5.

Această arhitectură a fost produsul unui anumit declin în dezvoltarea tehnologiei de 28 nm și a fost numită de reprezentanții AMD nimic mai puțin decât revoluționară și concepută pentru o accelerație de 1,4x față de generația anterioară. În plus, în SAPPHIRE HD 7970 primim suport PCIe 3, 3 GB memorie GDDR5 de mare viteză, compatibilitate DX 11.1, Power Tune, Zero Core și suport pentru tehnologie Eyefinity 2.0, care a câștigat noi funcții și caracteristici. Noul nucleu de la AMD, numit Graphics Core Next Tahiti, este o trecere de la designul VLIW la un motor SIMD non-VLIW, ceea ce înseamnă performanță de calcul mai mare.



Acest nou nucleu are un număr semnificativ crescut de tranzistori (4,31 miliadrese), 2048 procesoare de flux cu 32 de unități raster, 128 de unități de textură și o magistrală de memorie cu lățime de bandă mare de 384 de biți care oferă o creștere de ori mai mare a puterii de calcul și a lățimii de bandă a memoriei. Toate aceste caracteristici arată mai mult decât impresionant pe hârtie și ar trebui să ducă experiența de joc la nivelul următor.

Caracteristicile lui SAPPHIRE HD 7970

iesirile 1 x Dual Link DVI
1 x HDMI 1.4a
2 x Mini-DisplayPort
Display Port 1.2
GPU Ceas de bază 925 MHz
Tehnologia de producție a cipurilor de 28 nm
Numărul de procesoare de flux - 2048
Memorie Volum - 3072 MB
Tip - GDDR5 pe 384 de biți
Eficiență - 5500 MHz
Dimensiuni 275(l)x115(l)x36(h) mm
PE CD cu drivere
Utilitar SAPPHIRE TriXX
Accesorii Cablu de interconectare CrossFire™ Bridge
Cablu de alimentare de la 8 PIN la 4 PIN
Adaptor Mini Display Port la HDMI
Adaptor pasiv Mini DP la SL-DVI
Cablu de alimentare 6 PIN la 4 PIN
Adaptor HDMI la SL-DVI
Cablu HDMI 1.4a de mare viteză (1,8 metri)
Adaptor activ Mini DP la SL-DVI

SAPPHIRE HD 7970: Teste

Testul SAPPHIRE HD 7970 a fost comparat cu alte dispozitive din aceeași clasă și a constat dintr-un complex teste de jocși un etalon sintetic. Cardurile selectate pentru comparație sunt fie egale, fie nominal superioare ca performanță față de HD 7970, astfel încât rezultatele testelor ar trebui să reflecte pe deplin performanța reală.

Configurația și setările sistemului nu se vor schimba în timpul tuturor testelor. Plăcile video vor fi testate mai întâi la viteza stocului și apoi în configurație overclockată (descrierea procesului de overclocking HD 7970 și rezultatele sunt prezentate mai jos) pentru a evalua eficiența accelerării dispozitivului. Driverul 11.12 Catalyst a fost folosit pentru cardurile AMD și 290.53 pentru cardurile bazate pe NVIDIA.

Sistem în configurație de testare:

  • CPU: Core i7 2600K @ 4,4GHz 100x44
  • Răcire CPU: Corsair Hydro Series H100
  • cartea mamei: Gigabyte Z68AP-D3
  • Memorie: Mushkin 991996 Redline PC3-17000 9-11-10-28 8 GB
  • placa video: Sapphire Radeon HD 7970
  • Alimentare electrică: Corsair AX1200
  • HDD: 1 x Seagate 1TB SATA
  • unitate optică: Lite-On Blu-Ray
  • Sistem de operare: Windows 7 Professional pe 64 de biți

Plăci video comparabile:

  • XFX HD 6970
  • ASUS HD 6950
  • ASUS GTX 580 Direct CU II
  • ASUS GTX 570 Direct CU II
  • Sapphire HD 6990
  • ASUS GTX 590

Test de jocuri: Metro 2033

Parte FPS, parțial horror, Metro 2033 este alimentat de motorul 4A cu suport pentru DirectX 11, NVIDIA PhysX și NVIDIA 3D Vision.

Setări:

  • DirectX 11
  • 16xAF
  • Setări globale = ridicat
  • Physx = pornit




În Metro 2033, SAPPHIRE HD 7970 a arătat rezultate foarte puternice la ambele rezoluții, atât stoc cât și overclock.

Test de redare: Battlefield 3

Battlefield 3 este un shooter la persoana întâi dezvoltat de EA Digital Illusions CE și alimentat de motorul Frostbyte 2. Acest joc a fost lansat pe 25 octombrie 2011. Acceptă DirectX 10 și 11.

Setări:

  • 4x AA la CP
  • 16X AF în CP
  • Setări joc = ridicat


Comparativ cu generația anterioară HD 6970 bazată pe Cayman, HD 7970 din Tahiti a arătat o creștere semnificativă a puterii în acest joc.

Test de joc Dirt 3

Dirt 3 este al treilea joc din legendara serie de curse dezvoltată de Codemasters. Este construit pe motorul EGO 2.0. Lansarea a avut loc în mai 2011.

Setări:

  • 4xAA
  • 16AF în CP
  • Setări = Ultra


În acest joc, lansat de altfel, cu un marker „AMD” pe cutie, placa HD 7970 a fost la nivelul GTX 580. Overclocking-ul a ajutat GTX 580 mai mult decât HD 7970.

Testarea cu un benchmark sintetic 3DMark 11

3DMark 11 este cel mai recent Futuremark din seria 3DMark, adaptat pentru testarea sistemelor care rulează Microsoft DirectX 11. Acest program constă din șase teste, dintre care patru sunt pentru testarea grafică, unul pentru simularea fizică și unul combinat. Pentru testarea pe un model fizic, se folosește biblioteca Bullet Physics. Două demonstrații sunt furnizate împreună cu benchmark-ul, ambele fiind bazate pe teste, dar spre deosebire de teste, acestea conțin audio de bază.

Setări:

  • Setări de testare implicite
  • Test inițial 1024 x 600
  • Test de performanță 1280 x 720
  • Test extrem 1920 x 1080

În benchmark-ul 3DMark11, SAPPHIRE HD 7970 a obținut un scor mai mare decât GTX 580 atât în ​​configurații stoc cât și overclockate.

În timpul testelor de temperatură, s-a constatat că SAPPHIRE HD 7970 atât la frecvențe stoc, cât și în stare overclockată a prezentat valori cu 8 grade mai mici decât ultima generație de carduri HD 6970, ceea ce este un rezultat excelent pentru un dispozitiv atât de puternic.

La frecvențe obișnuite și mai mari, tehnologia Zero Core reduce perfect consumul de energie în modul de așteptare. Sub sarcină fără creșterea tensiunii procesorului, consumul total de energie al cardului nu crește semnificativ.

Overclockare

Din lansările oficiale de carduri de la AMD, a căror viteză nominală de bază depășește 1000 MHz, putem concluziona că cu noul Southern Islands Tahiti avem o mare perspectivă de overclocking. De fapt, 1000 MHz este doar un punct de plecare și se pare că cardul va putea depăși limitele stabilite în Catalyst Control. Atingerea 1125 MHz pe nucleu este asigurată doar prin rearanjarea tensiunii aplicate acestuia folosind setările disponibile de la CC. Prin expunerea tensiunii furnizate memoriei la limitele CC, acest nod a fost adus la o viteză de 1575 MHz. Aceste frecvențe indică faptul că mai sunt cel puțin încă 200 MHz atât în ​​nucleele GPU, cât și în memoria GDDR5. Aceștia sunt indicatori foarte buni. Fără tensiune suplimentară aplicată, temperatura de pe GPU nu a crescut semnificativ. Când setați manual viteza ventilatorului la 100%, temperatura cardului overclockat nu a depășit 57 de grade. În continuare, oricine va trebui să caute utilități (pentru BIOS sau software) pentru a depăși limitele CC și a vedea de ce este capabilă cu adevărat placa video. Merită remarcat faptul că accelerarea ventilatorului pe cardurile AMD ajută întotdeauna la menținerea temperaturilor scăzute, dar numai cu prețul unei creșteri serioase a nivelului de zgomot. În cazul lui SAPPHIRE RADEON HD 7970, AMD a îmbunătățit atât performanța de răcire, cât și de zgomot cu un nou design mai rece.

Să rezumam overclocking-ul nostru: 200 MHz este o creștere cu 21% a nucleului și aproximativ 15% din frecvența tactului memoriei la prima etapă de overclocking, putem vorbi despre viitorul strălucit al plăcii video.

Recenzii: argumente pro și contra

Când încercăm să înțelegem dacă noua versiune ne oferă tot ceea ce ne-am dorit și ne-am așteptat de la ea, înțelegem că noua placă video nu numai că depășește generațiile anterioare de dispozitive, dar lasă în urmă majoritatea concurenților moderni direcți. Recenzie SAPPHIRE HD 7970 - placa video este extrem de convingătoare. Depășește cu ușurință HD 6970 din Insulele Nordului Cayman și Nvidia GTX 580 la aproape fiecare test. În același timp, chiar și la viteze de ceas stoc, chiar și performanța de joc este impresionantă, iar spațiul oferit de dispozitiv pentru overclocking deschide perspective cu adevărat interesante. Am reușit să împingem cu ușurință nucleul GPU și vitezele memoriei la limitele AMD Catalyst Control Center și să le setăm la 1125 MHz nucleu și 1575 MHz memorie - am obținut câștiguri de 200 MHz fără efort pe ambele noduri. Această putere suplimentară vă permite să utilizați o singură carte pentru a juca tehnologia Eyefinity la rezoluții de până la 5760 x 1080. Noua arhitectură a cardului SAPPHIRE HD 7970 acceptă versiune noua Tehnologia Eyefinity 2.0, care oferă o serie de îmbunătățiri, inclusiv canale media individuale pentru fiecare ieșire, o nouă configurație de monitor 5x1 și multe altele.

Este de remarcat performanța îmbunătățită a sistemului de răcire AMD. Atât la temperaturi stoc, cât și overclockate, HD 7970 a fost cu aproximativ 4 grade Celsius mai scăzut decât HD 6970 la frecvențe stoc în modul inactiv și 8 grade în alte moduri.

În timp ce consumul de energie al HD 7970 a fost mai mare decât al HD 6970 sub sarcină, tehnologia AMD ZeroCore a ajutat la reducerea consumului de energie cu aproximativ jumătate atunci când este inactiv.

Costul pentru toate bunătățile HD 7970 este de aproximativ 550 USD, ceea ce poate fi o surpriză pentru unii cumpărători. Dar la acești bani, obțineți o cartelă cu adevărat puternică, care își depășește cu mult concurenții, inclusiv HD 6970. Dacă căutați, puteți cumpăra două HD 6970 cu aproximativ 50 USD mai puțin decât cel indicat și obțineți performanță la nivelul HD 6990+, plătind mai mult decât prețul în bani nivel inalt zgomot și consum de energie. Achiziționând SAPPHIRE HD 7970 3GB GDDR5, obțineți astăzi cea mai rapidă placă video cu un singur GPU, care va rula cu ușurință și fără frâne orice joc modern! AMD și partenerii au realizat din nou un produs grozav!

Pro:

  • Cea mai rapidă placă grafică GPU
  • Capabilitati excelente de overclocking
  • Performanta ridicata
  • Joacă-te cu Eyefinity
  • Arhitectură nouă
  • Tehnologie zero core
  • Reducerea zgomotului

Minusuri:

  • Ventilatorul este încă zgomotos la viteză de 100%.

Vizualizari: (1943)

Introducere

Arhitectura unității de procesare grafică (ATI) a AMD nu s-a schimbat prea mult de la seria Radeon HD 2000, cu designul VLIW până la HD 6000. Ce este? În primul rând, să ne amintim cum funcționează procesorul central în computerele noastre personale. CPU-urile moderne sunt superscalare, adică unitățile lor de calcul pot executa mai multe instrucțiuni dintr-un fir în același timp. Dar instrucțiunile trebuie să fie independente unele de altele, astfel încât procesorul verifică în mod constant când este posibil să se efectueze operații paralele și când este necesar să aștepte ca următoarea dependență să fie rezolvată. În plus, procesorul face predicții de ramificație și poate face o parte din muncă în avans (în afara comenzii). Optimizarea acestor funcții este o sarcină tehnică complexă, iar circuitele pe care sunt construite ocupă o bună parte din matrița procesorului.

Dar există o altă modalitate: să stabiliți ordinea de execuție a instrucțiunilor în etapa de compilare a codului. Compilatorul însuși găsește instrucțiuni care pot fi executate simultan și formează din ele construcții compuse lungi. De aici și termenul VLIW - cuvânt de instrucție foarte lung. VLIW arată în general eficiență ridicată atunci când codul conține puține dependențe și fluxul programului este previzibil. Compilatorul „cunoaște” codul de la început până la sfârșit și poate seta execuția anumitor fragmente cu o marjă mare de timp. Dar planificarea se dovedește a fi dificilă, iar în cazul în care cursul programului depinde de date externe, compilarea ingenioasă nu ajută prea mult, unitățile de execuție sunt inactive și performanța scade.

Dar redarea graficelor 3D este o sarcină previzibilă și se paralelizează bine. Prin urmare, pariul pe VLIW, care a fost făcut apoi de o companie independentă canadiană, s-a justificat pe deplin. Prin schimbarea funcțiilor programatorului la compilator, ATI ar putea face cipuri relativ compacte cu sute nebunești de elemente de execuție în interior și, ca urmare, plăcile video s-au dovedit a fi relativ ieftine. Punctul culminant al AMD pentru VLIW a venit în timpul seriei 5.000 de Radeon HD, când debutul arhitecturii Fermi a NVIDIA (GeForce 400) sa blocat puțin. Și nu e de mirare, pentru că „verzii” trebuie să facă cipuri uriașe, până la trei miliarde de tranzistori. Și chiar și acum, când arhitectura Fermi funcționează deja la capacitate maximă în adaptoarele GeForce 500, iar acceleratoarele de top NVIDIA depășesc produsele AMD în benchmark-uri, Radeon-ul al 6000-lea oferă încă performanțe excelente în jocuri.

În acest caz, de ce a decis AMD să ia o întorsătură atât de bruscă? S-ar părea că ar fi suficient să lustruiți puțin designul GPU-ului, să creșteți unitățile de calcul ici și colo, să introduceți un mai subțire proces tehnologic— și VLIW va trăi fericiți până la urmă. De ce să pierdeți timp și bani dezvoltând o arhitectură complet nouă? Dar nu este vorba doar de jocuri. GPU-urile evoluează încet de la dispozitive de randare 3D pură la GPU-uri de uz general (GPGPU) care pot fi folosite pentru orice tip masiv. calcul paralel. Cu toate acestea, astăzi s-a dovedit că dacă spunem GPGPU, atunci ne referim la CUDA. Nici API-ul nativ „roșu” numit ATI Stream, nici Open CL nu sunt la fel de populare ca CUDA de la NVIDIA. Între timp, AMD își dorește cu adevărat să ia o mușcătură din această piață, dar pentru ca acest lucru să fie posibil, arhitectura VLIW veche și bună va trebui abandonată. Nu este potrivit pentru calcule non-grafice, deoarece sunt mai puțin previzibile decât randarea 3D, iar GPU-ul pur și simplu nu este capabil să funcționeze la întregul său potențial.

Graphics Core Arhitectura următoare

Să luăm cel mai recent reprezentant al arhitecturii VLIW AMD, procesorul Cayman, care stă la baza adaptoarelor Radeon HD 6950/6970/6990. Componenta principală a domeniului shader este SIMD Engine - un bloc de șaisprezece procesoare de flux. Toate execută simultan o instrucțiune VLIW, dar în raport cu date diferite (de aceea SIMD - instrucțiune unică, date multiple). La rândul lor, până la patru operații scalare pot fi împachetate într-o instrucțiune VLIW, care corespunde la patru ALU-uri în interiorul unui procesor de flux.

Blocul de bază al Graphics Cores Next (GCN) se numește Unitatea de calcul și funcționează destul de diferit. Are, de asemenea, 64 de ALU, dar acestea sunt împărțite în patru module SIMD vectoriale separate a câte 16 fiecare plus un bloc de planificare. Mai simplu spus, paralelismul era implementat prin mai multe operații într-o singură instrucțiune, iar acum prin mai multe blocuri SIMD separate. Și dacă performanța vechii arhitecturi depinde de câte operații scalare poate codifica compilatorul într-o singură instrucțiune VLIW, atunci unitatea de calcul din nucleul GCN poate distribui în mod dinamic sarcina între blocurile SIMD.

Încărcarea pentru execuția paralelă în blocul SIMD vine sub forma unui tablou (front de undă) de 64 de instrucțiuni, care este executat în patru cicluri. Și deși doar patru matrice pot fi în funcțiune în același timp, alte 28 sunt direct accesibile din Unitatea de calcul, datorită cărora planificatorul are spațiu de manevră. Într-o situație în care o dependență în cod împiedică blocul SIMD combinat al procesorului VLIW să funcționeze la capacitate maximă, blocurile SIMD individuale ale cipul GCN vor trece pur și simplu la alte matrice de la aceeași sarcină sau sarcini complet diferite.

Punctul culminant al GCN este o unitate scalară separată în fiecare unitate de calcul. Este destinat operațiunilor unice care nu se încadrează în frontul de undă (ceea ce va salva modulele SIMD de la utilizarea ineficientă) și, de asemenea, pentru controlul execuției programului: ramuri condiționate, tranziții și alte evenimente pe care Cayman a avut dificultăți de a le digera. Modulul scalar efectuează o operație pe ciclu.

memorie cache

Noul design al modulului de execuție necesită o memorie cache mai rapidă și mai mare în comparație cu designul VLIW. Fiecare CU are un cache L1 separat de 16 KB plus stocare de 16 KB și 32 KB pentru instrucțiuni și date partajate de cele patru CU, un buffer pentru a partaja date între matrice. Există, de asemenea, un cache L2 complet coerent, împărțit în porțiuni de 64 KB între controlere de memorie cu două canale. Stochează copii ale bufferelor de mai sus

Autobuzele cache L1 și L2 au o lățime de 64 de octeți. AMD raportează că debitul L1 ajunge la aproape 2 TB/s, iar L2 - 700 GB/s și, aparent, aceasta înseamnă valoarea totală pentru un procesor cu 32 CU.

Pentru comparație: în Cayman, fiecare modul SIMD are un cache L1 de 8 KB cu o magistrală de 16 octeți.

Prelucrare geometrie, rasterizare

Prezentările AMD care însoțesc lansarea spun puțin despre componentele grafice reale ale cipului. Judecând după diagrama bloc, structura lor internă nu s-a schimbat, doar Tesselator a fost actualizat la a noua versiune și oferă o creștere uriașă a performanței în sarcinile corespunzătoare.

Între timp, dacă credeți că informațiile din surse terțe și diapozitive de la AMD însuși de la June Fusion Development Summit, atunci Geometry Engine și Tesselator arată complet diferit din interior. La fel ca Cayman, nucleul GCN conține două motoare grafice, dar dacă mai devreme constau din blocuri separate pentru rasterizare, teselare și așa mai departe, acum fiecare GE poate avea un număr arbitrar de conducte pentru procesarea pixelilor și a primitivelor geometrice.

Probabil, un astfel de design va ajuta producătorul să crească cu ușurință puterea grafică sau să elibereze GPU-uri bugetare care sunt tăiate în acest domeniu. Lucru rapid cu geometrie va fi de folos în jocurile moderne.

PCI-E3.0

Titlul vorbește de la sine: AMD a implementat o nouă generație de magistrală PCI-E cu o lățime de bandă de două ori mai mare. Nu este clar dacă este nevoie astăzi pentru randarea 3D, dar pentru calcule non-grafice va fi cu siguranță util. AMD a făcut o mulțime de inovații în arhitectura GCN cu un ochi lung pe astfel de aplicații și o caracteristică grafică specială care se potrivește perfect cu noua interfață.

Functii noiGCN

GCN are două unități suplimentare de distribuție a comenzilor numite Asynchronous Compute Engine, care funcționează complet independent una de cealaltă și de GPU. AMD intenționează să deschidă accesul la ACE prin Open CL, iar apoi programatorii vor avea trei dispozitive individuale, fiecare cu propria coadă de comenzi. În plus, conform informațiilor de la mâna a treia, ACE oferă execuție în afara ordinului la nivelul sarcinilor individuale. CU-urile în sine, deși mai inteligente decât modulele SIMD ale arhitecturii VLIW, își pot procesa fronturile de undă strict în ordine directă.

Nucleul GCN și CPU-ul computerului pot împărtăși un spațiu de adrese comun. În acest caz, toate instrucțiunile care sunt executate de GPU indică adrese din spațiul x86-64 și le va recodifica în mod independent în adresele de memorie video locale folosind un modul special. Ca rezultat, GPU-ul primește acces direct la memoria sistemului. În plus, nucleul GCN a fost dotat cu o serie de funcții pentru a suporta limbaje de nivel înalt: funcții virtuale, pointeri, recursivitate și așa mai departe. Acest lucru va permite programatorilor să scrie cod generic potrivit pentru execuție pe CPU sau GPU.

Noile GPU-uri sunt pe deplin compatibile cu OpenCL 1.2 API, DirectCompute 11.1 (și DirectX 11.1 per se) și C++ AMP. A apărut Instrucțiuni Speciale util pentru producerea de conținut multimedia. În plus, cipurile bazate pe arhitectura GCN sunt primele GPU-uri cu un codificator video H.264 integrat, care poate fi folosit de îndată ce AMD lansează biblioteca de software necesară.

La rândul său, decodorul a dobândit suport pentru mai multe formate suplimentare: MVC, MPEG-4/DivX și Dual Stream HD + HD. În general, plăcile video Radeon erau puternice în ceea ce privește redarea video pe vremea ATI. Seria a șapte mii are o mulțime de „îmbunătățitori”, de exemplu, algoritmul Steady Video care elimină tremuratul camerei.

Partially Resident Textures este un alt truc cu memorie virtuala, care este deja destinat redării 3D: o aplicație sau un shader funcționează cu un spațiu de adrese care depășește cantitatea de memorie de la bord a adaptorului și el însuși acționează doar ca un cache rapid. Astfel, puteți folosi texturi de până la 32 TB, porțiuni din care GPU-ul va pompa dinamic mai aproape de sine. Suportul pentru sistemul de operare nu este necesar pentru aceasta.

Frânele care vor apărea inevitabil la încărcarea texturilor din memoria sistemului, AMD compensează parțial folosind maparea MIP. Textura gigantică va fi probabil stocată în mai multe versiuni cu rezoluții diferite (mipmaps). Fiecare dintre ele este împărțit în fragmente de 64 KB. Când adaptorul are nevoie de un anumit fragment și este deja în memoria video locală, atunci nu există nicio problemă. Dacă nu există niciun fragment, atunci programul îl poate scoate imediat din memoria sistemului sau poate amâna citirea și poate lua copia corespunzătoare cu rezoluție scăzută a fragmentului pentru cadrul curent (dacă este deja în memoria video).

O mică completare la problema teselării. GCN implementează algoritmul Ptex (per-face texture mapping). În general, în modelarea 3D, textura se aplică întregului model, iar vârfurile trebuie aliniate cu grijă cu zonele dorite ale pânzei 2D. Nu este greu de imaginat cum teselarea hardware, care produce vârfuri suplimentare, complică sarcina designerului. Când utilizați Ptex, se aplică o textură separată fiecărui poligon, ca urmare, nu există îmbinări vizibile. În plus, Ptex vă permite să împachetați texturi cu rezoluții diferite într-un singur fișier.

În cele din urmă, AMD a lucrat la filtrarea anizotropă pentru a elimina pâlpâirea subtilă pe texturile de înaltă rezoluție. Modificarea algoritmului nu ar trebui să afecteze performanța.

Managementul energiei

AMD notează că producătorii de GPU și plăci video joacă întotdeauna în siguranță în ceea ce privește consumul de energie și setează vitezele de ceas pentru a ține cont de sarcina de vârf, ceea ce este posibil doar în aplicațiile cele mai lacome sau chiar în testele de stres (FurMark. OCCT). Și în jocurile normale, GPU-ul ar putea rula la o frecvență mai mare. Pentru a strânge întotdeauna maximul din GPU, este concepută tehnologia PowerTune - un calculator care calculează consumul de energie al cardului în timp real la intervale de milisecunde pe baza unei analize a sarcinii efectuate (fără senzori analogici). Și dacă este posibil, viteza de ceas a GPU-ului este crescută. Rețineți că aceasta nu este o resetare a frecvenței în raport cu valoarea nominală atunci când este atins pragul de putere, ci invers - accelerație dinamică reglată cu precizie.

Iar miezul GCN se poate opri complet atunci când nu există nimic pe ecran pentru o perioadă lungă de timp și poate opri răcitorul (tehnologia ZeroCore). În configurația CrossFire, procesoarele de pe cardurile suplimentare (și de pe aceeași) nu funcționează deloc fără încărcare 3D.

Eyefinity 2.0

Odată cu Radeon HD 7000 debutează cea de-a doua versiune a tehnologiei Eyefinity, care a adus o mulțime de inovații. Multe dintre „funcțiile” prezentate nu au nevoie de comentarii, așa că le enumerăm pe scurt:

  • Configurațiile cu cinci afișaje la rând în orientare peisaj sau portret sunt acceptate oficial.
  • Monitorul central într-un rând poate fi acum mai mare pe verticală decât celelalte.
  • Funcționare simultană a Eyefinity, AMD HD3D și CrossFire.
  • Rezoluția maximă a ecranului combinat este de 15x15 mii pixeli.
  • Permisiuni arbitrare.
  • Mutarea panoului Sarcini Windows pe orice ecran.
  • Emite fluxuri audio individuale pe mai multe afișaje.

Noile Radeon acceptă DisplayPort 1.2, ceea ce înseamnă tehnologie Multi-Stream. Cu ajutorul acestuia, puteți conecta trei afișaje la o ieșire într-un lanț sau printr-un hub special. Mai mult, ieșirea hub-ului poate fi nu numai DisplayPort, ci și interfețe HDMI, DVI și VGA. AMD promite că hub-urile vor fi disponibile în vara lui 2012.

Ieșirea HDMI respectă standardul 1.4a, astfel încât poate trimite un semnal dublu către un televizor 3D la 24 de cadre pe canal. Și mai ales pentru jocuri, există suport pentru HDMI de 3 GHz cu o frecvență de 60 Hz pe canal.

În plus, standardele DisplayPort 1.2 HBR 2 și 3 GHz HDMI vor fi utile pentru conectarea viitoarelor afișaje cu o rezoluție de 4096x2160.

Radeon HD 7970

Specificații

HD 7970 este flagship-ul cu un singur cip al liniei, reprezentând arhitectura GCN în toată puterea ei. GPU-ul său se numește Tahiti și conține 32 de CU (Compute Units), care sunt descrise în detaliu mai sus. Dacă calculăm acest lucru după numărul de ALU-uri separate, așa cum a făcut AMD până acum, atunci obținem 2048 de bucăți - o dată și jumătate mai multe decât în ​​nucleul Cayman! Și TMU-urile (unitățile de cartografiere a texturii) din Tahiti sunt, de asemenea, 128 față de 96. Busul de memorie este pe 384 de biți în loc de 256 de biți. Având în vedere câtă logică suplimentară a fost adăugată arhitecturii, nu este deloc surprinzător faptul că Tahiti este format din 4,31 miliarde de tranzistori. Doar pentru comparație, Cayman are 2,64 miliarde, iar GF110 de la NVIDIA are trei. Întreaga economie funcționează la o frecvență de 925 MHz. Aspect, constructie

În designul seriei 7000, AMD a făcut un pas înapoi de la formele brutale ale Radeon HD 6000 și a ales un design atrăgător, cu linii netede și o suprafață lucioasă a carcasei. Textolitul roșu de recunoscut a revenit, de data aceasta cu o nuanță de zmeură. Din punct de vedere al dimensiunilor, Radeon HD 7970 nu diferă de flagship-urile anterioare AMD/ATI cu un singur cip.

Produse AMD Brick Factory

Cardul este greu. Îl iei în mână și simți puterea. Este vorba despre sistemul de răcire cu o cameră mare de evaporare atașată la un cadru gros. De pe vremea lui Radeon HD 6970, designul nu s-a schimbat prea mult, cu excepția faptului că ventilatorul turbinei a devenit mai larg.

Pentru o răcire mai bună un port DVI a fost scos din stub pentru a ocupa complet slotul cu o grilă de evacuare.

Pe partea din spate, ca și înainte, există o cruce de prindere. S-a decis să se refuze o acoperire solidă.

Pe placă de circuit imprimat, ca și HD 6970, există o comutare între principal și backup BIOS. Iar pe suprafața din spate sunt împrăștiate mai multe întrerupătoare mici duale cu scop necunoscut, pe care noi, ferite de rău, am decis să nu le atingem. Este posibil să avem în față doar o mostră de inginerie de HD 7970, iar aceste elemente ciudate să nu mai fie pe plăci seriale.

La coada plăcii sunt șapte inductori și un controler de tensiune în opt faze CHiL CHL8228G, care, fără îndoială, overclockerii vor fi fericiți, pentru că aproximativ n a fost deja folosit pe Radeon HD 6970, . Cel mai probabil, schema de alimentare a cardului este organizată în modul vechi: șase faze cad pe GPU și una este dată pentru alimentarea circuitelor interne ale microcircuitelor GDDR5. În colțul opus al plăcii se află un cip bifazat uP1509P de la uP Semiconductor cu propria bobină, care, prin analogie cu HD 6970, ar trebui să controleze tensiunea de pe tampoanele I/O ale memoriei video.