Casa / Consolas de juegos / tarjetas de video Configuración de prueba, herramientas y metodología de prueba

tarjetas de video Configuración de prueba, herramientas y metodología de prueba

AMD ha decidido iniciar una nueva batalla por el dominio en el mercado de las GPU. Pero hoy, ambos fabricantes, AMD y Nvidia, tienen que afrontar nuevos retos y trabajar en nuevas condiciones. En particular, AMD tiene que cambiar a nueva tecnología Producción de 28 nm y una arquitectura de GPU completamente nueva, como se vio después. NVIDIA también planea pasar a 28 nm, pero solo en unos meses y con una nueva arquitectura. Pero AMD fue el primero, y en nuestro artículo hablaremos sobre la nueva generación de GPU en forma de AMD Radeon HD 7970.

AMD cree que los juegos de PC están en auge, y en el corto plazo, especialmente dado que las consolas se actualizan durante bastante tiempo. Y dado que los motores gráficos modernos se benefician de las capacidades de las tarjetas gráficas avanzadas, este desarrollo solo se intensificará. El mercado de juegos de PC tuvo un valor de $ 15 mil millones el año pasado y se espera que crezca a $ 20 mil millones para 2013. Y no olvide que los jugadores de hoy en día prefieren jugar a resoluciones cada vez más altas. La resolución de 1080p ya se ha convertido en el estándar de facto, lo que se ve reforzado por las pantallas cada vez más baratas con gran diagonal. Además, AMD se está enfocando en una mayor eficiencia de GPU y capacidades informáticas de GPU. La última área es muy importante para AMD hoy en día, ya que la empresa quiere solucionar las limitaciones que se encuentran en las GPU de arquitectura Cayman.


Por el momento, AMD solo ha presentado la Radeon HD 7970, como puede ver en la diapositiva, pero pronto aparecerán nuevas tarjetas gráficas en la línea Radeon HD 7900.

NVIDIA GeForce GTX 570

NVIDIA GeForce GTX 580

AMD Radeon HD 6950 AMD Radeon HD 6970 AMD Radeon HD 7970
GPU GF110 GF110 Caimán PRO Caimán XT Tahití XT
Proceso tecnológico 40nm 40nm 40nm 40nm 28nm
Número de transistores 3 mil millones 3 mil millones 2.6 mil millones 2.6 mil millones 4.3 mil millones
Área de cristal 530 mm² 530 mm² 389 mm² 389 mm² 365 mm²
Velocidad de reloj de la GPU 732 MHz 772 MHz 800 MHz 880 MHz 925 MHz
Reloj de la memoria 950 MHz 1000 MHz 1250 MHz 1375 MHz 1375 MHz
Tipo de memoria GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Memoria 1280 MB 1536 megabytes 2048 megabytes 2048 megabytes 3072 megabytes
Ancho del bus de memoria 320 bits 384 bits 256 bits 256 bits 384 bits
ancho de banda de memoria 152 GB/s 192 GB/s 160 GB/s 176 GB/s 264 GB/s
Modelo sombreado 5.0 5.0 5.0 5.0 5.0
DirectX 11 11 11 11 11.1
Número de procesadores de flujo 480(1D) 512(1D) 1408 (352 4D) 1536 (384 4D) 2048(1D)
Velocidad de reloj de los procesadores de flujo 1464 MHz 1544 MHz 800 MHz 880 MHz 925 MHz
Número de bloques de textura 60 64 88 96 128
Número de ROP 40 48 32 32 32
Consumo máximo de energía 219 vatios 244W 200W 250W 250W
Consumo mínimo de energía - 30-32W 20W 20W 2.6W
Fuego cruzado/SLI SLI SLI CrossFireX CrossFireX CrossFireX

La tarjeta gráfica Radeon HD 7970 se basa en la GPU "Tahiti XT", que se fabrica utilizando una tecnología de proceso de 28 nm. Total GPU tiene 4.300 millones de transistores. Para comparacion, Procesadores Intel Sandy Bridge-E (excluyendo los modelos de cuatro núcleos) tiene 2270 millones de transistores. Y el predecesor de la familia Cayman Radeon HD 6900 trabajaba con 2600 millones de transistores. El área del cristal es de 365 mm². Como puede ver, el área es ligeramente inferior a 389 mm² para las GPU "Cayman", que se fabrican utilizando la tecnología de proceso de 40 nm. La GPU GF110 de NVIDIA contiene 3 mil millones de transistores en un área de 530 mm². La mayor parte del presupuesto del transistor GPU se gastó en procesadores de flujo 2048. Los procesadores GPU y stream funcionan a una velocidad de reloj de 925 MHz. AMD decidió mantener la misma memoria que la Radeon HD 6970, es decir, GDDR5 a 1375 MHz. Pero la interfaz de la memoria se ha ampliado de 256 bits a 384 bits, aumentando el ancho de banda de la memoria a 264 GB/s. Además, la capacidad ha aumentado de 2048 MB a 3072 MB. La Radeon HD 7970 tiene 128 unidades de textura y 32 canalizaciones de operaciones de trama (ROP): obtenemos un aumento en las unidades de textura en comparación con la Radeon HD 6970, pero la cantidad de ROP sigue siendo la misma. AMD ha enumerado el consumo máximo de energía para Radeon HD 7970 en 250 W, que también es el límite para PowerTune. El consumo de energía típico de la tarjeta gráfica es de 210W. Recordemos que la Radeon HD 6970 tenía un consumo de energía máximo de 250 vatios y uno típico bajo carga: 190 vatios. Gracias a la tecnología ZeroCore Power (más sobre esto a continuación), el consumo de energía en modo inactivo no supera los tres vatios.

GPU-Z 0.5.7, como puede ver en la captura de pantalla, no muestra correctamente todos los datos de AMD Radeon HD 7970. En nuestro sistema de prueba, la interfaz Socket 1366 figuraba como PCI-Express 3.0 x16 y la velocidad del reloj es de 500 MHz. También se dan valores incorrectos para el ancho de banda de píxeles y texturas. Los valores correctos son 925 MHz para la GPU, 29,6 Gpixel/s y 118,4 Gtexel/s.

Rumores sobre el lanzamiento de la tarjeta de video actualizada Radeon HD 7970, y en Computex 2012 solo los perezosos no hablaron de eso. Por supuesto, nos referimos a la edición Radeon HD 7970 GHz. Mientras tanto, AMD ha estado produciendo procesadores "Southern Island" en 28nm en TSMC durante varios meses, tiempo suficiente para optimizar el proceso de fabricación y aumentar el rendimiento de los chips. Especialmente desde alto rendimiento La GeForce GTX 680 de NVIDIA obligó a AMD a buscar una nueva versión más rápida de la Radeon HD 7970 para competir. En nuestra revisión, consideraremos cómo la Radeon HD 7970 GHz Edition será un oponente digno en comparación con la GeForce GTX 680, qué mejoras obtendremos en comparación con el modelo HD 7970 estándar.

Los fabricantes que ya se han hecho un nombre al lanzar tarjetas gráficas con overclocking de fábrica planean hacer lo mismo con la nueva Radeon HD 7970 GHz Edition. AMD claramente ha puesto sus miras en poder empujar las frecuencias de GPU por encima de la barra de 1 GHz mientras mantiene los mismos niveles de voltaje que el modelo original. Esto se aplica tanto al overclocking manual de los entusiastas como al overclocking de fábrica de los fabricantes de tarjetas de video. El "viejo" modelo Radeon HD 7970 estará a la venta por ahora, pero AMD está posicionando la Edición GHz un paso más alto en rendimiento y, en consecuencia, en precio.

Las especificaciones técnicas se muestran en la siguiente tabla:


NVIDIA GeForce GTX 680 AMD Radeon HD 7970 Edición AMD Radeon HD 7970 GHz
Precio al por menor unos 460 euros en Europa
alrededor de 18.5 mil rublos en Rusia
unos 380 euros en europa
alrededor de 17 mil rublos en Rusia
$499
Página web de productos NVIDIA AMD AMD
Especificaciones técnicas
GPU GK104 (GK104-400-A2) Tahití XT Tahití XT2
Proceso tecnológico 28nm 28nm 28nm
Número de transistores 3.54 mil millones 4.3 mil millones 4.3 mil millones
Velocidad de reloj de la GPU 1006 MHz (impulso: 1058 MHz) 925 MHz 1000 MHz (impulso: 1050 MHz)
Reloj de la memoria 1502 MHz 1375 MHz 1500 MHz
Tipo de memoria GDDR5 GDDR5 GDDR5
Memoria 2048 megabytes 3072 megabytes 3072 megabytes
Ancho del bus de memoria 256 bits 384 bits 384 bits
ancho de banda de memoria 192,3 GB/s 264 GB/s 288 GB/s
Versión de DirectX 11.1 11.1 11.1
Procesadores de flujo 1536(1D) 2048(1D) 2048(1D)
bloques de textura 128 128 128
ROP 32 32 32
Tasa de relleno de píxeles 32,2 Gpíxel/s 29,6 Gpíxel/s 33,6 Gpíxel/s
Consumo mínimo de energía 15W 2.6W 2.6W
Consumo máximo de energía 195W 250W 250W
SLI/fuego cruzado SLI Fuego cruzado Fuego cruzado

Arquitectónicamente, la nueva versión de la Edición GHz no difiere de la Radeon HD 7970. AMD se basó solo en la optimización de procesos, la capacidad de operar la GPU a un voltaje más bajo, lo que hizo posible aumentar la frecuencia nominal del reloj de la GPU de 925 MHz. a 1000 MHz. Curiosamente, 1000 MHz corresponde a la frecuencia base, ya que AMD ha implementado un modo Boost. Aumentará la frecuencia del reloj a 1050 MHz para la tarjeta de video Radeon HD 7970 GHz Edition. Es decir, en comparación con la frecuencia inicial de 925 MHz, obtenemos un overclock del 13,5 por ciento.

También es bueno que la GPU "Tahiti XT2" en modo inactivo funcione con solo 0,807 V. La Radeon HD 7970, recuerde, el voltaje era de 0,85 V. Bajo carga, la velocidad del reloj aumenta al nivel prometido de 1050 MHz por AMD, mientras que el voltaje de la GPU 1.201 - 1.221 V. La GPU Radeon HD 7970 "antigua" funcionaba a 1.139 V.

El mecanismo Powertune es bien conocido por las generaciones anteriores de GPU. Pero en el caso de la Radeon HD 7970 GHz Edition, la tecnología Powertune de AMD aumenta la velocidad del reloj Boost. Además del "estado P alto" anteriormente conocido, AMD está agregando otro estado P "Boost P-State". Le permite obtener velocidades de reloj aún más altas, lo que es posible gracias a los cambios dinámicos de voltaje.

Pero, a diferencia de NVIDIA, AMD no indica el modo Boost mínimo: está fijado en 1050 MHz. Además, se utiliza para trabajar la tecnología conocida de los procesadores Trinity. A saber, "Estimación de temperatura digital", que evalúa la carga por adelantado y establece las frecuencias de reloj en consecuencia. A nivel arquitectónico, los chips Tahiti en las dos tarjetas de video Radeon HD 7970 no difieren entre sí. Por lo tanto, Powertune se implementa a través de VBIOS y un controlador; en teoría, la tecnología también puede funcionar en tarjetas de video más antiguas.

La memoria también fue overclockeada. Como puede ver en las especificaciones anteriores, la VRAM tiene una frecuencia de 1500 MHz, lo que aumenta el rendimiento de 264 GB a 288 GB por segundo. Debido a la interfaz de memoria más amplia, AMD pudo separarse aún más de NVIDIA en este sentido.

El rendimiento teórico de la novedad es de 4,3 teraflops con precisión simple y 1,08 teraflops con precisión doble. NVIDIA anunció recientemente el acelerador de cómputo Tesla K10 basado en dos GPU GK104, que ofrece 4,58 teraflops de rendimiento de precisión única. Pero el rendimiento de precisión doble GK104 es 1/24 del de precisión simple. Esta situación solo cambiará con el chip GK110 y Tesla K20, cuando podemos esperar un aumento triple en el rendimiento de doble precisión. Por lo tanto, si el Tesla M2090 basado en Fermi proporciona 665 gigaflops, entonces se puede esperar que el GK110 realice 1,5 teraflops o más.

Para obtener más detalles sobre la arquitectura "Graphics Core Next" y la generación "Southern Island", le recomendamos que consulte nuestro .

Entonces ha llegado el momento de reemplazar la Palit GeForce GTX 460, que ha funcionado con honor durante tres años. Como reemplazo, elegí el buque insignia de Radeon: HD 7970 de Asus. Resultó muy difícil encontrar una tarjeta en este chip, hubo una gran escasez en las tiendas, especialmente en nuestro Lejano Oriente. logrado comprar ASUS Radeon HD 7970 DirectCU II solo por 18,000 rublos, que hoy, desafortunadamente, es bastante.

La principal esperanza: que la tarjeta de video justifique su precio, después de haberme complacido con su rendimiento.

Especificación de la tarjeta de video:

Embalaje y equipo

Una caja grande con un caballero de marca atrae inmediatamente la atención de un comprador potencial. El fabricante cuenta con el sistema de enfriamiento DirectCU II patentado, una función VGA HotWire única que le permite conectarlo a la placa base de la serie ROG. Así mismo vemos información importante, que debe tener en cuenta al comprar: una fuente de alimentación de 600 vatios. con una corriente de 42A a lo largo de la línea + 12v.

En la caja, la tarjeta de video está empaquetada de forma segura y el transporte descuidado no es terrible para un contenido tan valioso.

El kit incluye un disco con drivers y utilidades, entre las que se encuentra GPU Tweak, que luego utilicé.

Instrucciones detalladas con imágenes a color. Un puente CrossFireX flexible, un adaptador de DVI a HDMI, no existe tal salida en la placa. Un adaptador para un conector de alimentación PCI-E de 8 pines, no todas las PSU tienen dos conectores de este tipo. Y también hay un disipador de calor que se puede pegar con cinta adhesiva de doble cara a la unidad de estabilización de energía si instala refrigeración líquida.

No había bonificaciones en forma de juegos o claves de juegos.

Apariencia

La tarjeta se ve grande y sólida, ocupa tres ranuras de expansión. Pero encaja en mi nuevo edificio sin ningún problema, y ​​allí es bastante espacioso.

Puede conectar hasta 6 monitores a la tarjeta de video, para esto hay 4 puertos de pantalla y dos DVI. Pero un puerto de pantalla funciona si un puerto DVI se cambia al modo Single-Link mediante un interruptor especial.

El sistema de enfriamiento patentado hace que las tarjetas de video de este fabricante sean "gemelas": franjas rojas en el centro, dos ventiladores y una placa posterior que evita que la textolita se doble y asume el peso de un sistema de enfriamiento masivo.



Ahora está claro por qué hay un caballero en la caja: la tarjeta de video está revestida con una armadura gruesa y poderosa.

La alimentación se suministra a la placa a través de dos conectores de ocho pines, que deberían proporcionar una reserva de energía.
La tarjeta está equipada con 3 GB de memoria de video GDDR5, funcionando inicialmente a 5500 MHz. Hay un bus de 384 bits de ancho entre la memoria y el chip Tahiti XT. El chip se fabrica de acuerdo con la tecnología de proceso de 28 nm e incluye 2048 tuberías unificadas, así como 32 unidades de rasterización.

El sistema de refrigeración consta de un bloque superior con dos ventiladores de 90 mm.



Los ventiladores funcionan con dos disipadores de calor de aluminio que extraen el calor de los seis tubos de calor. La eficacia de dicho sistema se ha demostrado durante mucho tiempo, y lo comprobaré en funcionamiento con MSI Afterburner.

Pruebas

Banco de pruebas:

Probé la tarjeta en este caso. Aquí, cuando los ventiladores están encendidos al 100%, el ruido es claramente audible en forma de un potente zumbido. Al hacer overclocking del núcleo a 1100 y la memoria a 1500, la tarjeta entregó 615 MHash al minar LTC. Con la complejidad y el curso actual, esto es de $ 100 por mes, lo que claramente no es rentable.

recomendaciones

Las impresiones de la tarjeta son muy positivas, creo que encontré un reemplazo digno para mi vieja tarjeta de video. Los ventiladores, incluso bajo carga, no aceleran al 100%, por lo que en un buen caso son casi inaudibles. La temperatura no supera los 70 grados y el calentamiento de la tarjeta no afecta a otros componentes. En juegos con configuraciones altas, la tarjeta produce una cantidad muy jugable de fotogramas por segundo. Cuando esto no es suficiente, la tarjeta de video se puede overclockear, lo que aumentará su rendimiento en un veinte por ciento.
Bueno, las desventajas enumeradas a continuación son relativas. Para una carcasa espaciosa, el tamaño de la tarjeta de video no importa, pero puede organizar de manera más eficiente un sistema de enfriamiento para tres ranuras. El precio también es relativo; cuando hoy fui al supermercado con mi esposa, me di cuenta que todo estaba bien, sin sobrepago :-((|=:

ventajas:
Tranquilo
productivo
Buen potencial de overclocking, capaz de aumentar el rendimiento hasta un 20%
Refrigeración eficiente

desventajas
Tamaño grande, no cabe en ningún caso.
Precio alto

A fines del año pasado, AMD reveló el código fuente de su nueva arquitectura de GPU, llamada Islas del Sur. Una de las primeras encarnaciones de esta innovación fue la tarjeta gráfica SAPPHIRE HD 7970 3GB GDDR5.

Esta arquitectura fue producto de cierto declive en el desarrollo de la tecnología de 28 nm y los representantes de AMD la llamaron nada menos que revolucionaria y diseñada para una aceleración de 1,4x en relación con la generación anterior. Además, en SAPPHIRE HD 7970 tenemos soporte para PCIe 3, 3GB de memoria GDDR5 de alta velocidad, compatibilidad con DX 11.1, soporte para tecnología Power Tune, Zero Core y Eyefinity 2.0, que ha ganado nuevas características y funciones. El nuevo núcleo de AMD, llamado Graphics Core Next Tahiti, es un paso del diseño VLIW a un motor SIMD que no es VLIW, lo que significa un mayor rendimiento informático.



Este nuevo núcleo cuenta con un recuento de transistores significativamente mayor (4,31 miliadres), 2048 procesadores de flujo con 32 unidades de trama, 128 unidades de textura y un bus de memoria de alto ancho de banda de 384 bits que ofrece un aumento de potencia de cómputo y ancho de banda de memoria. Todas estas características se ven más que impresionantes en papel y deberían llevar la experiencia de juego al siguiente nivel.

Características de SAPPHIRE HD 7970

Salidas 1 DVI de doble enlace
1 x HDMI 1.4a
2 x Mini-DisplayPort
Puerto de pantalla 1.2
GPU Reloj central 925 MHz
Tecnología de producción de chips de 28 nm
Número de procesadores de flujo - 2048
Memoria Volumen - 3072 MB
Tipo: GDDR5 de 384 bits
Eficiencia - 5500 MHz
Dimensiones 275 (largo) x 115 (ancho) x 36 (alto) mm
SOBRE CD con controladores
Utilidad SAPPHIRE TriXX
Accesorios Cable de interconexión de puente CrossFire™
Cable de alimentación de 8 pines a 4 pines
Mini puerto de pantalla a adaptador HDMI
Adaptador Mini DP a SL-DVI Pasivo
Cable de alimentación 6 PIN a 4 PIN
Adaptador HDMI a SL-DVI
Cable HDMI 1.4a de alta velocidad (1,8 metros)
Adaptador Mini DP a SL-DVI Activo

SAPPHIRE HD 7970: Pruebas

La prueba SAPPHIRE HD 7970 se comparó con otros dispositivos de la misma clase y consistió en un complejo pruebas de juego y un benchmark sintético. Las tarjetas seleccionadas para la comparación son nominalmente iguales o nominalmente superiores en rendimiento a la HD 7970, por lo que los resultados de la prueba deberían reflejar completamente el rendimiento real.

La configuración y los ajustes del sistema no cambiarán durante todas las pruebas. Las tarjetas de video se probarán primero a la velocidad estándar y luego en la configuración de overclocking (a continuación se proporciona una descripción del proceso de overclocking HD 7970 y los resultados) para evaluar la efectividad de la aceleración del dispositivo. El controlador Catalyst 11.12 se usó para tarjetas AMD y 290.53 para tarjetas basadas en NVIDIA.

Sistema bajo configuración de prueba:

  • UPC: Núcleo i7 2600K a 4,4 GHz 100x44
  • refrigeración de la CPU: Corsair Hydro Serie H100
  • tarjeta madre: Gigabyte Z68AP-D3
  • Memoria: Mushkin 991996 Línea roja PC3-17000 9-11-10-28 8 GB
  • tarjeta de video: Radeon de zafiro HD 7970
  • Fuente de alimentación: Corsario AX1200
  • disco duro: 1 x Seagate 1TB SATA
  • unidad óptica: Lite-On Blu-Ray
  • Sistema operativo: Windows 7 Profesional de 64 bits

Tarjetas de video comparables:

  • XFX HD 6970
  • asus hd 6950
  • ASUS GTX 580 Direct CU II
  • ASUS GTX 570 Direct CU II
  • Zafiro HD 6990
  • ASUS GTX 590

Prueba de juego: Metro 2033

Parte FPS, parte horror, Metro 2033 funciona con el motor 4A con soporte para DirectX 11, NVIDIA PhysX y NVIDIA 3D Vision.

Ajustes:

  • DirectX 11
  • 16xAF
  • Configuración global = alta
  • Physx = en




En Metro 2033, el SAPPHIRE HD 7970 mostró resultados muy sólidos en ambas resoluciones, tanto estándar como con overclocking.

Prueba de juego: Battlefield 3

Battlefield 3 es un juego de disparos en primera persona desarrollado por EA Digital Illusions CE e impulsado por el motor Frostbyte 2. Este juego fue lanzado el 25 de octubre de 2011. Es compatible con DirectX 10 y 11.

Ajustes:

  • 4x AA a PC
  • 16X AF en CP
  • Ajustes del juego = Alto


En comparación con la generación anterior HD 6970 basada en Cayman, la HD 7970 basada en Tahití mostró un aumento significativo del rendimiento en este juego.

Prueba de juego de Dirt 3

Dirt 3 es el tercer juego de la legendaria serie de carreras desarrollada por Codemasters. Está construido sobre el motor EGO 2.0. El lanzamiento tuvo lugar en mayo de 2011.

Ajustes:

  • 4xAA
  • 16AF en PC
  • Ajustes = Ultra


En este juego, lanzado con un marcador "AMD" en la caja, por cierto, la HD 7970 estaba al nivel de la GTX 580. El overclocking ayudó más a la GTX 580 que a la HD 7970.

Prueba con un punto de referencia sintético 3DMark 11

3DMark 11 es el Futuremark más reciente de la serie 3DMark, adaptado para probar los sistemas Microsoft DirectX 11. Este programa consta de seis pruebas, cuatro de las cuales son para pruebas de gráficos, una para simulación física y una combinada. Para realizar pruebas en un modelo físico, se utiliza la biblioteca Bullet Physics. Se suministran dos demostraciones con el benchmark, ambas se basan en pruebas, pero a diferencia de las pruebas, contienen audio básico.

Ajustes:

  • Configuración de prueba predeterminada
  • Prueba inicial 1024 x 600
  • Prueba de rendimiento 1280 x 720
  • Prueba extrema 1920 x 1080

En el punto de referencia 3DMark11, la SAPPHIRE HD 7970 obtuvo una puntuación más alta que la GTX 580 tanto en configuraciones estándar como con overclocking.

En el transcurso de las pruebas de temperatura, se encontró que SAPPHIRE HD 7970 tanto en frecuencias de stock como en estado de overclocking mostró valores 8 grados más bajos que la última generación de tarjetas HD 6970, lo que es un excelente resultado para un dispositivo tan poderoso.

En frecuencias regulares y más altas, la tecnología Zero Core reduce perfectamente el consumo de energía en modo de espera. Bajo carga sin aumentar el voltaje del procesador, el consumo total de energía de la tarjeta no aumenta notablemente.

overclocking

De los lanzamientos oficiales de tarjetas de AMD, cuya velocidad nominal del núcleo supera los 1000 MHz, podemos concluir que con el nuevo Southern Islands Tahiti tenemos una gran perspectiva de overclocking. De hecho, 1000 MHz es solo un punto de partida y parece que la tarjeta podrá ir más allá de los límites establecidos en Catalyst Control. El logro de 1125 MHz en el núcleo se logra simplemente reorganizando el voltaje que se le aplica utilizando la configuración disponible en CC. Al exponer el voltaje suministrado a la memoria a los límites de CC, este nodo se llevó a una velocidad de 1575 MHz. Estas frecuencias indican que quedan al menos otros 200 MHz tanto en los núcleos de GPU como en la memoria GDDR5. Estos son muy buenos indicadores. Sin voltaje adicional aplicado, la temperatura en la GPU no aumentó significativamente. Al configurar manualmente la velocidad del ventilador al 100%, la temperatura de la tarjeta overclockeada no superó los 57 grados. Luego, cualquiera tendrá que buscar utilidades (para BIOS o software) para exceder los límites de CC y ver de qué es realmente capaz la tarjeta de video. Vale la pena señalar que acelerar el ventilador en las tarjetas AMD siempre ayuda a mantener bajas las temperaturas, pero solo a costa de un aumento significativo en los niveles de ruido. En el caso de SAPPHIRE RADEON HD 7970, AMD mejoró tanto la refrigeración como el ruido con un nuevo diseño de refrigeración.

Resumamos nuestro overclocking: 200 MHz es un aumento del 21% en el núcleo y alrededor del 15% de la frecuencia del reloj de la memoria en la primera etapa de overclocking, podemos hablar sobre el futuro brillante de la tarjeta de video.

Reseñas: pros y contras

Cuando tratamos de entender si la nueva versión nos brinda todo lo que queríamos y esperábamos de ella, entendemos que la nueva tarjeta de video no solo supera a las generaciones anteriores de dispositivos, sino que también deja atrás a la mayoría de los competidores modernos directos. Revisión de SAPPHIRE HD 7970: la tarjeta de video es extremadamente convincente. Supera fácilmente a la HD 6970 basada en Northern Islands Cayman y a la Nvidia GTX 580 en casi todas las pruebas. Al mismo tiempo, incluso a velocidades de reloj estándar, incluso el rendimiento de los juegos es impresionante, y el espacio proporcionado por el dispositivo para el overclocking abre perspectivas realmente interesantes. Pudimos llevar fácilmente el núcleo de la GPU y las velocidades de la memoria a los límites del Centro de control de AMD Catalyst y establecerlos en un núcleo de 1125 MHz y una memoria de 1575 MHz; logramos ganancias de 200 MHz sin esfuerzo en ambos nodos. Esta potencia adicional le permite utilizar una sola tarjeta para reproducir la tecnología Eyefinity a resoluciones de hasta 5760 x 1080. La nueva arquitectura de la tarjeta SAPPHIRE HD 7970 admite nueva versión Tecnología Eyefinity 2.0, que ofrece una serie de mejoras, incluidos canales de medios individuales para cada salida, una nueva configuración de monitor 5x1 y más.

Cabe destacar el rendimiento mejorado del sistema de refrigeración AMD. Tanto a temperatura de fábrica como con overclocking, la HD 7970 era aproximadamente 4 grados centígrados más baja que la HD 6970 a frecuencias de fábrica en modo inactivo y 8 grados en otros modos.

Aunque el consumo de energía de la HD 7970 fue mayor que el de la HD 6970 bajo carga, la tecnología ZeroCore de AMD ayudó a reducir el consumo de energía a la mitad aproximadamente cuando estaba inactiva.

El costo de todas las ventajas de la HD 7970 es de alrededor de $550, lo que puede sorprender a algunos compradores. Pero por este dinero, obtienes una tarjeta realmente poderosa que supera con creces a sus competidores, incluida la HD 6970. Si buscas, puedes comprar dos HD 6970 por aproximadamente $50 menos que la indicada y obtener un rendimiento al nivel de HD 6990+. pagando más que el precio en dinero nivel alto Ruido y consumo de energía. Al comprar SAPPHIRE HD 7970 3GB GDDR5, obtienes la tarjeta de video más rápida con una sola GPU hoy, ¡que ejecutará fácilmente y sin frenos cualquier juego moderno! ¡AMD y sus socios han vuelto a hacer un gran producto!

Ventajas:

  • La tarjeta gráfica GPU única más rápida
  • Excelentes capacidades de overclocking
  • Alto rendimiento
  • Jugando con Eyefinity
  • nueva arquitectura
  • Tecnología de núcleo cero
  • Reducción de ruido

Contras:

  • El ventilador sigue haciendo ruido al 100 % de la velocidad

Vistas: (1943)

Introducción

La arquitectura de la unidad de procesamiento de gráficos (ATI) de AMD no ha cambiado mucho desde la serie Radeon HD 2000, con el diseño VLIW hasta la HD 6000. ¿Lo que es? Primero, recordemos cómo funciona el procesador central en nuestras computadoras personales. Las CPU modernas son superescalares, es decir, sus unidades informáticas pueden ejecutar varias instrucciones de un hilo al mismo tiempo. Pero las instrucciones deben ser independientes entre sí, por lo que el procesador verifica constantemente cuándo es posible realizar operaciones en paralelo y cuándo es necesario esperar a que se resuelva la siguiente dependencia. Además, la CPU hace predicción de bifurcaciones y puede hacer parte del trabajo por adelantado (fuera de servicio). Optimizar estas funciones es una tarea técnica compleja, y los circuitos en los que se basan ocupan una buena parte de la matriz de la CPU.

Pero hay otra forma: establecer el orden de ejecución de las instrucciones en la etapa de compilación del código. El compilador mismo encuentra instrucciones que se pueden ejecutar simultáneamente y forma largas construcciones compuestas a partir de ellas. De ahí el término VLIW - palabra de instrucción muy larga. VLIW generalmente muestra una alta eficiencia cuando el código contiene pocas dependencias y el flujo del programa es predecible. El compilador "conoce" el código de principio a fin y puede establecer la ejecución de ciertos fragmentos con un amplio margen de tiempo. Pero la planificación resulta difícil, y en el caso de que el curso del programa dependa de datos externos, la compilación ingeniosa no ayuda mucho, las unidades de ejecución están inactivas y el rendimiento disminuye.

Pero renderizar gráficos 3D es una tarea predecible y se paraleliza bien. Por lo tanto, la apuesta por VLIW, que entonces era realizada por una empresa canadiense independiente, se justificaba plenamente. Al cambiar las funciones del programador al compilador, ATI pudo hacer chips relativamente compactos con cientos de elementos de ejecución en su interior y, como resultado, las tarjetas de video resultaron ser relativamente económicas. El punto culminante de AMD para VLIW se produjo durante la serie Radeon HD 5000, cuando el debut de la arquitectura Fermi de NVIDIA (GeForce 400) se estancó un poco. Y no es de extrañar, porque los "verdes" tienen que fabricar chips enormes, hasta tres mil millones de transistores. E incluso ahora, cuando la arquitectura Fermi ya está funcionando a plena capacidad en los adaptadores GeForce 500, y los mejores aceleradores de NVIDIA superan a los productos de AMD en los puntos de referencia, las Radeon 6000 siguen brindando un excelente rendimiento en los juegos.

En ese caso, ¿por qué AMD decidió dar un giro tan brusco? Parecería que bastaría con pulir un poco el diseño de la GPU, aumentar las unidades de cómputo aquí y allá, introducir una más delgada proceso tecnológico— y VLIW vivirá feliz para siempre. ¿Por qué perder tiempo y dinero desarrollando una arquitectura completamente nueva? Pero no se trata sólo de los juegos. Las GPU están evolucionando lentamente de dispositivos de representación 3D puros a GPU de propósito general (GPGPU) que se pueden usar para cualquier tarea masiva. computación paralela. Sin embargo, hoy resultó que si decimos GPGPU, nos referimos a CUDA. Ni la API "roja" nativa llamada ATI Stream, ni Open CL son tan populares como CUDA de NVIDIA. Mientras tanto, AMD realmente quiere darle un mordisco a este mercado, pero para que esto sea posible, la buena y antigua arquitectura VLIW tendrá que ser abandonada. No es adecuado para cálculos no gráficos, porque son menos predecibles que el renderizado 3D, y la GPU simplemente no puede funcionar con todo su potencial.

Arquitectura de gráficos Core Next

Tomemos al representante más reciente de la arquitectura VLIW de AMD, el procesador Cayman, que subyace en los adaptadores Radeon HD 6950/6970/6990. El componente principal del dominio de sombreado es el motor SIMD, un bloque de dieciséis procesadores de flujo. Todos ellos ejecutan simultáneamente una instrucción VLIW, pero en relación con diferentes datos (por eso SIMD: instrucción única, datos múltiples). A su vez, se pueden empaquetar hasta cuatro operaciones escalares en una instrucción VLIW, lo que corresponde a cuatro ALU dentro de un procesador de flujo.

El bloque de construcción de Graphics Cores Next (GCN) se llama Compute Unit, y funciona de manera bastante diferente. También tiene 64 ALU, pero están divididas en cuatro módulos SIMD vectoriales separados de 16 cada uno más un bloque de programador. En pocas palabras, el paralelismo solía implementarse a través de varias operaciones en una sola instrucción y ahora a través de varios bloques SIMD separados. Y si el rendimiento de la arquitectura antigua depende de cuántas operaciones escalares puede codificar el compilador en una instrucción VLIW, entonces la unidad de cómputo en el núcleo de GCN puede distribuir dinámicamente la carga entre los bloques SIMD.

La carga para la ejecución en paralelo en el bloque SIMD viene en forma de un arreglo (frente de onda) de 64 instrucciones, que se ejecuta en cuatro ciclos. Y aunque solo cuatro matrices pueden estar en funcionamiento al mismo tiempo, se puede acceder directamente a otras 28 desde la unidad de cómputo, por lo que el programador tiene espacio para maniobrar. En una situación en la que una dependencia en el código impide que el bloque SIMD combinado del procesador VLIW funcione a plena capacidad, los bloques SIMD individuales del chip GCN simplemente cambiarán a otros arreglos de la misma tarea o tareas completamente diferentes.

Lo más destacado de GCN es una unidad escalar separada en cada Unidad de Cómputo. Está destinado a operaciones de una sola vez que no encajan en el frente de onda (lo que salvará a los módulos SIMD de un uso ineficiente), y también para el control de ejecución de programas: ramas condicionales, transiciones y otros eventos que Cayman tuvo dificultades para digerir. El módulo escalar realiza una operación por ciclo.

memoria caché

El nuevo diseño del módulo de ejecución requiere una memoria caché más rápida y más grande en comparación con el diseño de VLIW. Cada CU tiene una memoria caché L1 de 16 KB independiente más almacenamiento de 16 KB y 32 KB para instrucciones y datos compartidos por las cuatro CU, un búfer para compartir datos entre arreglos. También hay una caché L2 completamente coherente, dividida en porciones de 64 KB entre controladores de memoria de dos canales. Almacena copias de los buffers anteriores

Los buses de caché L1 y L2 tienen 64 bytes de ancho. AMD informa que el rendimiento L1 alcanza casi 2 TB/s y L2 - 700 GB/s y, aparentemente, esto significa el valor total para un procesador con 32 CU.

A modo de comparación: en Caimán, cada módulo SIMD tiene una caché L1 de 8 KB con un bus de 16 bytes.

Procesamiento de geometría, rasterización

Las presentaciones de AMD que acompañan al lanzamiento dicen poco sobre los componentes gráficos reales del chip. A juzgar por el diagrama de bloques, su estructura interna no ha cambiado, solo el Tesselator se ha actualizado a la novena versión y proporciona un gran aumento en el rendimiento de las tareas correspondientes.

Mientras tanto, si cree en la información de fuentes de terceros y en las diapositivas de la propia AMD de la Cumbre de desarrollo de Fusion de junio, entonces Geometry Engine y Tesselator se ven completamente diferentes desde el interior. Al igual que Cayman, el núcleo de GCN contiene dos motores gráficos, pero si antes consistían en bloques separados para rasterización, teselado, etc., ahora cada GE puede tener un número arbitrario de canalizaciones para procesar píxeles y primitivas geométricas.

Probablemente, dicho diseño ayudará al fabricante a aumentar fácilmente la potencia de los gráficos o lanzar GPU económicas que se reducen en esta área. trabajo rapido con geometría será útil en los juegos modernos.

PCI-E3.0

El titular habla por sí solo: AMD ha implementado un bus PCI-E de nueva generación con el doble de ancho de banda. No está claro si se necesita hoy en día para la representación en 3D, pero para cálculos no gráficos sin duda será útil. AMD ha realizado muchas innovaciones en la arquitectura GCN con un ojo puesto en tales aplicaciones y una función gráfica especial que también encaja perfectamente con la nueva interfaz.

Nuevas característicasGCN

GCN tiene dos unidades de distribución de comandos adicionales llamadas Asynchronous Compute Engine, que funcionan de forma totalmente independiente entre sí y de la GPU. AMD planea abrir el acceso a ACE a través de Open CL, y luego los programadores tendrán tres dispositivos individuales, cada uno con su propia cola de comandos. Además, según información de tercera mano, ACE proporciona ejecución fuera de orden a nivel de tareas individuales. Las propias CU, aunque más inteligentes que los módulos SIMD de la arquitectura VLIW, pueden procesar sus frentes de onda estrictamente en orden directo.

El núcleo de GCN y la CPU de la computadora pueden compartir un espacio de direcciones común. En este caso, todas las instrucciones que ejecuta la GPU apuntan a direcciones en el espacio x86-64, y las recodificará de forma independiente en direcciones de memoria de video local utilizando un módulo especial. Como resultado, la GPU obtiene acceso directo a la memoria del sistema. Además, el núcleo de GCN se dotó de una serie de funciones para admitir lenguajes de alto nivel: funciones virtuales, punteros, recursividad, etc. Esto permitirá a los programadores escribir código genérico adecuado para su ejecución en la CPU o GPU.

Las nuevas GPU son totalmente compatibles con la API OpenCL 1.2, DirectCompute 11.1 (y DirectX 11.1 per se) y C++ AMP. Apareció instrucciones especialesútil para la producción de contenidos multimedia. Además, los chips basados ​​en la arquitectura GCN son las primeras GPU con un codificador de video H.264 integrado, que se pueden usar tan pronto como AMD lance la biblioteca de software requerida.

A su vez, el decodificador ha adquirido soporte para varios formatos adicionales: MVC, MPEG-4/DivX y Dual Stream HD+HD. En general, las tarjetas de video Radeon eran fuertes en términos de reproducción de video en los días de ATI. La serie siete mil tiene muchos "mejoradores" de imágenes, por ejemplo, el algoritmo Steady Video que elimina el movimiento de la cámara.

Texturas parcialmente residentes es otro truco con memoria virtual, que ya está destinado a la representación 3D: una aplicación o sombreador funciona con un espacio de direcciones que excede la cantidad de memoria integrada del adaptador, y en sí mismo actúa solo como un caché rápido. Por lo tanto, puede usar texturas de hasta 32 TB, partes de las cuales la GPU bombeará dinámicamente más cerca de sí misma. No se requiere soporte del sistema operativo para esto.

Los frenos que inevitablemente se producirán al cargar texturas desde la memoria del sistema, AMD los compensa en parte utilizando el mapeo MIP. La textura gigante probablemente se almacenará en varias versiones con diferentes resoluciones (mipmaps). Cada uno de ellos está dividido en fragmentos de 64 KB. Cuando el adaptador necesita un determinado fragmento y ya está en la memoria de video local, entonces no hay problema. Si no hay ningún fragmento, el programa puede extraerlo inmediatamente de la memoria del sistema, o puede posponer la lectura y tomar la copia de baja resolución correspondiente del fragmento para el cuadro actual (si ya está en la memoria de video).

Una pequeña adición a la cuestión de la teselación. GCN implementa el algoritmo Ptex (mapeo de texturas por cara). En general, en el modelado 3D, la textura se aplica a todo el modelo y los vértices deben alinearse cuidadosamente con las áreas deseadas del lienzo 2D. No es difícil imaginar cómo la teselación de hardware, que produce vértices adicionales, complica la tarea del diseñador. Cuando se usa Ptex, se aplica una textura separada a cada polígono, como resultado, no hay juntas visibles. Además, Ptex le permite empaquetar texturas con diferentes resoluciones en un solo archivo.

Finalmente, AMD trabajó en el filtrado anisotrópico para eliminar el parpadeo sutil en las texturas de alta resolución. Cambiar el algoritmo no debería afectar el rendimiento.

Gestión de la energía

AMD señala que los fabricantes de GPU y tarjetas de video siempre se aseguran del consumo de energía y establecen velocidades de reloj para tener en cuenta la carga máxima, lo que solo es posible en las aplicaciones más codiciosas o incluso en pruebas de estrés (FurMark. OCCT). Y en juegos normales, la GPU podría funcionar a una frecuencia más alta. Para exprimir siempre al máximo la GPU, se ha diseñado la tecnología PowerTune, una calculadora que calcula el consumo de energía de la tarjeta en tiempo real a intervalos de milisegundos en función de un análisis de la tarea que se está realizando (sin sensores analógicos). Y si es posible, se aumenta la velocidad de reloj de la GPU. Tenga en cuenta que esto no es un reinicio de frecuencia relativo al valor nominal cuando se alcanza el umbral de potencia, sino viceversa: aceleración dinámica ajustada con precisión.

Y el núcleo GCN puede apagarse por completo cuando no hay nada en la pantalla durante mucho tiempo y detener el enfriador (tecnología ZeroCore). En la configuración CrossFire, los procesadores de las tarjetas adicionales (y de la misma) no funcionan en absoluto sin carga 3D.

Eyefinity 2.0

Con la Radeon HD 7000 debuta la segunda versión de la tecnología Eyefinity, que trajo muchas innovaciones. Muchas de las "características" presentadas no necesitan comentarios, por lo que las enumeramos brevemente:

  • Las configuraciones con cinco pantallas seguidas en orientación horizontal o vertical son oficialmente compatibles.
  • El monitor central de una fila ahora puede ser verticalmente más grande que los demás.
  • Funcionamiento simultáneo de Eyefinity, AMD HD3D y CrossFire.
  • La resolución máxima de la pantalla combinada es de 15x15 mil píxeles.
  • Permisos arbitrarios.
  • Moviendo el panel tareas de Windows a cualquier pantalla.
  • Salida de flujos de audio individuales a múltiples pantallas.

Las nuevas Radeon son compatibles con DisplayPort 1.2, lo que significa tecnología Multi-Stream. Con su ayuda, puede conectar tres pantallas a una salida en una cadena o a través de un concentrador especial. Además, la salida del concentrador puede ser no solo DisplayPort, sino también interfaces HDMI, DVI y VGA. AMD promete que los concentradores estarán disponibles en el verano de 2012.

La salida HDMI cumple con el estándar 1.4a, por lo que puede enviar una señal dual a un televisor 3D a 24 cuadros por canal. Y especialmente para juegos, hay soporte para HDMI de 3 GHz con una frecuencia de 60 Hz por canal.

Además, los estándares DisplayPort 1.2 HBR 2 y 3 GHz HDMI serán útiles para conectar próximas pantallas con una resolución de 4096x2160.

Radeon HD 7970

Especificaciones

El HD 7970 es el buque insignia de la línea de un solo chip y representa la arquitectura GCN en todo su poder. Su GPU se llama Tahiti y contiene 32 CU (Compute Units), que se describen en detalle anteriormente. Si calculamos esto por la cantidad de ALU separadas, como lo ha hecho AMD hasta ahora, obtenemos 2048 piezas, ¡una vez y media más que en el núcleo de Cayman! Y las TMU (unidades de mapeo de texturas) en Tahití también son 128 frente a 96. El bus de memoria es de 384 bits en lugar de 256 bits. Teniendo en cuenta la cantidad de lógica adicional que se ha agregado a la arquitectura, no sorprende en absoluto que Tahiti consista en 4310 millones de transistores. Solo a modo de comparación, el Cayman tiene 2640 millones y el GF110 de NVIDIA tiene tres. Toda la economía opera en una frecuencia de 925 MHz. Apariencia, diseño

En el diseño de la serie 7000, AMD se alejó de las formas brutales de la Radeon HD 6000 y eligió un diseño atractivo con líneas suaves y una superficie de carcasa brillante. La reconocible textolita roja ha regresado, esta vez con un tinte frambuesa. En términos de dimensiones, la Radeon HD 7970 no difiere de los anteriores buques insignia AMD/ATI de un solo chip.

Productos de fábrica de ladrillos AMD

La tarjeta es pesada. Lo tomas en tu mano y sientes el poder. Se trata del sistema de enfriamiento con una gran cámara de evaporación unida a un marco grueso. Desde la época de la Radeon HD 6970, el diseño no ha cambiado mucho, excepto que el ventilador de la turbina se ha ensanchado.

Para mejor enfriamiento Se eliminó un puerto DVI del trozo para ocupar completamente la ranura con una rejilla de escape.

En la parte trasera, como antes, hay una cruz de sujeción. Se decidió rechazar una cubierta sólida.

Sobre el placa de circuito impreso, como el HD 6970, hay un interruptor entre principal y BIOS de copia de seguridad. Y en la superficie trasera hay dispersos varios pequeños interruptores duales de propósito desconocido, que nosotros, fuera de peligro, decidimos no tocar. Es posible que solo tengamos una muestra de ingeniería de HD 7970 frente a nosotros, y estos elementos extraños ya no estarán en las placas de serie.

En la cola de la placa hay siete inductores y un controlador de voltaje de ocho fases CHiL CHL8228G, lo cual, sin duda, los overclockers estarán felices, porque sobre n ya se ha utilizado en Radeon HD 6970, . Lo más probable es que el circuito de alimentación de la tarjeta esté organizado a la antigua: seis fases caen sobre la GPU y una se entrega para alimentar los circuitos internos de los microcircuitos GDDR5. En la esquina opuesta de la placa hay un chip bifásico uP1509P de uP Semiconductor con su propia bobina que, por analogía con el HD 6970, debe controlar el voltaje en los búferes de E/S de la memoria de video.