Домой / Игровые консоли / Видеокарты. Тестовая конфигурация, инструментарий и методика тестирования

Видеокарты. Тестовая конфигурация, инструментарий и методика тестирования

AMD решила начать новую битву за господство на рынке GPU. Но сегодня обоим производителям, AMD и Nvidia, приходится сталкиваться с новыми вызовами и работать в новых условиях. В частности, AMD приходится переходить на новую технологию производства 28 нм, да и полностью новую архитектуру GPU, как оказалось. NVIDIA тоже планирует перейти на 28 нм, но только через несколько месяцев, и с новой архитектурой. Но AMD оказалось первой, и в нашей статье мы поговорим о новом поколении GPU в виде AMD Radeon HD 7970.

AMD считает, что игры на ПК ждёт бурное развитие, причём в ближней перспективе - особенно с учётом того, что приставки обновляются довольно долго. А поскольку современные графические движки выигрывают от возможностей передовых видеокарт, то подобное развитие будет только усиливаться. В прошлом году оборот рынка игр для ПК составил 15 млрд. долларов, и к 2013 году ожидается рост до 20 млрд. долларов. И не забывайте о том, что геймеры сегодня предпочитают играть на всё более высоком разрешении. Разрешение 1080p уже стали де-факто стандартом, что подкрепляется и стремительно дешевеющими дисплеями с большой диагональю. Кроме того, AMD фокусируется на более высокой эффективности GPU и на вычислительные возможности GPU. Последняя сфера для AMD сегодня очень важна, поскольку компания желает обойти ограничения, выявленные у GPU архитектуры Cayman.


На данный момент AMD представила только Radeon HD 7970, как можно видеть на слайде, но в линейке Radeon HD 7900 должны вскоре появиться новые видеокарты.

NVIDIA GeForce GTX 570

NVIDIA GeForce GTX 580

AMD Radeon HD 6950 AMD Radeon HD 6970 AMD Radeon HD 7970
GPU GF110 GF110 Cayman PRO Cayman XT Tahiti XT
Техпроцесс 40 нм 40 нм 40 нм 40 нм 28 нм
Количество транзисторов 3 млрд. 3 млрд. 2,6 млрд. 2,6 млрд. 4,3 млрд.
Площадь кристалла 530 мм² 530 мм² 389 мм² 389 мм² 365 мм²
Тактовая частота GPU 732 МГц 772 МГц 800 МГц 880 МГц 925 МГц
Тактовая частота памяти 950 МГц 1000 МГц 1250 МГц 1375 МГц 1375 МГц
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Объём памяти 1280 Мбайт 1536 Мбайт 2048 Мбайт 2048 Мбайт 3072 Мбайт
Ширина шины памяти 320 бит 384 бит 256 бит 256 бит 384 бит
Пропускная способность памяти 152 Гбайт/с 192 Гбайт/с 160 Гбайт/с 176 Гбайт/с 264 Гбайт/с
Модель шейдеров 5.0 5.0 5.0 5.0 5.0
DirectX 11 11 11 11 11.1
Количество потоковых процессоров 480 (1D) 512 (1D) 1408 (352 4D) 1536 (384 4D) 2048 (1D)
Тактовая частота потоковых процессоров 1464 МГц 1544 МГц 800 МГц 880 МГц 925 МГц
Количество текстурных блоков 60 64 88 96 128
Количество ROP 40 48 32 32 32
Максимальное энергопотребление 219 Вт 244 Вт 200 Вт 250 Вт 250 Вт
Минимальное энергопотребление - 30-32 Вт 20 Вт 20 Вт 2,6 Вт
CrossFire/SLI SLI SLI CrossFireX CrossFireX CrossFireX

Видеокарта Radeon HD 7970 базируется на GPU "Tahiti XT", который производится по 28-нм техпроцессу. В общей сложности графический процессор насчитывает 4,3 млрд. транзисторов. Для сравнения, процессоры Intel Sandy Bridge-E (за исключением четырёхъядерных моделей) имеют 2,27 млрд. транзисторов. А предшественник из семейства Cayman Radeon HD 6900 работал с 2,6 млрд. транзисторов. Площадь кристалла составляет 365 мм². Как видим, площадь чуть меньше 389 мм² у GPU "Cayman", которые при этом производятся по 40-нм техпроцессу. GPU GF110 от NVIDIA содержит 3 млрд. транзисторов на площади 530 мм². Большая часть бюджета транзисторов GPU была потрачена на 2048 потоковых процессоров. GPU и потоковые процессоры работают на тактовой частоте 925 МГц. AMD решила сохранить ту же самую память, что и у Radeon HD 6970, то есть GDDR5 на 1375 МГц. Но интерфейс памяти был расширен с 256 бит до 384 бит, что обеспечило увеличение пропускной способности памяти до 264 Гбайт/с. Кроме того, и ёмкость возросла с 2048 Мбайт до 3072 Мбайт. У Radeon HD 7970 работают 128 текстурных блоков и 32 конвейера растровых операций (ROP) - мы получаем прирост текстурных блоков по сравнению с Radeon HD 6970, но количество ROP осталось прежним. AMD указала максимальное энергопотребление для Radeon HD 7970 на уровне 250 Вт, которое также является предельным значением для PowerTune. Типичное энергопотребление видеокарты составляет 210 Вт. У Radeon HD 6970, напомним, максимальное энергопотребление составляло 250 Вт, а типичное под нагрузкой - 190 Вт. Благодаря технологии ZeroCore Power (подробнее о ней чуть ниже) энергопотребление в режиме бездействия не превышает три ватта.

GPU-Z 0.5.7, как можно видеть на скриншоте, корректно отображает не все данные AMD Radeon HD 7970. На нашей тестовой системе Socket 1366 интерфейс был указан как PCI Express 3.0 x16, а тактовая частота - 500 МГц. Также приведены некорректные значения для пиксельной и текстурной пропускной способности. Правильные значения: 925 МГц для GPU, 29,6 Гпиксель/с и 118,4 Гтексель/с.

Слухи о выходе обновлённой видеокарты Radeon HD 7970 , и на Computex 2012 о ней не говорил только ленивый. Конечно, мы имеем в виду Radeon HD 7970 GHz Edition. Между тем AMD выпускает процессоры "Southern Island" по 28-нм техпроцессу на заводах TSMC уже несколько месяцев, и такого срока достаточно, чтобы внести оптимизации в процесс производства и повысить долю выхода годных кристаллов. Тем более что высокая производительность GeForce GTX 680 от NVIDIA заставила AMD искать новую более скоростную версию Radeon HD 7970 для конкуренции. В нашем обзоре мы рассмотрим, насколько достойным оппонентом станет Radeon HD 7970 GHz Edition по сравнению с GeForce GTX 680, какие улучшения по сравнению со стандартной моделью HD 7970 мы получим.

Производители, уже отметившиеся выпуском видеокарт с заводским разгоном, планируют сделать то же самое и с новой Radeon HD 7970 GHz Edition. AMD явно нацелилась на возможность увеличения частот GPU выше планки 1 ГГц при сохранении тех же уровней напряжения, что и у оригинальной модели. Это касается и ручного разгона энтузиастами, и заводского разгона производителями видеокарт. "Старая" модель Radeon HD 7970 будет пока что продаваться, но версию GHz Edition AMD позиционирует на ступень выше по производительности и, соответственно, по цене

Технические спецификации приведены в следующей таблице:


NVIDIA GeForce GTX 680 AMD Radeon HD 7970 AMD Radeon HD 7970 GHz Edition
Розничная цена около 460 евро в Европе
около 18,5 тыс. рублей в России
около 380 евро в Европе
около 17 тыс. рублей в России
499 долларов США
Сайт производителя NVIDIA AMD AMD
Технические спецификации
GPU GK104 (GK104-400-A2) Tahiti XT Tahiti XT2
Техпроцесс 28 нм 28 нм 28 нм
Число транзисторов 3,54 млрд. 4,3 млрд. 4,3 млрд.
Тактовая частота GPU 1006 МГц (Boost: 1058 МГц) 925 МГц 1000 МГц (Boost: 1050 МГц)
Тактовая частота памяти 1502 МГц 1375 МГц 1500 МГц
Тип памяти GDDR5 GDDR5 GDDR5
Объём памяти 2048 Мбайт 3072 Мбайт 3072 Мбайт
Ширина шины памяти 256 бит 384 бит 384 бит
Пропускная способность памяти 192,3 Гбайт/с 264 Гбайт/с 288 Гбайт/с
Версия DirectX 11.1 11.1 11.1
Потоковые процессоры 1536 (1D) 2048 (1D) 2048 (1D)
Текстурные блоки 128 128 128
ROP 32 32 32
Пиксельная скорость заполнения 32,2 Гпиксель/с 29,6 Гпиксель/с 33,6 Гпиксель/с
Минимальное энергопотребление 15 Вт 2,6 Вт 2,6 Вт
Максимальное энергопотребление 195 Вт 250 Вт 250 Вт
SLI/CrossFire SLI CrossFire CrossFire

Архитектурно новая версия GHz Edition не отличается от Radeon HD 7970. AMD опиралась только на оптимизации техпроцесса, возможность работы GPU на меньшем напряжении, что позволило увеличить штатную тактовую частоту GPU с 925 МГц до 1000 МГц. Что интересно, 1000 МГц соответствует базовой частоте, поскольку AMD реализовала режим Boost. Он у видеокарты Radeon HD 7970 GHz Edition будет увеличивать тактовую частоту до 1050 МГц. То есть по сравнению с первоначальной частотой 925 МГц мы получаем разгон на 13,5 процентов.

Приятно и то, что GPU "Tahiti XT2" в режиме бездействия работает всего от 0,807 В. У Radeon HD 7970, напомним, напряжение составляло 0,85 В. Под нагрузкой тактовые частоты увеличиваются до обещанного AMD уровня 1050 МГц, GPU при этом работает от напряжения 1,201 - 1,221 В. "Старый" графический процессор Radeon HD 7970 работал от напряжения 1,139 В.

Механизм Powertune хорошо известен по предыдущим поколениям GPU. Но в случае Radeon HD 7970 GHz Edition технология AMD Powertune даёт прирост тактовой частоты Boost. В дополнение к ранее известному состоянию "High P-State", AMD добавляет ещё P-состояние "Boost P-State". Оно позволяет получить ещё более высокие тактовые частоты, которые стали возможными благодаря динамическому изменению напряжения.

Но, в отличие от NVIDIA, AMD не указывает минимального режима Boost - он фиксирован на уровне 1050 МГц. Кроме того, для работы используется технология, известная по процессорам Trinity. А именно "Digital Temperature Estimation", которая заблаговременно оценивает нагрузку и выставляет тактовые частоты соответствующим образом. На архитектурном уровне чипы Tahiti в двух видеокартах Radeon HD 7970 не отличаются друг от друга. Таким образом, Powertune реализована через VBIOS и драйвер, теоретически технология может работать и на старых видеокартах.

Память тоже была разогнана. Как можно видеть по спецификациям выше, VRAM работает на частотах 1500 МГц, что увеличивает пропускную способность с 264 до 288 Гбайт в секунду. Из-за более широкого интерфейса памяти, AMD смогла в данном отношении ещё сильнее оторваться от NVIDIA.

Теоретическая производительность новинки составляет 4,3 терафлопа с одинарной точностью и 1,08 терафлопа с двойной точностью. NVIDIA недавно анонсировала вычислительный ускоритель Tesla K10 на основе двух GPU GK104, который даёт производительность с одинарной точностью 4,58 терафлопа. Но у GK104 производительность с двойной точностью составляет 1/24 от уровня с одинарной точностью. Подобная ситуация изменится только с чипом GK110 и Tesla K20, когда можно будет ожидать трёхкратный прирост по производительности с двойной точностью. Таким образом, если Tesla M2090 на основе Fermi даёт 665 гигафлопов, то от GK110 можно ожидать производительности 1,5 терафлопа и больше.

Для получения дополнительных деталей об архитектуре "Graphics Core Next" и поколении "Southern Island" мы рекомендуем обратиться к нашему .

Вот и пришла пора сменить с честью отработавший три года, Palit GeForce GTX 460. В качестве замены я выбрал флагман от Radeon - HD 7970 фирмы Asus. Найти карту на этом чипе оказалось очень сложно, в магазинах образовался большой дефицит, особенно у нас на Дальнем Востоке. Удалось приобрести ASUS Radeon HD 7970 DirectCU II только за 18 000 рублей, что на сегодня, к сожалению довольно таки много.

Главная надежда: что видеокарта оправдает свою цену, порадовав меня своей производительностью.

Спецификация видеокарты:

Упаковка и комплектация

Большая коробка с фирменным рыцарем сразу привлекает к себе внимание потенциального покупателя. Производитель хвастается фирменной системой охлаждения DirectCU II , уникальной функцией VGA HotWire , позволяющей подключить ее к материнке серии ROG . Так же мы видим важную информацию, которую нужно учесть при покупке: блок питания от 600 Вт. с током 42А по линии +12в.

В коробке видеокарта надежно упакована, и столь ценному содержимому не страшна неаккуратная транспортировка.

В комплекте имеется диск с драйверами и утилитами, среди которых есть GPU Tweak , которым я позже и воспользовался.

Подробная инструкция с цветными картинками. Гибкий мостик CrossFireX, переходник с DVI на HDMI, на самой плате данного выхода нет. Переходник на 8ми контактный разъем питания PCI-E, не все БП имеют два таких разъема. И есть еще радиатор, который можно приклеить на двухсторонний скотч к блоку стабилизации питания, если будете ставить жидкостное охлаждение.

Никаких бонусов в виде игр или ключей к играм не было.

Внешний вид

На вид карта большая и солидная, занимает три слота расширения. Но в мой новый корпус вместилась без проблем, и ей там вполне просторно.

Подключить к видеокарте можно до 6 мониторов, для этого имеется 4 порта Display, и два DVI. Но один Display порт работает при условии, если один DVI порт переключен в режим Single -Link специальным переключателем.

Фирменная система охлаждения делает видеокарты этого производителя «близнецами»: красные полоски по центру, два вентилятора, и бэкплейт, который предотвращает перегиб текстолита и принимает на себя вес массивной системы охлаждения.



Теперь понятно почему на коробке рыцарь: видеокарта вся закована в толстую, мощную броню.

Питание к плате подводится через два восьми контактных разъема, что должно обеспечить запас по мощности.
Карта оснащена 3 ГБ видеопамяти GDDR5, изначально работающей на частоте 5500 МГц. Между памятью и чипом Tahiti XT шина шириной 384-бит. Чип изготовлен по 28 нм техпроцессу и включает 2048 унифицированных конвейеров, а также 32 блока растеризации.

Система охлаждения состоит из верхнего блока с двумя 90 мм вентиляторами.



Вентиляторы работают над двумя алюминиевыми радиаторами которые отводят тепло от шести тепловых трубок. Эффективность такой системы уже давно зарекомендовала себя, и я проверю ее в работе при помощи MSI Afterburner.

Тестирование

Тестовый стенд:

Испробовал карту и в этом деле. Здесь при включении вентиляторов на 100 % шум явно слышен в виде мощного гудения. При разгоне ядра до 1100 и памяти до 1500 карта выдавала 615 МHash при «добыче» LTC. При нынешней сложности и курсе – это 100 долларов в месяц, что явно не рентабельно.

Выводы

Впечатления о работе карты очень положительные, я считаю, что нашел достойную замену своей старой видеокарте. Вентиляторы даже под нагрузкой не разгоняются на 100 %, поэтому в хорошем корпусе их почти не слышно. Температура не поднимается выше 70 градусов, да и нагрев карты не влияет на другие комплектующие. В играх на высоких настройках карта выдает очень даже играбельное количество кадров в секунду. Когда и этого будет мало, видеокарту можно будет разогнать, что повысит ее производительность процентов на двадцать.
Ну а перечисленные ниже недостатки - относительны. Для просторного корпуса размер видеокарты не имеет значения, зато можно эффективнее устроить систему охлаждения на три слота. Цена так же относительна; когда сегодня сходил с супругой в магазин за продуктами, то понял, что все нормально, ни какой переплаты:-({|=:

Преимущества:
Тихая
Производительная
Хороший разгонный потенциал, способный повысить производительность до 20 %
Эффективное охлаждение

Недостатки
Большие размеры, не в любой корпус вместится
Высокая цена

В самом конце прошлого года компания AMD раскрыла исходный код своей новой GPU архитектуры, названной Southern Islands. Одним из первых воплощений этой инновации стала видеокарта SAPPHIRE HD 7970 3GB GDDR5.

Эта архитектура явилась продуктом некоторого спада в развитии технологии 28 нм и названа представителями AMD не иначе как революционной и призванной к 1.4x ускорению относительно предыдущего поколения. Помимо этого в SAPPHIRE HD 7970 мы получаем поддержку PCIe 3, 3 ГБ высокоскоростной памяти GDDR5, совместимость с DX 11.1, поддержку технологий Power Tune, Zero Core и Eyefinity 2.0, которая обрела новые функции и особенности. Новое ядро от AMD, называемое Graphics Core Next Tahiti – это шаг от VLIW дизайна к не VLIW SIMD движку, что означает более высокие показатели вычислительной производительности.



Это новое ядро обладает значительно возросшим числом транзисторов (4.31 миллиадра), 2048 потоковыми процессорами с 32 растровыми юнитами, 128 текстурными юнитами и 384-битной широкополосной шиной памяти, которая обеспечивает кратное увеличение мощности вычислений и полосы пропускания памяти. Все эти характеристики на бумаге выглядят более чем внушительно и должны вознести игровой опыт на новый уровень.

Характеристики SAPPHIRE HD 7970

Выходы 1 x Dual-Link DVI
1 x HDMI 1.4a
2 x Mini-DisplayPort
DisplayPort 1.2
GPU Частота ядра 925 МГц
Технология производства чипа 28 нм
Количество потоковых процессоров — 2048
Память Объем — 3072 МБ
Тип — 384-бит GDDR5
Эффективность — 5500 МГц
Размеры 275(д)x115(ш)x36(в) мм
ПО CD с драйверами
SAPPHIRE TriXX Utility
Аксессуары Кабель CrossFire™ Bridge Interconnect
Кабель питания 8 PIN на 4 PIN
Переходник Mini Display Port на HDMI
Переходник Mini DP на SL-DVI Passive
Кабель питания 6 PIN на 4 PIN
Адаптер HDMI на SL-DVI
HDMI 1.4a высокоскоростной кабель (1.8 метра)
Переходник Mini DP на SL-DVI Active

SAPPHIRE HD 7970: Тесты

Тест SAPPHIRE HD 7970 происходил в сравнении с другими устройствами этого же класса и состояло из комплекса игровых тестов и синтетического бенчмарка. Выбранные для сравнения карты номинально либо равны, либо номинально превосходят по производительности HD 7970, так что результаты испытаний в полной мере должно отразить реальные показатели.

Конфигурация и настройки системы не будут меняться в течение всех тестов. Видеокарты пройдут испытания сначала на штатной скорости, а затем в разогнанной конфигурации (описание процесса и результатов разгона HD 7970 приведено ниже) в целях оценки эффективности ускорения устройства. Для AMD карт использовался драйвер 11.12 Catalyst, а для карт на основе NVIDIA — 290.53.

Конфигурация тестируемой системы :

  • Процессор : Core i7 2600K @ 4.4 ГГц 100 x 44
  • Охлаждение CPU : Corsair Hydro Series H100
  • Материнская карта : Gigabyte Z68AP-D3
  • Память : Mushkin 991996 Redline PC3-17000 9-11-10-28 8 ГБ
  • Видеокарта : Sapphire Radeon HD 7970
  • Блок питания : Corsair AX1200
  • Жесткий диск : 1 x Seagate 1 ТБ SATA
  • Оптический привод : Lite-On Blu-Ray
  • Операционная система : Windows 7 Professional 64-bit

Сравниваемые видеокарты :

  • XFX HD 6970
  • ASUS HD 6950
  • ASUS GTX 580 Direct CU II
  • ASUS GTX 570 Direct CU II
  • Sapphire HD 6990
  • ASUS GTX 590

Игровой тест: Metro 2033

Частично шутер от первого лица, частично хоррор — игра Metro 2033 построена на движке 4A Engine с поддержкой DirectX 11, NVIDIA PhysX и NVIDIA 3D Vision.

Настройки :

  • DirectX 11
  • 16x AF
  • Глобальные настройки = высокие
  • Physx = вкл




В игре Metro 2033 видеокарты SAPPHIRE HD 7970 показала очень сильные результаты на обоих разрешениях, как в штатном состоянии, так и в разогнанном.

Игровой тест: Battlefield 3

Battlefield 3 – шутер от первого лица, разработанный в EA Digital Illusions CE и использующий движок Frostbyte 2. Релиз этой игры состоялся 25 октября 2011. Она поддерживает DirectX 10 и 11.

Настройки :

  • 4x AA в CP
  • 16X AF в CP
  • Игровые настройки = Высокие


В сравнении с предыдущим поколением устройств, построенных на Cayman, — картой HD 6970, имеющая в основе своей ядро Tahiti карта HD 7970 показала существенный прирост мощности в этой игре.

Игровой тест Dirt 3

Dirt 3 – третья игра из легендарной гоночной серии, разработанной Codemasters. Она построена на движке EGO 2.0. Релиз состоялся в мае 2011.

Настройки :

  • 4x AA
  • 16AF в CP
  • Настройки = Ultra


В этой игре, выпускаемой, кстати, с маркером “AMD” на коробке, карта HD 7970 была на уровне GTX 580. Разгон больше помог GTX 580, нежели HD 7970.

Тестирование синтетическим бенчмарком 3DMark 11

3DMark 11 – последний бенчмарк Futuremark из серии 3DMark, приспособленный для тестирования систем с Microsoft DirectX 11. Эта программа состоит из шести тестов, четыре из которых предназначены для тестирования графики, один на моделирование физики и один комбинированный. Для тестирования на физической модели используется библиотека Bullet Physics. С бенчмарком поставляются два демо, оба они построены на тестах, но в отличии от тестов содержат базовое аудио.

Настройки :

  • Настройки теста по умолчанию
  • Начальный тест 1024 x 600
  • Производительный тест 1280 x 720
  • Экстремальный тест 1920 x 1080

По прохождении теста 3DMark11, результаты видеокарты SAPPHIRE HD 7970 оказались на более высоком уровне относительно GTX 580, как в штатной, так и в разогнанной конфигурациях.

В ходе температурных тестов было установлено, что SAPPHIRE HD 7970 как на штатных частотах, так и в разогнанном состоянии показала значения на 8 градусов ниже последнего поколения карт HD 6970, что является отличным для такой мощности устройства результатом.

На штатных и повышенных частотах технология Zero Core отлично сокращает энергопотребления в режиме ожидания. Под нагрузкой без увеличения вольтажа процессора общее энергопотребление карты заметно не возрастает.

Разгон

Из официальных релизов карточек от AMD, штатная скорость ядра которых превышает 1000 МГц, можно сделать вывод, что с новым Southern Islands Tahiti нас ждет прекрасная перспектива разгона. На самом деле 1000 МГц – это лишь отправная точка и похоже, что карта сможет выйти за рамки ограничений, установленных в Catalyst Control. Достижение 1125 МГц на ядре обеспечивается всего лишь перестановкой подаваемого на него напряжения посредством доступных из CC настроек. Выставкой подаваемого напряжения на память на ограничения CC вывели этот узел на скорость в 1575 МГц. Эти частоты свидетельствуют о том, что в запасе имеется как минимум еще 200 МГц как на ядрах GPU, так и на памяти GDDR5. Это очень хорошие показатели. Без подведения дополнительного напряжения температура на GPU значительно не повышалась. При ручном выведении скорости вращения вентилятора на 100%, температура разогнанной карты не превысила 57 градусов. Далее любому желающему придется подыскать утилиты (для BIOS или программные) для того, чтобы превысить ограничения CC и увидеть, на что же способна видеокарта на самом деле. Стоит отметить, что ускорение вентилятора на картах AMD всегда помогает удерживать рост температуры, но только за счет серьезного повышения уровня шума. В случае с SAPPHIRE RADEON HD 7970, AMD с помощью новой конструкции кулера улучшила показатели как охлаждения, так и шума.

Подведем итог нашего оверклокинга: 200 МГц – это 21% прирост на ядре и около 15% тактовой частоты памяти на первом этапе разгона позволяют говорить о светлом будущем видеокарты.

Отзывы: плюсы и минусы

Когда мы пытаемся понять, обеспечивает ли новый релиз нам все то, что мы от него хотели и ждали, то понимаем – новая видеокарта не только превосходит предыдущие поколения устройств, но и оставляет за бортом большинство прямых современных конкурентов. Отзыв о SAPPHIRE HD 7970 — видеокарта чрезвычайно убедительна. Она легко демонстрирует производительность, на уровень превышающую показатели построенной на Northern Islands Cayman карты HD 6970, а также показатели Nvidia GTX 580 практически во всех тестах. При этом уже на штатных тактовых частотах впечатляет даже игровая производительность, а пространство, предоставляемое устройством для разгона, открывает прямо-таки захватывающие перспективы. Нам удалось легко повысить скорость ядра GPU и памяти до пределов AMD Catalyst Control Center и установить их на отметки 1125 МГц на ядре и 1575 МГц на памяти – на обоих узлах без усилий мы получили прирост в 200 МГц. Такая дополнительная мощность позволяет использовать одну карту для игры по технологии Eyefinity на разрешениях до 5760 x 1080. Новая архитектура карты SAPPHIRE HD 7970 поддерживает новую версию технологии Eyefinity — 2.0, которая предлагает ряд усовершенствований, включая индивидуальные медиаканалы для каждого выхода, новую конфигурацию — 5×1 монитор и множество других.

Стоит отметить улучшенную производительность системы охлаждения AMD. И на штатных частотах, и в разогнанном состоянии температура HD 7970 была ниже температуры HD 6970 примерно на 4 градуса Цельсия на штатных частотах в режиме ожидания и на 8 градусах в остальных режимах.

Хотя энергопотребление HD 7970 под нагрузкой было выше, чем HD 6970, в режиме ожидания технология AMD ZeroCore помогала снизить этот показатель примерно в два раза.

Плата за все вышеописанные прелести HD 7970 составляет примерно $550, и некоторых покупателей это может неприятно удивить. Но за эти деньги в распоряжение вам попадает действительно мощная карта, намного превосходящая своих конкурентов, включая HD 6970. Если поискать, то за цену, примерно на $50 дешевле указанной можно купить две HD 6970 и получить производительность на уровне HD 6990+, заплатив сверх денег цену высокого уровня шума и энергопотребления. Покупая же SAPPHIRE HD 7970 3GB GDDR5, вы получаете самую быструю на сегодня видеокарту с одним GPU, которая легко и без тормозов потянет любую современную игру! AMD и партнеры снова сделали великолепный продукт!

Плюсы:

  • Быстрейшая видеокарта с одним GPU
  • Прекрасные возможности разгона
  • Высокая производительность
  • Игра через Eyefinity
  • Новая архитектура
  • Технология Zero Core
  • Сокращение шума

Минусы:

  • Вентилятор по-прежнему громкий на 100% скорости

Просмотры: (1943)

Введение

Архитектура графических процессоров AMD (ATI) не подвергалась существенным изменениям со времен серии Radeon HD 2000: вплоть до HD 6000 в GPU использовался VLIW-дизайн. Что это такое? Сначала вспомним, как работает центральный процессор в наших персоналках. Современные CPU - суперскалярные, то есть их вычислительные блоки могут выполнять несколько инструкций из одного потока одновременно. Но инструкции при этом должны быть независимыми друг от друга, поэтому процессор непрерывно проверяет, когда можно выполнять параллельные операции, а когда нужно подождать разрешения очередной зависимости. Кроме того, CPU занимается предсказанием ветвлений и может делать часть работы заранее (out-of-order). Оптимизация этих функций - сложная техническая задача, а схемы, на которых они построены, занимают добрую часть кристалла CPU.

Но есть другой путь: задать порядок исполнения инструкций на этапе компиляции кода. Компилятор сам находит инструкции, которые можно выполнять одновременно, и формирует из них длинные составные конструкции. Отсюда и термин VLIW - very long instruction word. VLIW в общем случае показывает высокую эффективность, когда код содержит мало зависимостей, а ход программы предсказуем. Компилятор «знает» код от начала до конца и может задать исполнение определенных фрагментов с большим запасом по времени. Но планирование получается жестким, и в случае когда ход программы зависит от внешних данных, хитроумная компиляция уже мало помогает, исполнительные блоки простаивают и производительность идет вниз.

Но рендеринг 3D-графики - предсказуемая задача и отлично распараллеливается. Поэтому ставка на VLIW, которую сделала тогда еще независимая канадская компания, себя полностью оправдала. Переложив функции планировщика на компилятор, ATI могла делать относительно компактные чипы с бешеными сотнями исполнительных элементов внутри, и видеокарты в результате получились относительно недорогими. Звездный час VLIW в исполнении AMD пришелся на время Radeon HD пятитысячной серии, когда дебют архитектуры Fermi от NVIDIA (GeForce 400) немного забуксовал. И неудивительно, ведь «зеленым» приходится делать огромные чипы, вплоть до трех миллиардов транзисторов. И даже сейчас, когда в адаптерах GeForce 500 архитектура Fermi уже работает на полную мощность, а топовые ускорители NVIDIA побеждают в бенчмарках продукцию AMD, шеститысячные Radeon все еще обеспечивают отличную производительность в играх.

В таком случае, зачем AMD решилась на столь резкий поворот? Казалось бы, достаточно немного отполировать дизайн GPU, нарастить вычислительных блоков тут и там, внедрить более тонкий технологический процесс — и VLIW будет жить долго и счастливо. Зачем тратить время и деньги на разработку совершенно новой архитектуры? Но дело не только и не столько в играх. GPU медленно превращаются из устройств, предназначенных исключительно для 3D-рендеринга, в процессоры общего назначения (GPGPU - general purpose GPU), которые можно использовать для любых массированных параллельных вычислений. Однако на сегодняшний день вышло так, что если мы говорим GPGPU, то подразумеваем CUDA. Ни родной для «красных» API под названием ATI Stream, ни Open CL не имеют такой популярности, как CUDA от NVIDIA. Между тем AMD очень хочет откусить кусок от этого рынка, но чтобы это стало возможным, со старой доброй архитектурой VLIW придется расстаться. Для неграфических вычислений она не подходит, ибо они менее предсказуемы, чем 3D-рендеринг, и GPU просто не в состоянии работать в полную силу.

Архитектура Graphics Core Next

Возьмем последнего представителя VLIW-архитектуры от AMD, процессор Cayman, который лежит в основе адаптеров Radeon HD 6950/6970/6990. Основным компонентом шейдерного домена у него является SIMD Engine - блок из шестнадцати потоковых процессоров. Все они одновременно исполняют одну VLIW-инструкцию, но применительно к разным данным (потому и SIMD - single instruction, multiple data). В свою очередь, в одной VLIW-инструкции может быть упаковано вплоть до четырех скалярных операций, что соответствует четырем ALU внутри одного потокового процессора.

Строительный блок ядра Graphics Cores Next (GCN) называется Compute Unit, и он устроен совершенно по-другому. В нем тоже 64 ALU, но они разделены на четыре отдельных векторных SIMD-модуля по 16 штук плюс блок планировщика. Проще говоря, раньше параллелизм был реализован за счет нескольких операций в одной инструкции, а теперь за счет нескольких отдельных SIMD-блоков. И если производительность старой архитектуры зависит от того, сколько скалярных операций компилятор может закодировать в одной VLIW-инструкции, то Compute Unit в ядре GCN может динамически распределять нагрузку между SIMD-блоками.

Нагрузка для параллельного исполнения в SIMD-блок поступает в виде массива (wavefront) из 64 инструкций, который выполняется за четыре цикла. И хотя одновременно в работе могут быть только четыре массива, еще 28 находятся у Compute Unit в прямом доступе, за счет чего планировщик и получает пространство для маневра. В ситуации, когда зависимость в коде мешает комбинированному SIMD-блоку VLIW-процессора работать на полную мощность, отдельные SIMD-блоки чипа GCN просто переключатся на другие массивы из той же задачи либо вовсе на другие задачи.

Изюминка GCN - отдельный скалярный модуль в каждом Compute Unit. Он предназначен для разовых операций, не укладывающихся в wavefront (что избавит SIMD-модули от неэффективного использования), а еще - для контроля исполнения программы: условных ветвлений, переходов и прочих событий, которые Cayman переваривал с трудом. Скалярный модуль выполняет одну операцию за цикл.

Кеш-память

Новая конструкция исполнительных модулей требует более быстрой и объемной кеш-памяти по сравнению c VLIW-дизайном. У каждого CU есть отдельный кеш L1 объемом 16 Кбайт плюс хранилище для инструкций и данных на 16 и 32 Кбайт, общее для четырех CU, - буфер для разделения данных между массивами. Еще есть полностью когерентный кеш L2, поделенный на порции по 64 Кбайт между двухканальными контроллерами памяти. В нем хранятся копии вышеупомянутых буферов

Шины кешей L1 и L2 имеют разрядность 64 байт. AMD сообщает, что пропускная способность L1 достигает почти 2 Тбайт/с, а L2 - 700 Гбайт/с, и, судя по всему, здесь имеется в виду суммарное значение для процессора с 32 CU.

Для сравнения: у Cayman каждый SIMD-модуль имеет кеш L1 объемом 8 Кбайт с шиной 16 Байт.

Обработка геометрии, растеризация

О собственно графических компонентах чипа в презентациях AMD, сопровождающих релиз, сказано немного. Судя по блок-схеме, их внутреннее устройство не изменилась, только «Тесселятор» прокачался до девятой версии и обеспечивает гигантский прирост быстродействия в соответствующих задачах.

Между тем, если верить информации из посторонних источников и слайдам самой AMD с июньского Fusion Development Summit, то изнутри Geometry Engine и Tesselator выглядят совсем по-другому. Как и Cayman, ядро GCN содержит два Graphics Engine, но если раньше они состояли из отдельных блоков для растеризации, тесселяции и так далее, то теперь в каждом GE может быть произвольное количество конвейеров для обработки пикселей и геометрических примитивов.

Вероятно, такой дизайн поможет производителю легко наращивать графическую мощь либо выпускать бюджетные GPU, урезанные по этой части. Быстрая работа с геометрией придется в современных играх как нельзя кстати.

PCI-E 3.0

Заголовок говорит за себя: AMD внедрила шину PCI-E нового поколения со вдвое большей пропускной способностью. Непонятно, нужна ли она сегодня для 3D-рендеринга, но для неграфических расчетов наверняка пригодится. AMD внесла в архитектуру GCN массу нововведений с далеким прицелом на такое применение и специальную функцию графики, которая тоже отлично сочетается с новым интерфейсом.

Новые функции GCN

В GCN есть два дополнительных блока распределения команд под названием Asynchronous Compute Engine, которые работают совершенно независимо друг от друга и графического командного процессора. AMD планирует открыть доступ к ACE через Open CL, и тогда в распоряжении программистов окажутся три отдельных устройства, каждое со своей очередью команд. Кроме того, по информации из третьих рук, ACE обеспечивает внеочередное исполнение на уровне отдельных задач. Сами CU хоть и поумнели по сравнению с SIMD-модулями VLIW-архитектуры, но могут обрабатывать свои wavefront’ы строго в прямом порядке.

Ядро GCN и центральный процессор компьютера могут иметь общее адресное пространство. В таком случае все инструкции, которые попадают на исполнение в GPU, указывают на адреса в пространстве x86-64, а он уже самостоятельно перекодирует их в адреса локальной видеопамяти при помощи специального модуля. В результате GPU получает прямой доступ к системной памяти. Кроме того, ядро GCN наделили рядом функций для поддержки языков высокого уровня: виртуальными функциями, указателями, рекурсией и так далее. Это позволит программистам писать универсальный код, пригодный для исполнения на CPU или на GPU.

Новые GPU полностью совместимы с API OpenCL 1.2, DirectCompute 11.1 (и DirectX 11.1 как таковой) и C++ AMP. Появились специальные инструкции, полезные для производства мультимедийного контента. Кроме того, чипы на базе архитектуры GCN стали первыми GPU со встроенным кодировщиком видео стандарта H.264, который можно будет использовать, как только AMD выпустит необходимую библиотеку софта.

В свою очередь, декодер приобрел поддержку нескольких дополнительных форматов: MVC, MPEG-4/DivX и Dual Stream HD + HD. Вообще, видеокарты Radeon были сильны по части воспроизведения видео еще во времена ATI. У семитысячной серии есть масса «улучшайзеров» картинки, например алгоритм Steady Video, устраняющий дрожание камеры.

Partially Resident Textures - еще один трюк с виртуальной памятью, который предназначен уже для 3D-рендеринга: приложение или шейдер работают с адресным пространством, превышающим объем набортной памяти адаптера, а она сама выступает лишь в качестве быстрого кеша. Таким образом можно использовать текстуры объемом до 32 Тбайт, порции которых GPU будет динамически подкачивать поближе к себе. Поддержка со стороны ОС в этом не требуется.

Тормоза, которые неизбежно возникнут при загрузке текстур из системной памяти, AMD отчасти компенсирует использованием MIP mapping’a. Гигантская текстура наверняка будет храниться в нескольких вариантах с различным разрешением (mipmaps). Каждый из них разделен на фрагменты объемом 64 Кбайт. Когда адаптеру требуется определенный фрагмент, и он уже есть в локальной видеопамяти, то нет проблем. Если же фрагмента не оказалось, то программа может немедленно потянуть его из системной памяти, а может отложить чтение и взять для текущего кадра соответствующую копию фрагмента с низким разрешением (если он уже есть в видеопамяти).

Небольшое дополнение к вопросу о тесселяции. В GCN реализован алгоритм Ptex (Per-face texture mapping). В общем случае в 3D-моделировании текстура накладывается на модель целиком и вершины необходимо аккуратно совмещать с нужными участками двухмерного полотна. Нетрудно представить, как аппаратная тесселяция, плодящая дополнительные вершины, усложняет задачу дизайнера. При использовании Ptex на каждый полигон накладывается отдельная текстура, в результате - никаких видимых стыков. Кроме того, Ptex позволяет упаковывать в один файл текстуры с различным разрешением.

Наконец, AMD немного поработала над анизотропной фильтрацией с целью устранить едва заметное мерцание на текстурах высокого разрешения. Изменение алгоритма не должно сказаться на быстродействии.

Контроль энергопотребления

AMD отмечает, что производители GPU и видеокарт всегда перестраховываются на счет энергопотребления и устанавливают тактовые частоты с учетом пиковой нагрузки, которая возможна лишь в самых жадных приложениях или даже в стресс-тестах (FurMark. OCCT). А в обычных играх графический процессор мог бы работать на более высокой частоте. Для того чтобы всегда выжимать из GPU максимум, предназначена технология PowerTune - калькулятор, который в реальном времени с интервалами в единицы миллисекунд рассчитывает энергопотребление карты на основе анализа выполняемой задачи (без всяких аналоговых сенсоров). И если есть возможность, тактовая частота GPU увеличивается. Заметьте, это не сброс частоты относительно номинала при достижении порога мощности, а наоборот - точно выверенный динамический разгон.

А еще ядро GCN умеет полностью отключаться, когда на экране долго ничего нет, и останавливать кулер (технология ZeroCore). В конфигурации CrossFire процессоры на дополнительных картах (и на одной - тоже) и вовсе не работают без 3D-нагрузки.

Eyefinity 2.0

Вместе с Radeon HD 7000 дебютирует вторая версия технологии Eyefinity, которая принесла массу нововведений. Многие представленные «фичи» не нуждаются в комментариях, поэтому перечислим их кратко:

  • Официально поддерживаются конфигурации с пятью дисплеями в ряд в альбомной или портретной ориентации.
  • Центральный монитор в ряду теперь может быть больше остальных по вертикали.
  • Одновременная работа Eyefinity, AMD HD3D и CrossFire.
  • Максимальное разрешение комбинированного экрана - 15х15 тысяч пикселей.
  • Произвольные разрешения.
  • Перемещение панели задач Windows на любой экран.
  • Вывод отдельных аудиопотоков на несколько дисплеев.

Новые Radeon поддерживают DisplayPort 1.2, а значит - технологию Multi-Stream. С ее помощью можно подключать к одному выходу три дисплея по цепочке или через специальный хаб. Причем на выходе хаба может быть не только DisplayPort, но и интерфейсы HDMI, DVI и VGA. AMD обещает, что хабы появятся в продаже летом 2012 года.

HDMI-выход соответствует стандарту 1.4а, поэтому может передавать двойной сигнал на 3D-телевизор с частотой 24 кадра на каждый канал. А специально для игр есть поддержка 3 GHz HDMI с частотой 60 Гц на канал.

Кроме того, стандарты DisplayPort 1.2 HBR 2 и 3 GHz HDMI пригодятся для подключения грядущих дисплеев с разрешением 4096x2160.

Radeon HD 7970

Технические характеристики

HD 7970 - одночиповый флагман линейки, представляющий архитектуру GCN во всей мощи. Его GPU называется Tahiti и содержит 32 CU (Compute Units), устройство которых подробно описано выше. Если пересчитать это на количество отдельных ALU, как AMD делала до сих пор, то получится 2048 штук - в полтора раза больше, чем в ядре Cayman! И блоков TMU (texture mapping units) в Tahiti тоже 128 против 96. Шина памяти - 384-битная вместо 256-битной. Если учесть, сколько дополнительной логики добавили в архитектуру, то совершенно не удивительно, что Tahiti состоит из 4,31 миллиарда транзисторов. Просто для сравнения: в Cayman - 2,64 миллиарда, а в GF110 от NVIDIA - три. Работает все хозяйство на частоте 925 МГц. Внешний вид, конструкция

В оформлении семитысячной серии AMD отступила от брутальных форм Radeon HD 6000 и выбрала броский дизайн с плавными линиями и глянцевой поверхностью кожуха. Вернулся узнаваемый красный текстолит, в этот раз - с малиновым оттенком. По габаритам Radeon HD 7970 не отличается от предшествующих одночиповых флагманов AMD/ATI.

Продукция кирпичного завода AMD

Карта тяжелая. Берешь в руку - и чувствуется мощь. Все дело в системе охлаждения с крупной испарительной камерой, приделанной к толстой раме. Со времен Radeon HD 6970 конструкция не претерпела больших изменений, разве что вентилятор-турбинка стал шире.

Для лучшего охлаждения с заглушки убрали один порт DVI, чтобы целиком занять слот выхлопной решеткой.

С задней стороны, как и раньше, есть прижимная крестовина. От сплошной крышки решили отказаться.

На печатной плате, как и у HD 6970, есть переключатель между основным и резервным BIOS. А еще по задней поверхности разбросано несколько мелких сдвоенных переключателей неизвестного назначения, которые мы, от греха подальше, решили не трогать. Возможно, что перед нами лишь инженерный образец HD 7970 и на серийных платах этих странных элементов уже не будет.

В хвосте платы расположены семь катушек индуктивности и восьмифазный контроллер напряжения CHiL CHL8228G, чему, без сомнения, будут рады оверклокеры, ведь о н уже использовался на картах Radeon HD 6970, . Скорее всего, и схема питания карты организована по-старому: шесть фаз приходятся на GPU и одна отдана для питания внутренних цепей микросхем GDDR5. В противоположном углу платы находится двухфазный чип uP1509P от uP Semiconductor со своей катушкой, который, по аналогии с HD 6970, должен контролировать напряжение на буферах ввода-вывода видеопамяти.