Новая унифицированная архитектура, разработанная компанией NVIDIA (впервые была применена в чипах G80), как показала практика, оказалась весьма мощной, продемонстрировала высокую степень масштабируемости и возможные горизонты дальнейшего развития.
Разработка технологий выращивания более тонких по структуре кристаллов – процесс весьма трудоемкий и может встретить ряд значительных технических сложностей, преодоление которых - лишь процесс кропотливой отладки техпроцесса. После официального анонса видеоускорителей, совместимых с DirectX 10 (9 ноября 2006 года), прошло чуть меньше года, и компания NVIDIA представляет новое поколение видеокарт на базе чипов G92 (дата официального анонса - 29 октября 2007 года).
Признаться честно, это несколько не то, чего ожидали от американской компании. Рискнем предположить, что NVIDIA планировала полностью заменить топовый G80 соответствующим топовым G92, однако на практике у них этого не получилось (проблемы выхода годных чипов, работающих на достаточно высоких частотах), и производитель решил анонсировать Middle-end решения совершенно нового звена.
Новая плата, скажем, забегая вперед, в плане производительности получилась просто отменной - по своей вычислительной мощности она недалеко ушла от флагмана прошлого поколения GeForce 8800 GTX и заткнула за пояс две версии GeForce 8800 GTS (G80)!
Новинки GeForce 8800 GT стали покупаться, как горячие пирожки на Рождество, и все это благодаря рекомендованным ценам, установленным NVIDIA на данный класс видеокарт. Поэтому с самого начала анонса GeForce 8800 GT моментально стала дефицитом, а производители не успевали ее штамповать. Благо ситуация с тех пор изменилась, однако интерес к данному классу видеоускорителей остается по-прежнему довольно высоким.
Сегодня в нашей лаборатории побывала Palit GeForce 8800 GT Sonic 512 MB, поэтому у нас появилась возможность проанализировать результаты производительности новоиспеченного чипа.
Итак, начнем по порядку, а именно с архитектуры.
Чип G92 – изменения не только в техпроцессе?
В своем официальном пресс-релизе NVIDIA не дает однозначного ответа – имеет ли G92 кардинальные отличия от G80. После детального изучения данного вопроса выяснилось, что G92 по своей структуре унифицированных блоков ничем практически не отличается от таковой G80 (изменения лишь коснулись блоков TMU – об этом читаем ниже).
Что же касается "математики" унифицированных блоков, то она получилась таковой: 8800 GT имеет 112 потоковых процессоров, к примеру, у флагмана прошлого поколения 8800 GTX их только 128. А вот шина доступа к памяти у 8800 GT – 256-битная (у 8800 GTX –384-битная). Получается, что новый Middle-end чип по количеству функциональных блоков недалеко ушел от G80, и лишь вызывает подозрение узкая шина 8800 GT – не станет ли серьезной причиной падения производительности относительно своих собратьев с более широкой шиной? С этим мы разберемся далее, а пока взглянем на блок-схему G92, для сравнения приведем также и G80:

G92

G80
Ядро G92 состоит из 754 миллионов транзисторов (у G80 их 681 млн (!)). GPU работает частоте 600 МГц для стандартной NVIDIA GeForce 8800 GT 512 MB.
На блок-схеме мы видим 7 шейдерных блоков, в каждом из которых сосредоточены: 16 потоковых процессоров (Streaming Processor) (итого получается 112=16*7) и 8 текстурных блока (7*8=56).
Все потоковые процессоры 8800 GT работают с тактовой частотой 1500 МГц, более чем вдвое превышающие частоты GPU.
Напоследок отметим блоки записи в кадровый буфер (ROP), которых в данном случае 4 (на диаграмме - синие блоки рядом с кешем L2).
В работу и концепции построения потоковых процессоров (SP) NVIDIA не вносила никаких поправок, да и зачем – все и так прекрасно сработано :).

G80

G92
На диаграмме при сравнении с G80 видно, что на каждые четыре потоковых процессора приходится два модуля адресации текстур TA и по два модуля фильтрации текстур TF (у G80 это было 1 к 2). Поэтому теперь каждый текстурный блок в связи с увеличением числа вычисляемых текстурных адресов сможет обрабатывать вдвое больше выборок, чем таковой G80.
Каждый шейдерный блок снабжен собственным кешем первого уровня L1. В нем могут храниться не только текстуры, но и в связи с унифицированностью различного рода данные. Все потоковые процессоры G92 подобно G80 являются полностью скалярными.
Как уже говорилось, у GeForce 8800 GT имеются в наличии 4 блока записи в кадровый буфер (ROP).
Они не претерпели каких-либо изменений относительно GeForce 8800 GTX и поддерживают следующие методы антиалиасинга: мультисэмплинг, суперсэмплинг и адаптивное сглаживание.
Помимо этого, в видеокартах серии GeForce 8800 GT реализованы аналогичные технологии, используемые в прошлом поколении чипов GeForce 8800:
NVIDIA Lumenex - включает в себя новые методы сглаживания 8x, 8xQ, 16х, 16xQ, сравнимые по скорости и превосходящие по качеству традиционный 4x FSAA. Полное название такого метода – CSAA (Coverage Sampling Antialiasing).
NVIDIA Quantum Effects – еще одна технология, использующая мощности G92 для реализации расчетов физических взаимодействий. Кроме того, вычислительные ресурсы чипа можно задействовать для решения сложных задач моделирования и математических расчетов. Вычисления с плавающей запятой выполняются в формате IEEE 754. (специальный стандарт на операции с плавающей запятой (точкой) разработанный институтом инженеров по электротехнике и электронике в 1985 году).
Также никуда не делась и реализация специального AP, посредством которого сторонние программисты с легкостью могут разрабатывать софт, который будет использовать аппаратное ускорение в лице все той же GeForce 8800 GT, ну а со временем - какой-либо ее преемницы.
PureVideo и PureVideo HD
Не забыла NVIDIA любителей высококачественного видео и HD-видео. В ядро встроена поддержка уже давно всем знакомой технологии PureVideo (для улучшенной обработки видео), а также - PureVideo HD. Последняя поддерживает форматы HD DVD и Blu-ray и предназначена освободить центральный процессор от тяжкого бремени декодирования видеоинформации посредством встроенного декодера форматов H.264, VC-1, WMV/WMV-HD и MPEG-2 HD.
Extreme High Definition Gaming (XHD) – эта технология позволяет играть в игры на широкоформатных дисплеях при экстремальных HD-разрешениях вплоть до 2560х1600 пикселей.
Ну а из нововведений в G92 в перечне технологий можно отметить также поддержку шины PCI Express 2.0.
Во второй ревизии PCI Express значительно увеличилась пропускная способность канала - до 5 Гбит/с (PCI Express 1.x – 2.5 Гбит/с). Это означает, что теперь для линии x16 максимальная скорость передачи данных может достигать 8 GB/s в обоих направлениях против 4 GB/s для старого PCI Express 1.х.
Примечательным фактом является то, что PCI Express 2.0 полностью совместим с PCI Express 1.1. На деле это означает, что старые видеокарты будут спокойно работать в системных платах с новыми разъемами, и новые видеоадаптеры станут без проблем работать в старых разъемах стандарта PCI Express 1.х.
Напоследок ознакомимся с официальными техническими характеристиками GeForce 8800 GT:
-
кодовое название чипа - G92;
-
технологический процесс изготовления - 65 нм;
-
количество транзисторов - 754 млн;
-
частота работы ядра - 600 МГц;
-
112 унифицированных скалярных процессоров, работающих на частоте 1500 МГц;
-
56 блоков текстурной фильтрации с поддержкой операций с плавающей запятой FP16 и FP32;
-
4 блока записи в кадровый буфер (ROP), (8 накладываемых текстур за проход);
-
ширина шины памяти – 256 бит;
-
объем видеопамяти - 512 МВ типа GDDR3 с частотой 1800 МГц DDR;
-
полоса пропускания памяти - 57,6 GB/s;
-
аппаратная поддержка - АРI Direct X10, Shader Model 4.0, а также OpenGL 2.1;
-
поддерживаемый интерфейс шины - PCI-Express x16 rev 2.0;
-
возможность организации массива из двух/трех видеокарт NVIDIA SLI;
-
аппаратное декодирование видео - PureVideo;
-
аппаратное декодирование видео высокой четкости - PureVideo HD;
-
интерфейсы - 2x DVI Dual Link, HDMI, HDTV;
-
2x RAMDAC 400 МГц;
-
интегрированная в ядро поддержка TV-выхода.
Мы рассмотрели архитектуру и основные технологические возможности чипа с кодовым названием G92, и теперь остается разобраться уже с модификациями видеокарт на основе новейшего GPU, а также его конкурентами:
Видеокарта |
NVIDIA GeForce 8800 GTX |
NVIDIA GeForce 8800 GTS |
NVIDIA GeForce 8800 GT |
Palit GeForce 8800 GT Sonic |
NVIDIA GeForce 8600 GTS |
AMD Radeon HD 3870 |
AMD Radeon HD 3850 |
AMD Radeon HD 2900 XT |
Наименование чипа |
G80 |
G80 |
G92 |
G92 |
G84 |
R670 |
R670 |
R600 |
Техпроцесс |
90 нм |
90 нм |
65 |
65 |
80 нм |
55 нм |
55 нм |
80 нм |
Количество транзисторов |
681 млн |
681 млн |
754 млн |
754 млн |
289 млн |
666 млн |
666 млн |
700 млн |
Тактовые частоты чипа, МГц |
575 |
500 |
600 |
650 |
675 |
775 |
670 |
740 |
Тактовые частоты шейдерного домена, МГц |
1350 |
1200 |
1500 |
1620 |
1450 |
775 |
670 |
740 |
Эффективная частота памяти, МГц |
1800 |
1600 |
1800 |
1900 |
2000 |
2250 |
1660 |
1650 |
Максимальная пропускная способность памяти, GB/s |
86.4 GB/c |
32/64 GB/c |
57.6 |
57.6 |
32 |
72 GB/c |
53 GB/c |
106 GB/c |
Объем и тип используемой памяти |
768 МB GDDR3 |
320/640 МB GDDR3 |
256/512/1024 МB GDDR3 |
256/512/1024 МB GDDR3 |
256/512/1024 МB GDDR3 |
512 МВ/ 1 GB GDDR4 |
256 МВ/ 512 GB GDDR3 |
512 МВ/ 1 GB GDDR4 |
Количество универсальных процессоров |
128 |
96 |
112 |
112 |
32 |
320 |
320 |
320 |
TMU (текстурные блоки) |
32 |
24 |
56 |
56 |
16 |
16 |
16 |
16 |
ROP (пикс/такт) |
20 |
20 |
4 |
4 |
8 |
16 |
16 |
16 |
Филлрейт, теоретический (Mpix) |
13800 |
10000 |
9600 |
9.6 |
5400 |
12400 |
10700 |
12000 |
Тексельрейт, теоретический (Mtexels) |
18400 |
12000 |
33600 |
33.6 |
10800 |
12400 |
10700 |
12000 |
Полноэкранное сглаживание |
MSAA 2х, 4х, 8х CSAA 2x-16x |
MSAA 2х, 4х, 8х CSAA 2x-16x |
MSAA 2х, 4х, 8х CSAA 2x-16x |
MSAA 2х, 4х, 8х CSAA 2x-16x |
MSAA 2х, 4х, 8х CSAA 2x-16x |
MSAA 2х, 4х, 8х и CFAA до 24x |
MSAA 2х, 4х, 8х и CFAA до 24x |
MSAA 2х, 4х, 8х и CFAA до 24x |
Анизотропная фильтрация (AF) |
2х, 4х, 8х, 16х |
2х, 4х, 8х, 16х |
2х, 4х, 8х, 16х |
2х, 4х, 8х, 16х |
2х, 4х, 8х, 16х |
2х, 4х, 8х, 16х |
2х, 4х, 8х, 16х |
2х, 4х, 8х, 16х |
Ширина шины памяти, бит |
384 |
320 |
256 |
256 |
128 |
256 |
256 |
512 |
Интерфейс |
PCI-E х16 |
PCI-E х16 |
PCI-E х16 v2.0 |
PCI-E х16 2.0 |
PCI-E х16 |
PCI-E х16 v2.0 |
PCI-E х16 v2.0 |
PCI-E х16 |
Версия DirectX |
10 |
10 |
10 |
10 |
10 |
10.1 |
10.1 |
10 |
Версия вершинных шейдеров |
4.0 |
4.0 |
4.0 |
4.0 |
4.0 |
4.1 |
4.1 |
4.0 |
Версия пиксельных шейдеров |
4.0 |
4.0 |
4.0 |
4.0 |
4.0 |
4.1 |
4.1 |
4.0 |
Разъемы |
TV-Out 2 x DVI Dual Link HDTV |
TV-Out 2 x DVI Dual Link HDTV
|
TV-Out 2 x DVI Dual Link, HDTV |
TV-Out 2 x DVI Dual Link, HDTV |
TV-Out 2 x DVI Dual Link, HDTV |
TV-Out 2 x DVI Dual Link HDTV
|
TV-Out 2 x DVI Dual Link HDTV
|
TV-Out 2 x DVI Dual Link HDTV
|
RAMDAC, МГц |
2х 400 |
2х 400 |
2х400 |
2х400 |
2х400 |
2х 400 |
2х 400 |
2х 400 |
Аппаратное декодирование H264/WMV |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
Максимальное разрешение |
2560х1600 @85 Hz |
2560х1600 @85 Hz |
2560х1600 @85 Гц |
2560х1600 @85 Гц |
2560х1600 @85 Гц |
2560х1600 @85 Hz |
2560х1600 @85 Hz |
2560х1600 @85 Hz |
* Количество пиксельных и вершинных конвейеров соответственно.
Согласно "прайсам" NVIDIA, рекомендуемые цены на GeForce 8800 GT составляют:
Как видите, GeForce 8800 GT будет выпускаться в двух модификациях – с различным объемом видеопамяти. Платы будут различаться не только объемами фреймбуфера, но и результирующей частотой памяти. Для рефренсной видеокарты с 512 МВ на борту частота будет составлять 1800 МГц, для 256 МВ – 1400 МГц.
Что же касается конкурентов NVIDIA GeForce 8800 GT (соответствующего ценового сегмента), то он со стороны AMD представлен в лице AMD Radeon HD 3870. Последняя может похвастаться высокой тактовой частотой процессора/памяти и 320 потоковыми процессорами. В целом конкурент получился весьма достойный, впрочем, красивые характеристики – это еще далеко не показатель превосходства.
Так в чем же причина такого огромного спроса на NVIDIA GeForce 8800 GT? Для этого лишь стоит взглянуть на результаты тестов и на конечную стоимость продукта - тогда все становится на свои места. Окончательные выводы и результаты тестов мы озвучим ниже, а пока рассмотрим внимательнее конкретный экземпляр GeForce 8800 GT в исполнении Palit.