14 мая 2007 года компания AMD представила широкой публике "почти топовый" ускоритель на базе R600 – Radeon HD 2900 XT. Вскоре производитель анонсировал ускорители начального уровня Radeon HD 2600 и Radeon HD 2400.
Младшие решения, с точки зрения архитектуры GPU, представляют собой не что иное, как "остатки" от урезки полноценного чипа R600, кодовые названия которых RV630 (Radeon HD 2600) и RV610 (Radeon HD 2400).
Сегодня в нашем материале пойдет речь о трех представителях начального уровня видеоускорителей: Palit Radeon HD 2600 Pro Sonic 256 MB, Palit Radeon HD 2400 XT Sonic 256 MB и Palit Radeon HD 2400 Pro Sonic 256 MB.
Возможно, изучив нашу прошлую статью, у вас уже сложилось представление о том, какова стратегия производства плат Palit Microsystems и какие существуют их модификации.
Для тех, кто не в курсе, мы вновь коротко повторимся:
- Palit в основном использует PCB для своих плат собственного производства;
- модификации плат с маркировкой "Sonic" означают, что перед нами видеокарта с повышенными частотами и более эффективной системой охлаждения;
- модификации плат с маркировкой "Super" – увеличенный объем видеопамяти.
Итак, для начала рассмотрим основные архитектурные особенности GPU (более подробно читаем "Архитектура R600. Теория превосходства" ), на которых основаны платы Radeon HD 2600 Pro, Radeon HD 2400 XT и Radeon HD 2400 Pro.
Архитектура и основные особенности GPU RV630, RV610
Схема функциональных блоков для соответствующих чипов выглядит следующим образом:

R600

R630

R610
Полную архитектуру R600 мы наблюдаем у серии Radeon HD 2900. В наличии имеются 320 потоковых процессоров (или 64 шейдерных блока – об этой арифметике чуть ниже), 4 SIMD-блока (Single Instruction - Multiple Data), а также по 4 текстурных блока и блока записи в кадровый буфер (ROP).
В случае же RV630 мы видим элементарную редукцию – 120 потоковых процессора, 3 SIMD-блока, 2 текстурника и всего один ROP. Все остальные блоки и технологии на месте, поэтому HD 2600 можно считать прямым наследником HD 2900. Тут же стоит отметить частоту ядра видеокарты Radeon 2600 Pro – 600 МГц и тот факт, что все модули ядра работают на этой частоте. Для сравнения: шейдерный домен G84 спокойно работает на частоте 1.4 ГГц, чем уже практически удваивает свою производительность по сравнению с решением AMD. Память, работающая у Radeon HD 2600 Pro на 400 МГц, соединена с ядром по 128-битной шине с архитектурой Ring Bus (дословно – кольцевая шина).

Как и контроллер памяти, переработке подвергся специфический для решений AMD модуль под названием Ultra-Threaded Dispatch Processor, или диспетчер потоков. Как и следует из названия, этот модуль ответственен за распределение нагрузки на исполнительные блоки, в первую очередь на потоковые процессоры. Ведь унифицированная шейдерная архитектура с ее гибкостью и возможностью исполнения на одних и тех же блоках различных операций предъявляет серьезные требования к модулю распределения вычислений, которым и является диспетчер потоков. Здесь мы также видим и слабое место архитектуры – даже при заявленном количестве одновременно выполняемых потоков, составляющем тысячи, эффективность архитектуры сильно зависит от софтверной оптимизации. Чем больше на вход диспетчера поступит инструкций, выполнение которых можно распараллелить, тем быстрее будет происходить рендеринг. Таким образом, оптимизацией инструкций на уровне драйвера и самого приложения (игры) можно добиться очень и очень многого.

Совершенно уникальными особенностями R600/630 являются блоки тесселизации и встроенный аудиокодек, новый адаптивный алгоритм антиалиасинга, выделенный DMA-контроллер системной (!) памяти для работы со свопингом текстур, новый аппаратный видеодекодер и многие другие вещи. О них мы подробнее поговорим ниже, пока же остановимся на сравнении анонсированных карт линейки.
При создании RV610 в AMD пошли на упрощение основной архитектуры. Помимо уменьшенного до 40 числа потоковых процессоров и до двух – SIMD-модулей (текстурные и ROP-блоки представлены в единственном числе), чип включает в себя упрощенный кэш текстур и не содержит иерархический Z-буфер. И если последний способ экономии транзисторов уже применялся в более ранних решениях AMD, то в случае кэш инженеры пошли на интересное совмещение – в кэше первого уровня складируются как пиксельные, так и вертексные данные. А второго уровня текстурного кэша у RV610 вовсе нет.
В итоге мы видим, что о масштабируемости в AMD позаботились просто прекрасно. Приятно также, что с первого дня вся информация о конкретных изменениях от старшей к младшей модели доступна всем желающим.
|
Чип
|
R600
|
RV630
|
RV610
|
|
Число транзисторов, млн
|
720
|
390
|
180
|
|
Диапазон частот чипа, МГц
|
740-800
|
600-800
|
525-700
|
|
Теоретическая производительность, ГФлоп/c
|
475
|
144-192
|
42-56
|
|
Скорость заполнения, млрд пикс./с
|
47.5
|
14.4-19.2
|
4.2-5.6
|
|
Скорость обработки полигонов, млн треугольников/с
|
740
|
600-800
|
262-350
|
|
Число потоковых процессоров
|
320 (64)
|
120 (24)
|
40 (8)
|
|
Число текстурных блоков
|
4
|
2
|
1
|
|
Число блоков записи в кадровый буфер
|
4
|
4
|
1
|
|
Память типа GDDR4
|
+
|
+
|
-
|
|
Память типа GDDR3
|
+
|
+
|
+
|
|
Память типа DDR2
|
-
|
+
|
+
|
|
Объем памяти, MB
|
512/1024
|
256
|
128/256
|
|
Шина памяти, бит
|
512
|
128
|
64
|
|
Частота памяти, МГц
|
825 - 1000
|
400-1100
|
400-800
|
|
Пропускная способность памяти, GB/s
|
106 - 128
|
12.8-35.2
|
6.4-12.8
|
|
Энергопотребление карты, Вт
|
215
|
45
|
25
|
|
Поддержка выходов
|
2x Dual Link DVI, Video-Out
|
2x Dual-Link DVI, Video-Out
|
D-Sub, DVI, Video-Out
|
|
HDMI со звуком
|
+
|
+
|
+
|
|
Техпроцесс, нм
|
80
|
65
|
65
|
Следует отдельно отметить, что урезанные модификации будут обходиться компании значительно дешевле топовой не только благодаря уменьшенному числу транзисторов и упрощенной архитектуре, но и благодаря более совершенному 65 нм техпроцессу. Флагман Radeon HD 2900 пока не планируется переводить на 65 нм, очевидно, AMD и не планирует продавать слишком много этих карт, делая ставку на традиционно прибыльный mainstream-сегмент.