Веб-сайты

Nvidia представляет архитектуру Fermi следующего поколения

Age of Wonders 3 Let's Play

Age of Wonders 3 Let's Play
Anonim

Nvidia, возможно, переименовала свою рекламу NVISION конференции на «Технологической конференции GPU», но она по-прежнему остается показом Nvidia. Генеральный директор Jen-Hsun Huang занял некоторое время во время своего выступления, чтобы обнародовать следующую крупную архитектуру GPU компании под кодовым названием «Ферми». Это поклонники чип-графиков, которые звонили GT300, поколенному преемнику чипа GT200, который поддерживает такие карты, как GeForce GTX 285.

Гигант чипа очень осторожно позиционировал чип как не новый графический чип, а новый « вычислить и графический» чип в этом порядке (курсив мой). Фактически, почти все, что было обнаружено в новом чипе, относится к его вычислительным функциям, а не к традиционно ориентированным на графику материалам, таким как текстурные единицы и обратные концы. То, что мы знаем, это то, что чип огромен на 3,0 млрд транзисторов и будет производиться на 40-нм процессе в TSMC. Это примерно на 40 процентов больше транзисторов, чем чип RV870 на новых видеокартах Radeon 5800 DirectX 11, выпущенных только конкурирующими AMD. Чип имеет 512 процессоров (Nvidia называет их ядра CUDA), организованных в 16 "потоковых мультипроцессоров" по 32 ядра каждый. Это более чем вдвое превышает 240 ядер в GT200, а ядра также имеют значительные улучшения. Чип будет использовать 384-битный интерфейс памяти GDDR5.

Вот некоторые из основных пунктов:

Мультипроцессор потоковой передачи третьего поколения (SM)

  • 32 ядра CUDA на SM, 4x по GT200
  • 8x максимальная производительность с плавающей запятой с двойной точностью по сравнению с GT200
  • Dual Warp Scheduler, которая планирует и отправляет два искажения из 32 потоков
  • за такт
  • 64 КБ ОЗУ с настраиваемым разделением разделяемой памяти и кэшем L1

Второй Выполнение параллельного потока генерации ISA

  • Унифицированное адресное пространство с полной поддержкой C ++
  • Оптимизировано для OpenCL и DirectCompute
  • Полная IEEE 754-2008 32-разрядная и 64-разрядная точность
  • Полный 32-разрядный целочисленный путь с 64 -битные расширения
  • Инструкции по доступу к памяти для поддержки перехода на 64-разрядную адресацию
  • Улучшенная производительность через Predication

Улучшенная подсистема памяти

  • Иерархия параллельных данных NVIDIA с настраиваемыми L1 и Unified L2
  • Кэши
  • Первый GPU с поддержкой памяти ECC
  • Отличная работа с атомной памятью производительность

NVIDIA GigaThread Engine

  • 10x более быстрое переключение контекста приложения
  • Совместное выполнение ядра
  • Выполнение выполнения потока вне порядка
  • Двойные механизмы переноса памяти с перекрытием

Существует множество дополнительных функций, которые должны улучшать производительность этого чипа в задачах вычисления потока, например, намного более высокая скорость вычислений с плавающей запятой с двойной точностью. Текущие графические процессоры Nvidia вычисляют двойную точность при частичной скорости операций с одной точностью. Операции с плавающей запятой с двойной точностью должны теперь составлять половину производительности одноточечной обработки, что является большим улучшением. Большие улучшения в кешировании и планировании также очевидны. Вы можете узнать больше об архитектуре на новой странице Fermi от Nvidia, которая включает в себя PDF-документ.

Итак, когда вы сможете купить графическую карту, использующую этот чип? Nvidia не говорит. Представители компании заявили, что сейчас они «воспитывают чип», что означает, что рабочие образцы только недавно вернулись с завода по производству. Сделав просвещенную догадку из прошлой истории, мы бы сказали, что декабрь - это оптимистичная дата релиза, а Q1 2010 для широкой доступности. Ожидайте, что платы будут дорогими. Nvidia не будет разглашать размер чипа, но, судя по количеству транзисторов, мы предположили бы между 450 и 500 мм 2 . В сочетании с дополнительными расходами на плату 384-битного интерфейса памяти и проблемами с получением хорошей прибыли из такого огромного чипа на относительно новом 40-нм производственном процессе, и вы смотрите на карты, которые, вероятно, будут более мощными и дороже, чем только что выпущенные карты AMD Radeon 5800.

Следуйте за Джейсоном Кросс в Twitter или посетите его блог.