Age of Wonders 3 Let's Play
Гигант чипа очень осторожно позиционировал чип как не новый графический чип, а новый « вычислить и графический» чип в этом порядке (курсив мой). Фактически, почти все, что было обнаружено в новом чипе, относится к его вычислительным функциям, а не к традиционно ориентированным на графику материалам, таким как текстурные единицы и обратные концы. То, что мы знаем, это то, что чип огромен на 3,0 млрд транзисторов и будет производиться на 40-нм процессе в TSMC. Это примерно на 40 процентов больше транзисторов, чем чип RV870 на новых видеокартах Radeon 5800 DirectX 11, выпущенных только конкурирующими AMD. Чип имеет 512 процессоров (Nvidia называет их ядра CUDA), организованных в 16 "потоковых мультипроцессоров" по 32 ядра каждый. Это более чем вдвое превышает 240 ядер в GT200, а ядра также имеют значительные улучшения. Чип будет использовать 384-битный интерфейс памяти GDDR5.
Вот некоторые из основных пунктов:
Мультипроцессор потоковой передачи третьего поколения (SM)
- 32 ядра CUDA на SM, 4x по GT200
- 8x максимальная производительность с плавающей запятой с двойной точностью по сравнению с GT200
- Dual Warp Scheduler, которая планирует и отправляет два искажения из 32 потоков
- за такт
- 64 КБ ОЗУ с настраиваемым разделением разделяемой памяти и кэшем L1
Второй Выполнение параллельного потока генерации ISA
- Унифицированное адресное пространство с полной поддержкой C ++
- Оптимизировано для OpenCL и DirectCompute
- Полная IEEE 754-2008 32-разрядная и 64-разрядная точность
- Полный 32-разрядный целочисленный путь с 64 -битные расширения
- Инструкции по доступу к памяти для поддержки перехода на 64-разрядную адресацию
- Улучшенная производительность через Predication
Улучшенная подсистема памяти
- Иерархия параллельных данных NVIDIA с настраиваемыми L1 и Unified L2
- Кэши
- Первый GPU с поддержкой памяти ECC
- Отличная работа с атомной памятью производительность
NVIDIA GigaThread Engine
- 10x более быстрое переключение контекста приложения
- Совместное выполнение ядра
- Выполнение выполнения потока вне порядка
- Двойные механизмы переноса памяти с перекрытием
Существует множество дополнительных функций, которые должны улучшать производительность этого чипа в задачах вычисления потока, например, намного более высокая скорость вычислений с плавающей запятой с двойной точностью. Текущие графические процессоры Nvidia вычисляют двойную точность при частичной скорости операций с одной точностью. Операции с плавающей запятой с двойной точностью должны теперь составлять половину производительности одноточечной обработки, что является большим улучшением. Большие улучшения в кешировании и планировании также очевидны. Вы можете узнать больше об архитектуре на новой странице Fermi от Nvidia, которая включает в себя PDF-документ.
Следуйте за Джейсоном Кросс в Twitter или посетите его блог.
Исследователи помогают определить социальную сеть следующего поколения

Академики, собравшиеся на ежегодном мероприятии в Microsoft, обсудили недостатки существующих социальных сетей.
Набор Nintendo Crowns Набор микросхем Nvidia для карманных компьютеров DS следующего поколения

Nvidia предоставит мобильный компьютер на кристалле, который будет использовать следующий ген Nintendo видеокарты карманных компьютеров.
Генеральный директор Intel следующего поколения должен попасть в устройства следующего поколения

С Брайаном Кржаничем и его производственным мастерством у руля Chipzilla, ожидайте, что он продолжит пытаться выстроить конкуренцию.