AMD Bulldozer

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 18:01, 5 мая 2016.
AMD Bulldozer
AMD-Bulldozer-2.png
Производство: С Сентября 2011 по настоящее время
Производители:
  • AMD
Частота CPU: 3.3 GHz — 4.5 GHz
Частота HT: до 1866 MHz
Технология производства: 32 nm
ISA: x86-64
Число ядер: 4, 6, 8
Разъемы:

Bulldozer — кодовое название новой процессорной архитектуры процессоров AMD64 от компании AMD, семейства 15h, изготавливаемых по 32-нм технологии и предназначенных для серверов и высокопроизводительных ПК. Во втором квартале 2010 года AMD получила первые образцы 32 нм процессоров с архитектурой Bulldozer. Серийный выпуск процессоров архитектуры Bulldozer начался в сентябре 2011 года. Процессоры Bulldozer были заменены процессорами архитектуры Trinity.

Общие сведения

Для производства AMD FX используется 32-нанометровый техпроцесс с технологией SOI, аналогичный применяемому при изготовлении APU Llano. Чипы выпускаются на мощностях родственной компании GlobalFoundries. В основе CPU лежит восьмиядерный кристалл площадью 315 мм2. Согласно топологии, большая его часть отводится под кеш-память, потому неудивительно, что суммарное количество транзисторов в данном случае составляет впечатляющие 2 млрд. Для сравнения: шестиядерные Phenom II X6 (Thuban) включают «всего» 904 млн транзисторов, но из-за 45-нанометрового техпроцесса площадь кристалла равна 346 мм2.

AMD решила использовать совершенно другой подход для архитектуры Bulldozer. Было решено создать двухядерные модули, которые вместе используют некоторые ресурсы (L2 кэш-память, модуль вычислений с плавающей запятой), но не являются полностью независимыми друг от друга.

Восемиядерный процессор на архитектуре Bulldozer.

По словам AMD это было сделано в целях оптимизации процессора и в то же время для уменьшения цены процессора. Оптимизация заключается в том, что на обычных многоядерных процессорах, некоторые модули могут бездействовать, и такие модули могут быть объединены в архитектуре Bulldozer. А если будет меньше модулей – значит, будет меньше потрачено материала, а это, в свою очередь, позитивно повлияет на стоимость, на экономию энергии и на уменьшение количества тепла. Поэтому, хоть процессоры AMD на архитектуре Bulldozer и называются двухъядерными, на самом деле они не являются истинно таковыми, поскольку у них нет полностью независимых ядер. Для создания "четырехъядерных процессоров", используются два таких блока, так что процессор фактически имеет два "процессора" внутри, а не четыре.

Модули Fetch и Decode

Модули Flech и Decode

Модуль выборки Fetch отвечает за получение инструкций для декодирования из кэш памяти или из оперативной памяти.

Как уже было замечено, модули выборки используют сразу два “ядра”. Кэш инструкции L1 также используются двумя ядрами одновременно, но каждое процессорное ядро имеет свой собственнуый кэш данных L1. Кэш инструкции L1, используемые в архитектуре Bulldozer, состоят из двухканального множественно-ассоциативного кэша объемом 64 Кб. Та же конфигурация используются в процессорах с архитектурой AMD64, но с разницей, что процессоры AMD64 имеют кэш-памяти L1 на каждое ядро, а процессоры Bulldozer один кэш-памяти L1 на каждую пару ядер. Однако, кэш данных имеет только 16 КБ, что значительно меньше, чем 64 КБ для каждого ядра, которые используются в процессорах на основе архитектуры AMD64.

TLBs (Translation Look-aside Buffer – буфер сверхбыстрой памяти) – это буферы, с небольшим объемом памяти, предназначенные для преобразования виртуальных адресов памяти, в физические адреса. Виртуальная память, больше известная как файл подкачки, это технология, где объем оперативной памяти «увеличивается» за счет специального файла на жестком диске. Программы для компьютера пишутся с использованием инструкций x86, но в настоящее время процессоры понимают только собственные RISC инструкции. Модуль декодирования отвечает за преобразование x86 инструкций программ, в RISC микрокоманды. Архитектура Bulldozer имеет четыре декодера, но в данный момент не известно, какие инструкции выполняет каждый декодер. Обычно один из этих декодеров выполняет сложные комплексные инструкции, используя предоставленный микрокод ROM. Декодирование сложных инструкций завершается через несколько тактов, после чего они преобразовываются в несколько микрокоманд.

Производители оптимизируют свои процессоры таким образом, что при декодировании наиболее распространенных инструкций – они выполнялись всего за один такт.

После декодирования инструкций, они направляются в соответствующий планировщик модуля целочисленных операций или операций с плавающей точкой. Архитектура Bulldozer имеет только один вычислительный модуль с плавающей точкой для двух ядер. Но, в то же время, имеются два совершенно независимых модуля целочисленных операций для каждого ядра. Из рисунка мы можем видеть, что каждый целочисленный модуль содержит такие исполнительные блоки:

  • EX, MUL – может выполнять любые целочисленные операции, кроме деления.
  • EX, DIV – может выполнять любые целочисленные операции, но не умножение.
  • Agen – модуль генерации адресов, известный как AGU или Address Generation Unit. Используется для генерации адресов, требуемых для загрузки данных.

Семейства

Первым семейством процессоров микроархитекуры Bulldozer стало настольное семейство Zambezi во 2 квартале 2011 года под Socket AM3+, производством которого занимается компания-подрядчик GlobalFoundries. Zambezi выполнены по 32 нм техпроцессу; первыми появились 8-ядерные с TDP от 95 до 125 Вт в зависимости от тактовой частоты и 8 Мб кэш-памяти L2, затем 6- и 4-ядерные с TDP 95 Вт и с 6 и 4 Мб L2 кэша соответственно.

В последней четверти 2011 года появилось семейство Orochi. 8-ядерные процессоры семейства Orochi получат 16 Мб общей кэш-памяти. Оба семейства будут иметь двухканальный контроллер памяти DDR3.

В 3 квартале 2011 года был намечен выпуск процессоров Interlagos, которые имеют 16 вычислительных ядер, четырёхканальный контроллер памяти DDR3. Также в 2011 году выпущено менее мощное семейство Valencia с поддержкой двухканальной памяти DDR3.

Мобильная версия процессоров архитектуры Bulldozer ожидается в 2012 году. Первые мобильные чипы на базе Bulldozer получат кодовое наименование Trinity, до 4 ядер APU и GPU с поддержкой DirectX 11.

В этом же году AMD хотела выпустить серверные чипы Terramar и Sepang, которые имели бы до 20 ядер, техпроцесс 32 нм, интегрированный 4-канальный контроллер памяти DDR3 и контроллер PCI Express 3.0. Но планы изменились, и теперь AMD готовит другие серверные CPU — Abu Dhabi, в состав которых входит до 16 ядер Piledriver (наследники Bulldozer), а для двухсокетных серверов припасены чипы под названием Seoul, включающие в себя до 8 указанных ядер.

Летом 2013 года AMD объявила о процессоре AMD FX-9590 с частотой до 5 ГГц (Turbo).

Процессоры

Таблица процессоров:

Модель FX-8170 FX-8150 FX-8120 FX-8100 FX-6200 FX-6130 FX-6120 FX-6100 FX-4200 FX-4170 FX-4150 FX-4130 FX-4120 FX-4100
Кодовое Имя Zambezi
Ядра/Модули 8/4 6/3 4/2
Штатная Частота 3.9 GHz 3.6 GHz 3.1 GHz 2.8 GHz 3.8 GHz 3.6 GHz 3.6 GHz 3.3 GHz 3.3 GHz 4.2 GHz 3.8 GHz 3.8 GHz 3.9 GHz 3.6 GHz
В режиме Turbo 4.5 GHz 4.2 GHz 4.1 GHz 3.7 GHz 3.9 GHz 3.9 GHz 4.3 GHz 4.1 GHz - 4.3 GHz 3.8 GHz 3.9 GHz 4.0 GHz 3.7 GHz
Кэш 2 уровня 8MB 6MB 4MB
Кэш 3 уровня 8MB 4MB 8MB
Тепловыделение (TDP) 125W 95W 125W 95W 125W 95W 125W 95W
Память максимальная частота памяти 1866 MHz
Версия Black Edition Да
Поддержка Turbo Core Да Нет Да
Сокет AM3+
Техпроцесс 32 nm

Технология Turbo Core

Технология динамического увеличения частоты Turbo Core ранее использовалась компанией AMD для шестиядерных Thuban и APU Llano. Процессоры FX имеют новый механизм и алгоритм работы данной функции. В случае, когда под нагрузкой энергопотребление чипа укладывается в рамки его TDP, а температура не превышает заданного значения, частота может автоматически увеличиваться (100–300 МГц) даже в ситуации, когда активны все ядра (All Core Boost). Если же как минимум половина модулей простаивают, то AMD FX может переходить в режим Max Turbo Boost, повысив напряжение питания и весьма значительно тактовую частоту работающих блоков (до 900 МГц).

AMD также озаботилась улучшением экономичности новых чипов. Учитывая рост количества вычислительных ядер, полагаться только на эффект от использования более тонкого техпроцесса нельзя. При отсутствии нагрузки на оба процессорных ядра в рамках одного модуля и переходе их в состояние энергосбережения C6 силовые транзисторы позволяют отключать питание от данного узла, снижая общее потребление CPU.

Источники

  1. http://hardwareguide.ru/ AMD Bulldozer
  2. http://compress.ru/ AMD Bulldozer
  3. http://www.amd.com/ AMD FX™ Processors
  4. http://www.cpu-world.com/ AMD Bulldozer processor families
  5. http://itc.ua/ AMD Bulldozer: универсальная архитектура на вырост