AMD Accelerated Processing Unit

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 22:14, 22 мая 2016.
AMD Accelerated Processing Unit
AMD logo.jpg
Дизайнер Advanced Micro Devices(AMD)
Представлен 2011
Кодовое имя

Fusion
Desna
Ontario
Zacate
Llano
Hondo
Trinity
Weatherford
Richland
Kaveri
Kabini
Temash
Carrizo
IGP
Wrestler
WinterPark

BeaverCreek
Архитектура AMD64
Модели

Desktop E2 Series
Desktop A4 Series
Desktop A6 Series
Desktop A8 Series
Desktop A10 Series

Notebook A, E and C Series
Ядра 2 to 4
Изготовления процессора и транзисторов

32 nm 1.178b (Llano)
32 nm 1.303b (Trinity)
32 nm 1.3b (Richland)

28 nm 2.41b (Kaveri)
Оказание поддержки
Direct3D Direct3D 12
OpenCL 1.2
OpenGL 4.1+

AMD Accelerated Processing Unit (англ.  accelerated processor unit, APU — букв. «ускоренный процессор»; «процессор с видеоускорителем») — ранее известный как Fusion , это маркетинговый термин для серии 64-разрядных микропроцессоров от AMD , предназначенных для работы в качестве центрального процессора(CPU) и графического ускорителя (GPU) на одном кристалле.

Результатом этого являются снижение общего энергопотребления и стоимости системы за счёт сокращения числа комплектующих, унификации технологии. Гибридные процессоры позволят создавать компактные системы (в частности, отпадает необходимость в северном мосте), пригодные для большинства, не требующих мощной графики, задач.

История

Разработка технологии «Fusion» стала возможной после покупки канадской компании ATI компанией AMD, которая состоялась 25 октября 2006 года. Изначально предполагалось, что эта технология будет дебютировать во второй половине 2009 года как преемник последней процессорной архитектуры.[1]

В июне 2006 года сотрудник AMD Генри Ричард (англ.  Henri Richard) дал интервью сайту DigiTimes, в котором намекнул на будущую разработку нового процессора[2].

В интервью Марио Риваса (англ.  Mario Rivas) с CRN.com он заявляет: «С программой Fusion компания AMD надеется предоставить многоядерные продукты, используя разные типы процессорных блоков. Например, GPU будет выделяться во многих задачах с параллельным вычислением, в то время как центральный процессор возьмёт на себя тяжёлую работу по перемалыванию чисел. Fusion-процессоры с CPU и GPU, интегрированными в одной архитектуре, должны сделать жизнь системных программистов и разработчиков приложений намного проще»[3].

Компания AMD перенесла выпуск гибридного процессора Fusion на 2011 год. Ранее считалось, что калифорнийский разработчик представит процессор с интегрированным ядром на основе 45-нанометрового техпроцесса уже в начале 2010 года. Однако новый роадмап AMD отодвигает появление Fusion на целый год, до появления 32-нанометровой продуктовой линейки. В данный момент AMD планирует две модификации Fusion — Llano с четырьмя ядрами и 4 Мб кэш-памяти и Ontario с двумя ядрами и 1 Мб кэш-памяти.[4]

Первое поколение настольных и переносных компьютеров APU, под кодовым названием Llano , было объявлено 4 января 2011 года на 2011 CES в Лас - Вегасе и выпущен вскоре после этого . [5] [6] Микропроцессоры «Llano», построенные на архитектуре AMD Fusion, состояли из четырёх ядер класса Phenom II с 4 Мб кэш-памяти L3 и контроллером DDR3 1600 МГц, а также с графическим ядром с поддержкой Direct3D 11 и шиной PCI Express 2.0 для внешней видеокарты. Данные микропроцессоры производились по 32-нанометровому техпроцессу.

На конференции в январе 2012 года, корпоративный сотрудник Фил Роджерс сообщил , что AMD будет ребрендинг платформы Fusion в качестве архитектуры гетерогенных систем (HSA), заявив , "it's only fitting that the name of this evolving architecture and platform be representative of the entire, technical community that is leading the way in this very important area of technology and programming development. ". [7] Тем не менее, позже выяснилось , что AMD была предметом нарушения товарного знака швейцарской компании Arctic, которая использовала имя "Fusion" для линии электропитания .[8]

Второе поколение ACU, под кодовым названием Trinity было объявлено в Financial Analyst Day от AMD 2010 [9] и выпущено в октябре 2012 года. [10] AMD выпустила новый APU основанный на Piledriver микроархитектуры 12 марта 2013 для ноутбуков / Mobile и 4 июня 2013 года для настольных ПК под кодовым именем Richland.[11] Во втором поколении APU для маломощных устройств, Brazos 2.0 , используется точно такой же чип APU, но на более высокой тактовой частоте и ребрендинг графического процессора в качестве серии Radeon HD7000 и использовался новый чип контроллера ввода - вывода.

Semi-custom chips и были введены в Microsoft Xbox One и Sony PlayStation 4 видео игровых консолей.[12]

Третье поколение технологии было выпущено 14 января 2014 года, показывающее более тесную интеграцию между CPU и GPU. Настольный и портативный вариант под кодовым названием Kaveri , основанный на Steamroller architecture , в то время как варианты с низким энергопотреблением, под кодовым названием Kabini и Temash , основаны на архитектуре Jaguar .[13]

Особенности

AMD является одной из основателей HSA Foundation и активно работает над развитием Heterogeneous System Architecture в сотрудничестве с другими членами. Следующие аппаратные и программные реализации доступны в AMD's APU-branded продуктах:

Тип Особенности HSA Первая реализация Заметки
Оптимизированная платформа Поддержка GPU Compute C++ 2012
Trinity APUs
Поддержка OpenCL C++ и Microsoft’s C++ AMP расширение языка. Это облегчает программирование как центрального, так и графического процессоров , работающих вместе для обработки и поддержки параллельных рабочих нагрузок.
HSA-aware MMU GPU может получить доступ ко всем системам памяти через службы перевода и неисправности страницы управления HSA MMU.
Общее управление питанием CPU и GPU в настоящее время это часть энергетического потенциала. Порядок очередности, идущий к процессору наиболее подходит для текущих задач.
Архитектурная интеграция Гетерогенное Управление памятью : центрального процессора MMU и графического процессора IOMMU . Одно и то же адресное пространство[14] 2014
PlayStation 4,
Kaveri APUs
CPU и GPU теперь доступ к памяти с одним и тем же адресным пространством. Теперь указатели могут свободно передаваться между CPU и GPU, позволяя таким образом zero-copy.
Полностью когерентная память между CPU и GPU Теперь GPU может получить доступ и кэш данных из когерентных областей памяти в системной памяти, а также ссылаться на данные из кэша процессора. Когерентность кэша поддерживается.
Графический процессор использует выгружаемую системную память с помощью указателей CPU GPU может воспользоваться общей виртуальной памяти между CPU и GPU, и выгружаемой системной памятью теперь можно ссылаться непосредственно на GPU.
Системная интеграция GPU вычисляет переключение контекста 2015
Carrizo APU
Вычисление задачи на GPU может быть переключением контекста, позволяя многозадачную среду, а также более быструю интерпретацию между приложениями , вычислениями и графикой .
GPU графика вытесняющей многозадачности Долгоиграющие графические задачи могут быть вытесняющей многозадачностью, поэтому процессы имеют низкий доступ к задержкам APU.
Качество обслуживания[15] Кроме переключения контекста и вытесняющей многозадачности, аппаратные средства могут быть либо уравнены, либо иметь приоритет среди множества пользователей и приложений.
Особенности AMD Accelerated Processing Units
Марка Llano Trinity Richland Kaveri Carrizo Bristol Ridge Raven Ridge    Desna,
Ontario,
Zacate
Kabini,
Temash
Beema,
Mullins
Carrizo-L
Платформа Desktop, Mobile Desktop, Mobile Mobile, Desktop Desktop, Mobile Ultra-mobile
Выпущена Август 2011 Октябрь 2012 Июнь 2013 Январь 2014 Июнь 2015 Июнь 2016 Март 2017 Январь 2011 Май 2013 Q2 2014 Май 2015
изготовление(нм) GlobalFoundries 32 SOI 28 14 TSMC 40 28
Die size (мм2) 228 246 245 244.62 TBA TBA 75 (+ 28 FCH) ~107 TBA
Разъем FM1, FS1 FM2, FS1+, FP2 FM2+, FP3 FP4, FM2+ AM4, FP4 AM4 FT1 AM1, FT3 FT3b FP4
Архитектура процессора AMD 10h Piledriver Steamroller Excavator Zen Bobcat Jaguar Puma Puma+[16]
Поддерживаемая память DDR3-1866
DDR3-1600
DDR3-1333
DDR3-2133
DDR3-1866
DDR3-1600
DDR3-1333
DDR4-2400
DDR4-2133
DDR4-1866
DDR4-1600
DDR3L-1333
DDR3L-1066
DDR3L-1866
DDR3L-1600
DDR3L-1333
DDR3L-1066
DDR3L-1866
DDR3L-1600
DDR3L-1333
3D двигатель TeraScale 2
(VLIW5)
TeraScale 3
(VLIW4)
GCN 1.1
(Mantle, HSA)
GCN 1.2
(Mantle, HSA)
GCN 1.3
(Mantle, HSA)
TeraScale 2
(VLIW5)
GCN 1.1
Up to 400:20:8 Up to 384:24:6 Up to 512:32:8 Up to 768:48:12 80:8:4 128:8:4
IOMMUv1 IOMMUv2 IOMMUv1[17] TBA
Унифицированный видео декодер(UVD) UVD 3 UVD 4.2 UVD 6 TBA UVD 3 UVD 4 UVD 4.2 UVD 6
Двигатель видео кодирования N/A VCE 1.0 VCE 2.0 VCE 3.1 TBA N/A VCE 2.0 VCE 3.1
GPU экономия энергии PowerPlay PowerTune N/A Enduro
Max. displays 2–3 2–4 2–4 3 4 TBA 2 TBA
TrueAudio N/A [18] N/A[17]
FreeSync N/A N/A
/drm/radeon[19][20][21] N/A
/drm/amd/amdgpu[22] N/A Experimental N/A Experimental


Реализации

Falcon и Swift

В июле 2008 на AMD Technology Analyst Day компания публично анонсировала две реализации процессора Fusion[23]

Серия Falcon
  • целевой рынок процессора Bulldozer из серии Falcon — настольные системы с энергопотреблением от 10 Вт до 100 Вт.
  • Bobcat, процессор из серии Falcon, ориентирован на рынок мобильных телефонов, UMPC и карманных устройств с энергопотреблением от 1 Вт до 10 Вт.
Серия Swift

Процессоры серии Swift базируются на основе архитектуры K10 (Stars) и выполнены на 45-нм техпроцессе и нацелены на рынок ноутбуков. Заявлена поддержка стандарта памяти DDR3. Процессоры серии Swift дожны были иметь полностью DirectX 10-совместимое графическое ядро на основе чипа Radeon RV710. Также присутствует полная поддержка технологий PowerXpress и Hybrid CrossFireX. TDP: 5-8 Вт (под нагрузкой), 0,6-0,8 Вт (в режиме простоя). Две версии процессоров Swift: White Swift (основан на 1-м ядре) и Black Swift (основан на 2-х ядрах).

Llano и Bobcat

Позже план выпуска процессоров изменили и Swift был полностью отменён (причина была связана с плохим выходом годных чипов на 45-нм техпроцессе). Вместо него в июне 2010 в Абу-Даби (где расположена штаб-квартира владельцев GlobalFoundries) были анонсированы Llano («Ллэ́но») и Bobcat, которые и стали в 2011 году первыми APU Fusion (А-серия), ориентированными на различные сегменты рынка.[24][25]

  • Llano основан на модифицированном ядре поколения K10 (Stars). Выпускается на мощностях GlobalFoundries по 32-нм SOI техпроцессу с использованием материалов, имеющих высокое значение диэлектрической константы (high-k) и транзисторов с металлическим затвором (metal gate). Llano доступен в двух-, трёх- и четырёхъядерных вариантах.
  • «Мобильное» ядро Bobcat, в отличие от Intel Atom, обладает внеочередным исполнением команд и является основой для APU Ontario (TDP 9 Вт) и Zacate (TDP 18 Вт), доступные в одно- и двухъядерных вариантах.

Спецификация:

  • 2-4 ядра K12 (улучшенное K10);
  • GPU класса HD 5000, полностью совместимое с DirectX 11, OpenGL 4.1 и OpenCL 1.1;
  • процессорные и графические ядра находятся на одной подложке;
  • 0,5-1 Мб кэша L2 на ядро (кэш L3 отсутствует);
  • двухканальный контроллер памяти с поддержкой модулей до DDR3-1600, но лишённый за ненадобностью поддержки ECC;
  • интегрированный контроллер PCI Express 2.0; процессоры А-серии поддерживают «расщепление» линий PCIe, то есть возможна работа как в режиме х16, так и х8+х8;
  • Dual Graphics (ранее это называлось Hybrid CrossFireX) — спаривание с одним или двумя внешним(и) GPU 6000-й серии для совместной работы и увеличения числа подключаемых мониторов (поддерживаются карты на чипах Radeon HD 6450, HD 6570 и HD 6670);
  • поддержка GPGPU.

По предварительным данным, трёх- и четырёхъядерные процессоры Llano будут называться «Beavercreek», а двухъядерные — «Winterpark»[26][27][28].

Brazos

AMD Brazos — самая первая платформа Fusion на двухъядерных процессорах Bobcat, разработанная для мобильных решений (ноутбуков и нетбуков).

Athlon II и Sempron

Отбракованные по видеоядру экземпляры Llano продаются под торговой маркой Athlon II, позволяя владельцу по привлекательной стоимости построить 4-ядерную систему, выбрав при этом желаемую дискретную видеокарту.

  • AMD Athlon II X4 651 (3,0 ГГц, 4 МБ кэш-памяти)
  • AMD Athlon II X4 641 (2,8 ГГц, 4 МБ кэш-памяти)
  • AMD Athlon II X4 631 (2,6 ГГц, 4 МБ кэш-памяти)
Trinity и Enhanced-Bobcat

APU Trinity пришёл на смену Llano. В Trinity окончательно устаревшие ядра K10 будут заменены на ядра Piledriver (развитие микроархитектуры Bulldozer). Как и Llano, Trinity производится по 32-нм SOI техпроцессу.

APU Fusion на основе Bobcat (Ontario/Zacate), заменено на Enhanced-Bobcat в вариантах (Krishna/Wichita), производимых по 28-нм bulk техпроцессу.

  • Для десктопов/ноутбуков Zacate будет заменён на Krishna (в двух- и четырёхъядерных вариантах).
  • Для изделий с низким энергопотреблением и ультратонких ноутбуков Ontario заменён на Wichita.

Как ожидается, будет доступен с количеством ядер от одного до четырёх. Выпуск Trinity начат в октябре 2012 года.

APU release process TDP CPU cores GPU SPUs
Ontario Q1 2011 40 nm bulk 9W 1-2 Bobcat 16 (80) VLIW5
Zacate Q1 2011 40 nm bulk 18W 1-2 Bobcat 16 (80) VLIW5
Llano Q2-Q3 2011 32 nm SOI 25W~95W 2-4 Stars+ 80 (400) VLIW5
Wichita H1 2012[29] 28 nm bulk ~9W 1-2 Bobcat+ 16+(64) VLIW4(?)
Krishna H1 2012 28 nm bulk ~18W 2-4 Bobcat+ 16+(64) VLIW4(?)
Trinity[30] H2 2012 32 nm SOI 17W-95W 2-4 Piledriver VLIW4
Model Radeon TDP CPU Cores CPU Clock (Max/Base) L2 Cache Radeon Cores GPU Clock (Max/Base) Max DDR3
A10-4600M HD 7660G 35W 4 3.2 GHz/2.3 GHz 4MB 384 686 MHz/497 MHz DDR3-1600 DDR3L-1600 DDR3U-1333
A8-4500M HD 7640G 35W 4 2.8 GHz/1.9 GHz 4MB 256 655 MHz/497 MHz DDR3-1600 DDR3L-1600 DDR3U-1333
A6-4400M HD 7520G 35W 2 3.2 GHz/2.7 GHz 1MB 192 686 MHz/497 MHz DDR3-1600 DDR3L-1600 DDR3U-1333
A10-4655M HD7620G 25W 4 2.8 GHz/2.0 GHz 4MB 384 497 MHz/360 MHz DDR3-1333 DDR3L-1333 DDR3U-1066
A6-4455M HD7500G 17W 2 2.6 GHz/2.1 GHz 2MB 256 424 MHz/327 MHz DDR3-1333 DDR3L-1333 DDR3U-1066
Kabini and Temash
  • Jaguar (микроархитектура) основанная на CPU
  • Графическое ядро Next-based GPU, поддерживающее Mantle API
  • Поддержка Socket FT3 и Socket AM1

В январе 2013 года Jaguar базирующийся на Kabini и Temash APUs был представлен в качестве преемника Bobcat на основе Ontario, Zacate и Hondo APUs. Kabini APU направлена ​​на low-power, subnotebook, netbook, ultra-thin и мало-факторный спрос, а Temash APU направлен на tablet, ultra-low power и и мало-факторный спрос. Представлены многочисленные архитектурные улучшения , касающиеся потребляемой мощности и производительности, такие как поддержка новых x86-инструкций, более высокой IPC подсчета. Интегрированные Fusion Controller Hubs (FCH) для Kabini и Temash имеют кодовое название "Yangtze" и "Salton" соответственно. Yangtze FCH включает поддержку для двух портов USB 3.0, два SATA 6 Гбит / с портами, а также xHCI 1.0 и SD / SDIO 3.0 протоколы для поддержки SD-карты. Оба чипа имеют DirectX 11.1, а также многочисленные улучшенные Heterogeneous System Architecture (HSA).

Seattle

Cortex-A57 основанное на 64-разрядном серверном решении SoC будет запущено во второй половине 2014 года и под кодовым названием "Seattle". Seattle будет включать 8 или 16 вариантов ядер, с ожидаемой тактовой частотой более 2 ГГц. Эти ARM процессоры будут включать SeaMicro, предлагая до 10 Гбит / с пропускной способности, для использования сервера. Кроме того, каждый ARM процессор будет поддерживать до 64 Гб DRAM.

Kaveri
  • Steamroller(микроархитектура) основанная на процессоре от 2 -х до 4 ядер;
  • Графическое ядро Next основано на GPU с 192-512 шейдерных процессоров;
  • 15-95 Вт TDP;
  • 35 Вт AMD FX-7600P процессор для портативного компьютера;
  • 95 Вт AMD A10-7850K процессор для настольного компьютера;
  • Процессор для настольного компьютера использует Socket FM2 +;

Третье поколение платформы под кодовым названием Kaveri, был частично реализовано 14 января 2014 г. Kaveri содержит до четырех Steamroller CPU ядер с тактовой частотой до 3,9 ГГц в турбо - режиме 4,1 ГГц, до 512-ядра Graphics Core Next GPU, два декодирующих модуля вместо одного (что позволяет каждому ядру декодировать четыре инструкции за такт вместо двух).

Beema and Mullins
  • Puma (микроархитектура) основанная на CPU;
  • Графическое ядро Next основывается на GPU с 128 шейдерными процессорами, поддерживающая Mantle API;
  • Поддержка Socket FT3
Carrizo-L
  • Puma+ (микроархитектура) основанная на CPU с 2-4 ядрами;
  • Графическое ядро Next основывается на GPU с 128 шейдерными процессорами;
  • 12-25 Вт конфигурируемый TDP;
  • Поддержка Socket FP4, пин-совместим с Carrizo.
Carrizo
  • Excavator (микроархитектура) основанная на CPU с 4 ядрами;
  • FX8800P, 35W CTDP;
  • Контроллер памяти поддерживает DDR3 SDRAM;
  • 15-35 Вт конфигурируемый TDP;
  • Интегрируется Southbridge;
Godavari
  • Steamroller(микроархитектура) основанная на CPU с 4 ядрами;
  • Самый быстрый APU: A10-7890K;
  • Контроллер памяти поддерживает DDR3 SDRAM на 2133 МГц;
  • Socket FM2+;
  • 95 Вт TDP.
Bristol Ridge
  • Excavator(микроархитектура) основанная на CPU с 4 ядрами и Radeon графиками;
  • Контроллер памяти поддерживает DDR4 SDRAM;
  • Двух- и четырёхъядерные варианты;
  • 1 МБ кэш-памяти L2 для каждого модуля;
  • 15/35/45/65 Вт TDP с поддержкой настраиваемой TDP.

Сравнение с традиционной схемой

То есть отдельно CPU и GPU.

Преимущества
  • Упрощает устройство компьютера, снижает количество возможных мест отказа.
  • Отпадает необходимость кулера для видеоплаты.
  • Система может использовать в качестве видеопамяти оперативную память.

Особенно эти преимущества важны в ноутбуках и недорогих «офисных» компьютерах.

Недостатки
  • В видеокартах высокого класса для настольных ПК технологии памяти на год-полтора опережают таковые на материнских платах. Поэтому применение APU на геймерских компьютерах неэффективно (хотя всегда и остается возможность использования «внешней» продвинутой видеокарты).

См. также

Примечания

  1. http://techreport.com/review/13792/amd-2007-analyst-day-platforms-and-the-glass-half-full/2
  2. http://www.digitimes.com/news/a20060628VL201.html
  3. http://www.crn.com.au/story.aspx?CIID=70189&src=site-marq
  4. http://www.igromania.ru/news/hard/41449/AMD_otlozhila_Fusion.htm
  5. http://www.amd.com/en-us/who-we-are/newsroom
  6. http://arstechnica.com/business/2010/02/amd-reveals-fusion-cpugpu-to-challege-intel-in-laptops/
  7. http://www.bit-tech.net/news/hardware/2012/01/19/amd-ditches-fusion-branding/1
  8. http://www.bit-tech.net/news/bits/2012/01/23/amd-arctic-fusion-brand/1
  9. http://techreport.com/news/19948/amd-begins-shipping-brazos-announces-bulldozer-based-apus
  10. http://www.engadget.com/2012/02/02/amd-2012-2013-roadmap-APUs-galore/
  11. http://www.techspot.com/news/51909-amd-launches-richland-a-series-apus-slight-speed-bump-better-power-management.html/
  12. http://www.wired.com/2013/05/xbox-one/
  13. http://www.engadget.com/2013/01/07/amd-temash-kabini-richland-kaveri-apu/
  14. http://developer.amd.com/wordpress/media/2013/06/Phil-Rogers-Keynote-FINAL.pdf
  15. http://developer.amd.com/wordpress/media/2013/06/Phil-Rogers-Keynote-FINAL.pdf
  16. http://www.amd.com/en-us/press-releases/Pages/amd-mobile-carrizo-2014nov20.aspx
  17. 17,0 17,1 Thomas De Maesschalck. "AMD teases Mullins and Beema tablet/convertibles APU". 
  18. "A technical look at AMD’s Kaveri architecture". Semi Accurate. 
  19. Airlie, David (2009-11-26). "DisplayPort supported by KMS driver mainlined into Linux kernel 2.6.33". 
  20. Airlie, David (2009-11-26). "DisplayPort supported by KMS driver mainlined into Linux kernel 2.6.33". 
  21. "Radeon feature matrix". freedesktop.org. 
  22. Deucher, Alexander (2015-09-16). "XDC2015: AMDGPU" (PDF). 
  23. http://download.amd.com/Corporate/MarioRivasDec2007AMDAnalystDay.pdf
  24. https://www.overclockers.ru/hardnews/print/39327/AMD_rasskazyvaet_o_buduschih_processorah.html
  25. http://www.3dnews.ru/cpu/613116
  26. https://www.overclockers.ru/hardnews/39441/Informaciya_o_raznovidnostyah_processorov_Zambezi_i_Llano.html
  27. https://www.overclockers.ru/hardnews/39289/Nastolnye_processory_Llano_vyjdut_v_ijule_2011_goda.html
  28. http://www.ixbt.com/cpu/amd-llano.shtml
  29. AMD начнёт поставки 28 нм процессоров Krishna в 2011 году
  30. AMD Trinity: поколение NEXT