Samsung будет оснащать встроенными..

Samsung будет оснащать встроенными ускорителями вычислений все типы памяти — от ddr4 до hbm3

Источник: 3dnews.ru
Дата: Авг 24, 2021
Просмотры: 649

На конференции Hot Chips 33 компания Samsung сообщила о планах встраивать ускорители вычислений во все типы оперативной памяти от смартфонов до компьютеров, видеокарт и серверов. Это позволит увеличить производительность платформ и снизить их энергопотребление. Самое приятное, что чипы памяти с ускорителями можно использовать вместо обычной памяти, а программная поддержка довольно простая, что уже заинтересовало разработчиков CPU и GPU.

samsung-budet-osnashchat-vstroennymi-uskoriteliami-vychislenii-vse-tipy-pamiati--ot-ddr4-do-hbm3_1.jpg

Модуль AXDIMM DDR4. Источник изображения: Samsung

Память PIM (processing-in-memory, вычисления в памяти) применительно к чипам HBM2 компания Samsung показала в феврале этого года. Каждый чип HBM2 вооружался программируемым ИИ-ускорителем производительностью 1,2 терафлопс (FP16) и мог обрабатывать хранящиеся в памяти данные непосредственно, не перегоняя их в центральный процессор и обратно. Сегодня компания сообщила, что работает над вооружением ускорителями расчётов всех основных типов оперативной памяти, что обещает появление PIM-блоков в подсистемах ноутбуков, видеокарт и так далее.

samsung-budet-osnashchat-vstroennymi-uskoriteliami-vychislenii-vse-tipy-pamiati--ot-ddr4-do-hbm3_2.jpg

Чип памяти HBM-PIM. Источник изображения: Samsung

Следует сказать, что сегодня PIM-ускоритель забирает под себя примерно половину площади кристалла памяти, что не очень приятно с точки зрения наращивания объёмов. В будущем Samsung обещает уменьшить ускоритель, представляя всё более и более плотные микросхемы ОЗУ всех типов. В частности, для чипов HBM третьего помоления компания обещает ту же ёмкость для PIM-HBM3, что и для обычных микросхем HBM3. Можно предположить, что это возможно благодаря стековой структуре этой памяти.

Слои HBM-PIM (теперь это бренд Samsung Aquabolt-XL) вставляются непосредственно в стек HBM2 на ту же самую подложку-контроллер, что и раньше. Тем самым стеки HBM2 проще простого подменить стеками с включением HBM-PIM, заменив одни на другие. Такие гибридные стеки были испытаны компанией Xilinx вместе с продуктами Alveo без каких-либо модификаций процессоров и адаптеров (монтажной платы или интерпозера). По сообщению партнёров, производительность подскочила в 2,5 раза с одновременным снижением потребления энергии на 62%. Такую же операцию, уверяют в Samsung, можно провести с GPU и CPU со сходной компоновкой и разработчики этих решений уже заинтересовались предложением компании.

samsung-budet-osnashchat-vstroennymi-uskoriteliami-vychislenii-vse-tipy-pamiati--ot-ddr4-do-hbm3_3.jpg

Слои HBM-PIM могут быть встроены в стандартный стек HBM и процессору об этом даже не нужно знать. Источник изображения: Samsung

Для самых нетерпеливых Samsung предлагает готовое решение в виде модулей AXDIMM DDR4 (Acceleration DIMM). Модули имеют буфер, который помогает обрабатывать данные в памяти, одновременно работая со всеми рангами DRAM на планке. Такой модуль устанавливается в обычный сервер в стандартный слот памяти. Всю работу — обработку данных в памяти с точностью FP16 с применением стандартных процедур TensorFlow и Python — модуль обеспечивает самостоятельно, а Samsung делает всё возможное, чтобы обеспечить поддержку других программных инструментов.

Компания заявляет, что её тесты (проведённые на рабочей нагрузке Facebook AI) показали увеличение производительности в 1,8 раза, снижение энергопотребления на 42,6% и уменьшение задержки хвоста на 70% с 2-ранговым комплектом. Всё это повторим, без доработок в стандартном сервере, что, безусловно, впечатляет.

samsung-budet-osnashchat-vstroennymi-uskoriteliami-vychislenii-vse-tipy-pamiati--ot-ddr4-do-hbm3_4.jpg

Модуль AXDIMM значительно ускоряет обработку ИИ-ориентированных данных. Источник изображения: Samsung

В мобильных платформах, если говорить о применении PIM с чипами LPDDR5 и подобной, использование вычислений в памяти принесёт такой же ряд новых возможностей. Пока компания лишь моделирует такие процессы, но со временем они обещают появиться в ноутбуках и даже смартфонах. Например, для памяти LPDDR5X-6400 заявлено повышение производительности в 2,3 раза при рабочих нагрузках по распознаванию речи, в 1,8 раза при преобразовании перевода и в 2,4 раза при генерации текста GPT-2. Эти улучшения производительности сопровождаются снижением потребления в 3,85, 2,17 и 4,35 раза соответственно. Другой вопрос, когда это выйдет на рынок? Ведь эта технология пока не стала стандартом, утверждённым JEDEC.

Samsung будет оснащать встроенными ускорителями вычислений все типы памяти — от ddr4 до hbm3

Nvidia представила 144-ядерный серверный процессорgrace superchip

Производство ford в европе пострадало из-за дефицита чипов и событий на украине

Стали известны характеристики core i9-12950hx, core i7-12850hx и core i5-12600hx— мобильные cpu на десктопных кристаллах

Amd выпустила epyc milan-x— серверные процессоры с огромным кешем

Процессоры сильно подешевели в россии ryzen 9 5950х можно купить до 100 тыс. рублей, а core i9-12900k — до 110 тыс. рублей

Apple заблокировала замену ssd в новом mac studio на программном уровне

Ускоритель вычислений nvidia h100 с огромным чипом hopper показался на изображении в преддверии анонса

Fsp анонсировала блоки питания с 124-контактным разъёмом pcie 5.0

Плата для майнинговых систем biostar tb560-btc pro оснащена 12 слотами pcie

На выпуск силовой электроники toshiba потратит на 45 % больше, чем в уходящем фискальном году

Рекомендации

Российская bq пообещала не сильно повышать цены и расширить ассортимент бытовой техники

В австралии ии будет автоматически ограничивать скорость электросамокатов на тротуарах

Dell выпустила игровой монитор g2723hn с частотой обновления 165 гц

Viewsonic выпустила монитор va2932-mhd с соотношением сторон 219

Oneplus готовит смарт-телевизоры tv y1s pro формата 4к на базе android tv 10

Вентилятор silverstone shark force 120 argb получил лопасти с акульей текстурой

Китайская nio заявила, что не будет повышать цены на свои электромобили в ближайшее время

Volkswagen создала совместные предприятия для добычи и переработки никеля и кобальта для электромобильных аккумуляторов

Материнские платы на чипсетах amd 300-й серии наконец получат официальную поддержку ryzen 5000

Технология масштабирования radeon super resolution повысит fps в играх до 70 %

Американским властям потребуется в десять раз больше субсидий, чтобы добиться возвращения высокотехнологичных производств в сша

Lenovo представила гигантские смарт-мониторы для конференций и совместной работы

Thermalright выпустила термопасту cfx с широким диапазоном рабочих температур