Типичный чип для вывода AI или ML будет включать NPU, DSP, процессор реального времени, а также немного памяти, процессор приложений, ISP и еще несколько IP-блоков. Quadric Chimera GPNPU (нейронный процессор общего назначения) IP сочетает в себе NPU, DSP и процессор реального времени в одном программируемом ядре.
По словам Quadric, основным преимуществом такой конструкции является упрощение аппаратного проектирования системы-на-кристалле (SoC) и последующего программирования программного обеспечения после того, как чип будет доступен, благодаря унифицированной архитектуре для вывода машинного обучения, а также предварительной и последующей обработки. Поскольку ядро является программируемым, оно также должно быть рассчитано на будущее.
Доступны три ядра Chimera GPNPU серии QB:
- Chimera QB1 — машинное обучение 1 TOPS, возможности DSP 64 GOPS
- Chimera QB4 — 4 TOPS ML, 256 GOPS DSP
- Chimera QB16 — 16 TOPS ML, 1 TOPS DSP
Quadric заявляет, что ядра Chimera могут использоваться с любым (современным) производственным процессом и могут работать на частоте до 1 ГГц с использованием 16-нм или 7-нм техпроцессов. Два или более ядра Chimaera могут быть объединены в пару для приложений, требующих большей производительности.
Говорят, что архитектура Chimera GPNPU обеспечивает производительность вывода ML, аналогичную эффективности выделенных механизмов разгрузки CNN, но с полной программируемостью и возможностью запуска любого оператора ML, что может иметь решающее значение, если специалисты по данным найдут лучшие модели, требующие новых операторов, которые не могут работать на существующих ускорителях с фиксированными функциями.
Архитектура Quadric объединяет графы нейронных сетей и код C++ в единый программный кодовый поток, и только один набор инструментов используется для скалярных, векторных и матричных вычислений. Пропускная способность памяти также оптимизирована за счет единого унифицированного стека компиляции, что также помогает снизить энергопотребление. Пользовательские операторы могут быть добавлены разработчиком программного обеспечения путем написания ядра C++ с использованием API Chimera Compute Library (CCL), а затем компиляции этого ядра с использованием Chimera SDK. Задача инженеров-программистов должна быть еще более упрощена, поскольку они работают только с одним ядром и им не нужно работать с многоядерной гетерогенной системой.
Однако может пройти некоторое время, прежде чем решение попадет в реальные микросхемы. В то время как архитектура Chimera уже была протестирована в кремнии, Quadric ищет клиентов, команды разработчиков чипов которых могут начать оценку IP этой осенью или зимой, поэтому мы предполагаем, что может пройти год или больше, прежде чем коммерческие SoC на основе архитектуры Quadic Chimera станут доступный. Дополнительную информацию можно найти на странице продукта и в пресс-релизе .
Выражаем свою благодарность источнику из которого взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.