Что касается ускорителей логического вывода ИИ, NVIDIA захватила рынок, поскольку дроны, интеллектуальные датчики с высоким разрешением, сетевые видеорегистраторы, портативные медицинские устройства и другие промышленные системы Интернета вещей используют NVIDIA Jetson Xavier NX. Это может измениться, поскольку ускоритель выводов искусственного интеллекта InferX X1 от Flex Logix оказался лучше, чем Jetson Xavier NX, а также Tesla T4.
Во время конференции Linley Fall Conference 2020 компания Flex Logix продемонстрировала InferX X1 AI Inference Accelerator, его производительность и то, как он превосходит другие аналогичные чипы. Это самый мощный сопроцессор пограничного логического вывода с высокой пропускной способностью, малой задержкой, высокой точностью, изображениями в мегапикселях и небольшой матрицей для встроенных вычислительных устройств на периферии. Расчетный TDP в худшем случае (933 МГц, YOLOv3) составляет 13,5 Вт.
Сопроцессор работает с точностью INT8 или BF16 при размере пакета 1 для минимальной задержки. Механизм ускорителя тензорного процессора nnMAX существует в сопроцессоре пограничного вывода – InferX X1. Реконфигурируемый тензорный процессор nnMAX оптимизирован для пограничного вывода ИИ и основан на технологии EFLX eFPGA. Он обеспечивает архитектуру потока данных, использование высокого разрешения, низкую задержку, высокую производительность (при размере пакета 1) и низкую пропускную способность DRAM. Механизм ускорителя является мощным для периферийных вычислительных устройств, поскольку он обеспечивает низкую стоимость, низкое энергопотребление и превосходную масштабируемость.
Спецификация
Чип имеет 32-битную память LPDDR4x DRAM с хост-интерфейсом PCIe Gen 3/4. Хост-интерфейс представляет собой 4-полосную конфигурацию.
Производительность
Согласно сравнительным тестам, опубликованным Flex Logix, чип превосходит Jetson Xavier NX, а также Tesla T4. Он превосходит характеристики всех протестированных моделей (YOLOv3, клиентская модель X и клиентская модель Z). Микросхема InferX X1 использует массив 2 × 2 из nnMAX 1-D TPU с 13 МБ (встроенной SRAM) в кристалле, общая площадь которого составляет 54 мм2. Ниже мы сравниваем его производительность на двух реальных моделях клиентов (модель клиента X и модель клиента Z) и на YOLOv3.
Доступность и стоимость
Наличие ускорителя пограничного вывода InferX X1:
InferX превосходит Xavier NX Speed по более низкой цене и меньшей мощности. Стоимость InferX X1 можно увидеть в таблице:
Вывод
Тесты AI показывают, что этот чип намного мощнее существующих чипов. Будет интересно посмотреть, как это работает на рынке. Безусловно, ждем от компании плат PCIe/M.2. Компания Flex Logix планирует официально объявить об этом и предоставить подробную информацию 28 октября на конференции Linley Fall Processor Conference.
Для получения дополнительной информации посетите Flex Logix
Выражаем свою благодарность источнику из которого взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.