На прошлой неделе компания Flex Logix, на конференции Linley Fall Conference 2020, анонсировала InferX X1 AI Inference Accelerator. На днях компания анонсировали InferX X1 SDK, плату PCIe и плату M.2.
Пакет SDK для InferX X1 Edge Inference
SDK для InferX Edge Inference прост и удобен. Входными данными для компилятора может быть высокоуровневая, аппаратно-независимая реализация модели нейронной сети с открытым исходным кодом, которая может быть моделью TensorFlow Lite или ONNX. Компилятор использует эту модель, ищет доступные ресурсы X1 и генерирует двоичный исполняемый файл. Это происходит во время выполнения, которое затем принимает входной поток, например, прямую трансляцию с камеры. Пользователь должен указать, какая модель компилятора, затем драйвер InferX X1 принимает ее и отправляет на аппаратное оборудование.
Сгенерированный двоичный файл передается в InferX X1 через среду выполнения. Затем он берет поток входных данных с указанной пользователем моделью и возвращает выходные данные хосту. Это дает пользователю преимущество, поскольку пользователь может указать более одной модели.
YOLOv3 уже выпущен через фреймворк компилятора, и мы можем ожидать, что он будет продемонстрирован в ближайшие недели. К 1 кварталу 2021 года он будет поддерживать популярные модели клиентов и начальную поддержку операционной системы на базе Linux Ubuntu и CentOS.
Плата InferX X1P1 и X1P4 PCIe
Карта InferX X1P1 PCIe имеет один чип X1. X1P1 имеет тот же форм-фактор, что и Tesla T4, половинной длины и половинной высоты за счет установки 4х слотов для PCIe Gen 3/4.
InferX X1P4 примерно такого же размера, как X1P1. Сторона разъема еще не определена на 8 или 16. На плате будет четыре микросхемы InferX X1 с прикрепленной к ней собственной DRAM. Ожидается, что TDP составит менее 75 Вт.
Плата InferX X1M M.2
Помимо всего этого, Flex Logix так же анонсировала некоторые подробности о плате InferX X1M M.2. Это будет плата, размером 22 мм x ~ 80 мм. Расчетный TDP составляет 19 Вт, но будет меньше, чем у клиентских моделей. Он предназначен для пограничных серверов, ПК, ноутбуков и даже встраиваемых систем.
Цена и доступность платы InferX
Обе платы PCIe будут существенно дешевле Tesla T4. InferX X1P1 будет стоить 1/4 стоимости Tesla T4. X1P1 может обеспечить гораздо большую пропускную способность на доллар, чем T4. Пользователи с более низкими частотами могут получать от них больше удовольствия при меньших затратах.
Будет интересно увидеть, как эти продукты выходят на рынок. Основными преимуществами являются стоимость, пропускная способность, задержка и точность.
Источник: все использованные цифры взяты из слайдов Flex Logix, представленных на конференции Linley Fall Conference 2020.
Выражаем свою благодарность источнику из которого взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.