Neuromorphic Analog Signal Processor (NASP) NeuroVoice VAD от POLYN Technology — это чип, работающий в постоянном режиме, с ультранизким энергопотреблением, который обнаруживает голос на любом шумном фоне с потреблением на микроваттном уровне и микросекундной задержкой.
Всё обрабатывается на чипе, поэтому подключение к Интернету не требуется. Потенциальные области применения включают умные пульты дистанционного управления, наушники, носимые устройства, голосовой доступ, IoT, Индустрию 4.0, робототехнику, Умный Дом/Завод, мобильные решения и многое другое.
Характеристики чипа NASP NeuroVoice VAD (NV-VAD 100):
- Особенности
- Обнаружение голоса при ультранизком энергопотреблении
- Пропуск голоса – пропускает голос и заглушает фоновые звуки
- Обход фонового сигнала – команда Wake Word Detection (WWD) для активации прозрачного обхода голоса
- Разборчивость речи/команд в шумных помещениях – повышает разборчивость голосовых команд для функций WWD/KWS (Keyword Spotting) в шумной среде для Умного Дома, Умного Завода, носимых устройств и т.д.
- Аудио
- Интерфейсы – PDM/I2S
- Задержка обнаружения голоса – 25 мс
- Интерфейсы хоста – SPI/I2C для первоначальной конфигурации и чтения состояния, вывод VAD
- Отладка – доступ к регистрам ядра через Boundary Scan и блок отладки по JTAG
- Напряжения питания
- Цифровое ядро – 1.2В
- Аналоговое ядро – 1.2В
- Ввод-вывод – 1.8В
- Потребляемая мощность – 30~35 мкВт (предположительно в активном режиме?)
- Режимы питания
- Ожидание – NeuroVoice VAD полностью остановлен, сохраняет/ожидает конфигурацию; все тактовые сигналы остановлены, NeuroVoice VAD готов принимать команды от внешнего последовательного интерфейса (SPI/I2C)
- Сон – подсостояние режима ожидания; поддерживает МЭМС-микрофон в спящем режиме с возможностью быстрого пробуждения.
- Энергосберегающий – используется в случаях, когда МЭМС-микрофон должен работать, но функциональность VAD Neurocore отключена
- Активный – полностью рабочий режим; все функции активны
- Размеры – 1.2 мм2
Ядро VAD работает с кадрами по 8 мсек, а промежуток между кадрами может быть увеличен до 8 кадров для дальнейшего снижения энергопотребления. Другой настраиваемый параметр — уровень чувствительности VAD (VSL), который может быть установлен между 0 и 1. Это настраивает ядро нейронной сети на различный баланс обнаружения голоса между ложными срабатываниями и пропусками.
Информация о поддержке программного обеспечения и отладочных наборах ограничена, но компания планирует продемонстрировать решение на CES 2026 и предоставить информацию о наборах для оценки NeuroVoice и программах раннего доступа для компаний, разрабатывающих продукты с ультранизким энергопотреблением и голосовым управлением. Несколько дополнительных деталей можно найти на странице продукта и в пресс-релизе .
Выражаем свою благодарность источнику, с которого взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.



