Хотя большинство продуктов, сертифицированных Amazon Alexa, являются аппаратным оборудованием, на веб-сайте Amazon также есть раздел Software Audio Front End (AFE) Dev Kits, в котором перечислены программные алгоритмы, оптимизирующие обнаружение звука в шумной среде, а последним дополнением являются алгоритмы Espressif Audio Front-End или кратко ESP AFE, которые недавно были сертифицированы для устройств Amazon Alexa.
Это не первое решение от Espressif Systems, сертифицированное Alexa, так как обе компании в прошлом работали вместе над такими аудио продуктами, как модуль ESP32-PICO-V3-ZERO Alexa Connect Kit или плата ESP32-Vaquita-DSPG.
Алгоритмы были созданы командой Espressif AI Lab, которая использовала инструкции AI и DSP внутри процессора ESP32-S3 для оптимизации кода. Алгоритмы использовали только от 12 до 20% центрального процессора, а также 220 КБ внутренней и 240 КБ внешней памяти, оставляя дополнительные ресурсы для других приложений, работающих в беспроводной SoC. Сообщается, что ESP AFE обеспечивает 100 процентную скорость пробуждения (если она составляет 99,99%), а скорость распознавания речи превышает 90% в сценариях с низким SNR.
Алгоритмы включают в себя многоканальное подавление акустического эха, слепое разделение сигналов (формирование луча), обнаружение голосовой активности и снижение шума. Это поможет улучшить голосовой пользовательский интерфейс (VUI), особенно в шумной среде, например, когда устройство одновременно воспроизводит музыку и слушает голосовые команды. Espressif также объясняет, что ESP AFE может помочь в разработке устройств меньшего размера с двумя микрофонами, расположенными на расстоянии 2 см.
Вы найдете более подробный обзор на веб-сайте Espressif и более подробную техническую информацию на Github. На странице Amazon говорится, что ESP AFE работает с массивом из 2 микрофонов и стоит 19,99 долларов. Это может быть стоимость платы разработки ESP32-S3-DevKitC-1 в сочетании с массивом из 2 микрофонов или отдельной необъявленной платы ESP32-S3 с двумя микрофонами.
Выражаем свою благодарность источнику из которого взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.