В сентябре прошлого года компания Espressif Systems представила голосовой помощник ESP-Skainet, оптимизированный для беспроводных SoC ESP8266 и ESP32 с поддержкой WakeNet, позволяющий обнаруживать «слово пробуждения» и MultiNet – для распознавания речевых команд, причем первый требует всего 20 Кб оперативной памяти для одного слова, а второй поддерживает до 100 автономных команд, при 4 Мб или более SPI flash.
На тот момент он поддерживал только китайский язык и работал над готовящейся к выпуску звуковой картой LyraT-Mini, теперь доступной за 26,29 $, но включающей только один микрофон. Компания Espressif Systems анонсировала улучшенную плату для разработки AI – плату для разработки ESP32-Korvo AI, которая включает в себя материнскую плату с процессором ESP32 и аудио АЦП, а также дополнительную плату с 3-микрофонным массивом, RGB светодиодами и различными кнопками.
Спецификации ESP32-Korvo:
- Материнская плата
- Беспроводной модуль – ESP32-WROVER-B с двухъядерным процессором ESP32 Wi-Fi / BT, 128 Мбит SPI flash, и 64 Мбит PSRAM
- Хранилище – слот для MicroSD card
- Аудио
- ES8311 I2S аудио кодек
- Четырехканальный ADC с тремя каналами для микрофонов и одним для функции AEC (эхоподавления).
- Аудио усилитель внешнего динамика на 3 Вт
- Аудиоразъем 3.5 мм для наушников
- Разъем для подключения динамиков
- USB – 2x порта Micro USB (один для питания, один для USB-UART)
- Разное – выключатель питания, кнопка сброса, кнопка загрузки, разъем FPC для подключения материнской платы и дополнительной платы.
- Источник питания
- 5 В через порт Micro USB
- Разъем для батареи
- Регулятор 5 В к 3.3 В.
- Дополнительная плата
- 3x аналоговых микрофонных массива (расстояние = 65 мм).
- 12x адресных RGB LEDs (WS2812).
- 6x определяемый пользователем функциональные кнопки
Помимо нового оборудования, голосовой помощник ESP-Skainet также улучшен благодаря поддержке Multinet на китайском и английском языках, Wake Word Engine и WakeNet, которые можно настраивать за пределами стандартного «Hi, Lexin» с помощью некоторых распространенных слов WakeNet, таких как «Alexa» или платной услуге – настройке, которая занимает две-три недели и требует аудио-примеров как минимум от 500 разных людей. ESP-Skainet также выполняет обработку звука для улучшения качества звука, включая AEC (акустическое подавление эха), AGC (автоматическая регулировка усиления), NS (подавление шума), VAD (обнаружение голосовой активности) и MASE (усиление речи в массиве микрофонов).
Вы найдете документацию для начала работы на Github, а приобрести плату разработки ESP32-Korvo AI можно за 35 долларов на Digikey.
Выражаем свою благодарность источнику из которой взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.