Плата для разработки ESP32-Korvo AI использует голосовой помощник ESP-Skainet


В сентябре прошлого года компания Espressif Systems представила голосовой помощник ESP-Skainet, оптимизированный для беспроводных SoC ESP8266 и ESP32 с поддержкой WakeNet, позволяющий обнаруживать «слово пробуждения» и MultiNet — для распознавания речевых команд, причем первый требует всего 20 Кб оперативной памяти для одного слова, а второй поддерживает до 100 автономных команд, при 4 Мб или более SPI flash.

На тот момент он поддерживал только китайский язык и работал над готовящейся к выпуску звуковой картой LyraT-Mini, теперь доступной за 26,29 $, но включающей только один микрофон. Компания  Espressif Systems анонсировала улучшенную плату для разработки AI — плату для разработки ESP32-Korvo AI, которая включает в себя материнскую плату с процессором ESP32 и аудио АЦП, а также дополнительную плату с 3-микрофонным массивом, RGB светодиодами и различными кнопками.

Спецификации ESP32-Korvo:

  • Материнская плата
    • Беспроводной модуль – ESP32-WROVER-B с двухъядерным процессором ESP32 Wi-Fi / BT, 128 Мбит SPI flash,  и 64 Мбит PSRAM
    • Хранилище – слот для MicroSD card
    • Аудио
      • ES8311 I2S аудио кодек
      • Четырехканальный ADC с тремя каналами для микрофонов и одним для функции AEC (эхоподавления).
      • Аудио усилитель внешнего динамика на 3 Вт
      • Аудиоразъем 3.5 мм для наушников
      • Разъем для подключения динамиков
    • USB – 2x порта Micro USB (один для питания, один для USB-UART)
    • Разное – выключатель питания, кнопка сброса, кнопка загрузки, разъем FPC для подключения материнской платы и дополнительной платы.
  • Источник питания
    • 5 В через порт Micro USB
    • Разъем для батареи
    • Регулятор 5 В к 3.3 В.
  • Дополнительная плата
    • 3x аналоговых микрофонных массива (расстояние = 65 мм).
    • 12x адресных RGB LEDs (WS2812).
    • 6x определяемый пользователем функциональные кнопки

Помимо нового оборудования, голосовой помощник ESP-Skainet также улучшен благодаря поддержке Multinet на китайском и английском языках, Wake Word Engine и WakeNet, которые можно настраивать за пределами стандартного «Hi, Lexin» с помощью некоторых распространенных слов WakeNet, таких как «Alexa» или платной услуге — настройке, которая занимает две-три недели и требует аудио-примеров как минимум от 500 разных людей. ESP-Skainet также выполняет обработку звука для улучшения качества звука, включая AEC (акустическое подавление эха), AGC (автоматическая регулировка усиления), NS (подавление шума), VAD (обнаружение голосовой активности) и MASE (усиление речи в массиве микрофонов).

Блок-схема ESP32-Korvo

Вы найдете документацию для начала работы на Github, а приобрести плату разработки ESP32-Korvo AI можно за 35 долларов на Digikey.

Выражаем свою благодарность источнику из которой взята и переведена статья, сайту cnx-software.com.

Оригинал статьи вы можете прочитать здесь.

0 0 vote
Article Rating
Подписаться
Уведомление о
guest

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

0 Комментарий
Inline Feedbacks
View all comments