ESP32-AIVoice-Z01 — это голосовой комплект ESP32-S3 AI с двумя микрофонами, функцией распознавания слов для пробуждения, шумоподавлением и эхоподавлением.

ESP32 -AIVoice-Z01 — это доступный голосовой комплект AI на базе ESP32-S3, предназначенный для создания AI-приложений с голосовым управлением. Он оснащен Wi-Fi и Bluetooth-подключением через ESP32-S3 SoC, двойной цифровой микрофонной решеткой для точного распознавания голоса и встроенным усилителем. Система также реализует аудио-алгоритмы для шумоподавления и эхоподавление.

Плата ESP32-AIVoice-Z01 поддерживает фреймворк голосового пробуждения WakeNet от Espressif и интегрируется с серверной платформой с открытым исходным кодом AiLinker, что позволяет подключаться к различным крупным сервисам моделей искусственного интеллекта, таким как OpenAI, ZhiPu QingYan, TongYi QianWen и DouBao. Эти функции делают это устройство подходящим для разработки игрушек на базе искусственного интеллекта, устройств Интернета вещей, мобильных устройств и приложений для умного дома.

Характеристики голосового комплекта ESP32-AIVoice-Z01 ESP32 AI

  • Беспроводной модуль – ESP32-S3-WROOM-1U
    • SoC –   двухъядерный процессор Xtensa LX7 от Espressif Systems ESP32-S3
    • Память – 8 МБ PSRAM
    • Хранилище– 16 МБ флэш-памяти
    • Беспроводная связь — подключение по WiFi 4 и Bluetooth 5.0 с внешней антенной
  • Хранилище – слот для карты MicroSD
  • Аудио
    • Двойная цифровая микрофонная решетка (SNR 65 дБ) с интерфейсом PDM
    • Усилитель мощности 4 Ом 2,5 Вт
    • Интерфейс I2S для внешнего ЦАП или усилителя
    • Поддержка алгоритмов шумоподавления, VAD (обнаружение голосовой активности) и AEC (подавление акустического эха)
  • USB – USB-C для питания и программирования
  • Другие интерфейсы
    • Интерфейс экрана SPI
    • Интерфейс камеры DVP (не поддерживается в голосовой версии)
    • GPIO, UART, I2C, I2S, PWM
  • Разное
    • RGB-светодиоды
    • Тумблер питания
    • Разъем для динамика
    • Кнопки сброса ESP и загрузки
    • Разъем аккумулятора
    • Интерфейс SPI с клеммами 1,25 мм x 8PIN
  • Управление питанием
    • Вход 3,3–5 В через USB-C, <10 мА в режиме глубокого сна
    • Интерфейс литиевой батареи 3,7 В с измерением напряжения батареи
    • Ток заряда аккумулятора 555мА при 5В
  • Размеры – 77 x 36 x 33 мм.
  • Диапазон температур – от 10°C до 60°C
  • Защита от электростатического разряда – воздух ±8 кВ, контакт ±4 кВ

Интерфейсы GPIO для комплекта разработки ESP32-AIVoice-Z01

Плата оснащена системой распознавания звуковых сигналов для работы в режиме громкой связи, распознаванием речи для обработки команд и поддержкой синтеза речи на основе искусственного интеллекта (TTS) для генерации естественных ответов. Плата может быть запрограммирована с помощью Arduino IDE или ESP-IDF framework. К сожалению, сейчас вся документация доступна только на китайском языке, включая краткое руководство и руководство по оборудованию .

Ранее мы писали о комплекте разработчика искусственного интеллекта ESP32-S3-BOX от Espressif, который идеально подходит для онлайн и офлайн голосовых приложений, а также о комплекте разработчика Banana Pi BPI-AI-Voice на базе MicroSemi ZL38063. M5Stack также выпустила свой автономный модуль LLM на базе AX630C, который имеет функции распознавания речи и может использоваться для таких приложений, как умные дома, голосовые помощники и промышленное управление.

Голосовой комплект ESP32-AIVoice-Z01 ESP32 AI стоит 23.02$ в магазине YouYeeTtoo. Демо-видео, представленное ниже показывает, как решение работает как с китайским, так и с английским языками.

Выражаем свою благодарность источнику из которого взята и переведена статья, сайту cnx-software.com.

Оригинал статьи вы можете прочитать здесь.

0 0 votes
Article Rating
Подписаться
Уведомление о
guest

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

0 Комментарий
Inline Feedbacks
View all comments