ESP32-AIVoice-Z01 — это голосовой комплект ESP32-S3 AI с двумя микрофонами, функцией распознавания слов для пробуждения, шумоподавлением и эхоподавлением. — CNXSoft- новости Android-приставок и встраиваемых систем

ESP32 -AIVoice-Z01 — это доступный голосовой комплект AI на базе ESP32-S3, предназначенный для создания AI-приложений с голосовым управлением. Он оснащен Wi-Fi и Bluetooth-подключением через ESP32-S3 SoC, двойной цифровой микрофонной решеткой для точного распознавания голоса и встроенным усилителем. Система также реализует аудио-алгоритмы для шумоподавления и эхоподавление.

Плата ESP32-AIVoice-Z01 поддерживает фреймворк голосового пробуждения WakeNet от Espressif и интегрируется с серверной платформой с открытым исходным кодом AiLinker, что позволяет подключаться к различным крупным сервисам моделей искусственного интеллекта, таким как OpenAI, ZhiPu QingYan, TongYi QianWen и DouBao. Эти функции делают это устройство подходящим для разработки игрушек на базе искусственного интеллекта, устройств Интернета вещей, мобильных устройств и приложений для умного дома.

Характеристики голосового комплекта ESP32-AIVoice-Z01 ESP32 AI

Беспроводной модуль – ESP32-S3-WROOM-1U
- SoC – двухъядерный процессор Xtensa LX7 от Espressif Systems ESP32-S3
- Память – 8 МБ PSRAM
- Хранилище– 16 МБ флэш-памяти
- Беспроводная связь — подключение по WiFi 4 и Bluetooth 5.0 с внешней антенной
Хранилище – слот для карты MicroSD
Аудио
- Двойная цифровая микрофонная решетка (SNR 65 дБ) с интерфейсом PDM
- Усилитель мощности 4 Ом 2,5 Вт
- Интерфейс I2S для внешнего ЦАП или усилителя
- Поддержка алгоритмов шумоподавления, VAD (обнаружение голосовой активности) и AEC (подавление акустического эха)
USB – USB-C для питания и программирования
Другие интерфейсы
- Интерфейс экрана SPI
- Интерфейс камеры DVP (не поддерживается в голосовой версии)
- GPIO, UART, I2C, I2S, PWM
Разное
- RGB-светодиоды
- Тумблер питания
- Разъем для динамика
- Кнопки сброса ESP и загрузки
- Разъем аккумулятора
- Интерфейс SPI с клеммами 1,25 мм x 8PIN
Управление питанием
- Вход 3,3–5 В через USB-C, <10 мА в режиме глубокого сна
- Интерфейс литиевой батареи 3,7 В с измерением напряжения батареи
- Ток заряда аккумулятора 555мА при 5В
Размеры – 77 x 36 x 33 мм.
Диапазон температур – от 10°C до 60°C
Защита от электростатического разряда – воздух ±8 кВ, контакт ±4 кВ

Интерфейсы GPIO для комплекта разработки ESP32-AIVoice-Z01

Плата оснащена системой распознавания звуковых сигналов для работы в режиме громкой связи, распознаванием речи для обработки команд и поддержкой синтеза речи на основе искусственного интеллекта (TTS) для генерации естественных ответов. Плата может быть запрограммирована с помощью Arduino IDE или ESP-IDF framework. К сожалению, сейчас вся документация доступна только на китайском языке, включая краткое руководство и руководство по оборудованию .

Ранее мы писали о комплекте разработчика искусственного интеллекта ESP32-S3-BOX от Espressif, который идеально подходит для онлайн и офлайн голосовых приложений, а также о комплекте разработчика Banana Pi BPI-AI-Voice на базе MicroSemi ZL38063. M5Stack также выпустила свой автономный модуль LLM на базе AX630C, который имеет функции распознавания речи и может использоваться для таких приложений, как умные дома, голосовые помощники и промышленное управление.

Голосовой комплект ESP32-AIVoice-Z01 ESP32 AI стоит 23.02$ в магазине YouYeeTtoo. Демо-видео, представленное ниже показывает, как решение работает как с китайским, так и с английским языками.

Выражаем свою благодарность источнику из которого взята и переведена статья, сайту cnx-software.com.

Оригинал статьи вы можете прочитать здесь.