ESP32 Agent Dev Kit — голосовой помощник на базе LLM, созданный на платформе ESP32-S3 (краудфандинг)

Комплект разработчика ESP32 Agent — это голосовой помощник на базе ESP32-S3, который обеспечивает интеграцию с популярными моделями LLM, такими как ChatGPT, Gemini и Claude.

Wireless-Tag утверждает, что комплект разработчика подходит для «95% приложений AIoT: от устройств для умного дома до настольных игрушек, робототехники и инструментов».

В некотором смысле он похож на SenseCAP Watcher, но имеет больший, несенсорный дисплей и двойной микрофонный вход. Однако он не поддерживает локальные языковые модели. Он также имеет стандартный интерфейс MikroBUS для расширения.

Для голосовых возможностей ESP32 Dev Kit интегрирует два встроенных микрофона с шумоподавлением и высококачественный динамик. Встроенный инфракрасный лазерный датчик приближения определяет близость и движение человека для «умного интерактивного опыта».

Характеристики комплекта разработчика ESP32 Agent:

  • MCU – двухъядерный микроконтроллер Tensilica LX7 ESP32-S3 @ 240 МГц, 8 МБ PSRAM
  • Память – 16 МБ флэш-памяти
  • Дисплей – 3,5-дюймовый сенсорный экран, разрешение 480×360
  • Камера – модуль камеры OmniVision OV5647 5 МП, поле зрения 120°
  • Аудио – Hi-Fi динамик; два высокочувствительных микрофона
  • Сетевые возможности – Wi-Fi 2,4 ГГц, Bluetooth 5 (LE) через ESP32-S3
  • USB – 1x USB-C (питание и программирование)
  • Расширение – интерфейс MikroBUS
  • Разное – Инфракрасный датчик приближения
  • Питание – 5 В постоянного тока
  • Размеры – 94 x 62 x 13,6 мм
  • Рабочая температура – ​​от 0 до 60°C

ESP32 Agent Dev Kit поддерживает платформы разработки Arduino IDE и ESP-IDF и предлагает взаимодействие в реальном времени через Volcano Engine RTC и OpenAI’s Realtime API. Он поддерживает ChatGPT, Claude и Gemini через платформу Coze AI .

Хотя устройство позиционируется как устройство с открытым исходным кодом, в репозитории GitHub содержится ограниченная информация. Прошивка продукта находится в двоичном формате, а код драйвера, написанный на языке C, предоставляется в виде tarball, что сводит на нет смысл использования системы контроля версий, такой как git…

Краудфандинговая кампания уже запущена на Kickstarter и уже превзошла свою цель в 1668 долларов США за несколько дней до ее начала. Продукт предлагается за 40 долларов на Kickstarter, а целевая розничная цена составляет 69 долларов. Он немного дешевле, чем ранее упомянутый SenseCAP Watcher, но имеет меньше заметных функций. Ожидается, что поставки начнутся в марте 2025 года.

Выражаем свою благодарность источнику из которого взята и переведена статья, сайту cnx-software.com.

Оригинал статьи вы можете прочитать здесь.

0 0 votes
Article Rating
Подписаться
Уведомление о
guest

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

0 Комментарий
Inline Feedbacks
View all comments