Picovoice поддерживает настраиваемое слово для пробуждения, автономное распознавание голоса на Raspberry Pi

4-микрофонный массив ReSpeaker – это Raspberry Pi HAT с четырьмя микрофонами, которые могут работать с такими сервисами, как Google Assistant или Amazon Echo. Он был запущен в 2017 году. Так что ничего нового в аппаратном обеспечении.

Читать далее «Picovoice поддерживает настраиваемое слово для пробуждения, автономное распознавание голоса на Raspberry Pi»

Аудио плата RPI_AC108 стоимостью $13 поставляется с 4-микрофонным массивом для Raspberry Pi

X-Powers является дочерней компанией Allwinner, которая более известна своими PMIC-чипами для процессоров Allwinner Cortex-A. В 2017 году компания выпустила свой четырехканальный чип АЦП X-Powers AC108 для микрофонного массива.

Вскоре после этого компания Seeed Studio выпустила свою плату ReSpeaker 4-Mic Array на базе X-Powers AC108 для Raspberry Pi и с тех самых пор почти не было статей на CNX об аудио-чипах. Но сегодня в обзоре будет рассмотрена аудио плата RPI_AC108 с четырьмя микрофонами и несколькими светодиодами, которая основана на базе того же чипа. Читать далее «Аудио плата RPI_AC108 стоимостью $13 поставляется с 4-микрофонным массивом для Raspberry Pi»

3,5 мм/USB стереомикрофон может сделать дешевый 2-микрофонный массив

Ранее мы писали о возможности использования камеры Sony PS3 Eye в качестве недорогого 4-микрофонного массива, так как в то время (август 2019 года) она продавалась за 7,5 долларов США, а на Amazon ее еще можно найти за 13 долларов. Но, мы нашли даже более дешевый вариант – крошечный стереомикрофон, который подключен к 3,5-мм аудиоразъему на вашем телефоне или компьютере и продается за пару долларов (2$ – 5$) на таких сайтах, как Aliexpress  (2,15$) или GearBest.

Читать далее «3,5 мм/USB стереомикрофон может сделать дешевый 2-микрофонный массив»

Плата для разработки ESP32-Korvo AI использует голосовой помощник ESP-Skainet

В сентябре прошлого года компания Espressif Systems представила голосовой помощник ESP-Skainet, оптимизированный для беспроводных SoC ESP8266 и ESP32 с поддержкой WakeNet, позволяющий обнаруживать «слово пробуждения» и MultiNet – для распознавания речевых команд, причем первый требует всего 20 Кб оперативной памяти для одного слова, а второй поддерживает до 100 автономных команд, при 4 Мб или более SPI flash.

Читать далее «Плата для разработки ESP32-Korvo AI использует голосовой помощник ESP-Skainet»

Характеристики процессора Allwinner R329 для смарт-динамиков, с Arm China AIPU (блок обработки искусственного интеллекта)

Allwinner R328 – это процессор с двумя ядрами Cortex-A7 со встроенной оперативной памятью 64 Мб или 128 Мб, разработанный для недорогих смарт-динамиков, представленный в прошлом году и используемый в смарт-динамиках, продаваемых на материковом Китае.

Согласно недавнему пресс-релизу (только на китайском языке), компания выпустила 64-разрядное обновление – процессором Allwinner R329 с двумя ядрами Cortex-A53, оснащенным двойным HIFI4 DSP для пост-обработки и предварительной обработки звука, а также Arm China’s AIPU (блок обработки искусственного интеллекта), обеспечивающий до 0,256 TOPS при очень низкой мощности.

Читать далее «Характеристики процессора Allwinner R329 для смарт-динамиков, с Arm China AIPU (блок обработки искусственного интеллекта)»

Thundercomm представляет модули на базе Qualcomm для интеллектуальных динамиков, LTE IoT, Smart Retail и приложений 5G

Компания Thundercomm Technology Co., Ltd. (также известная как Thundercomm), расположенная в Калифорнии в США, является поставщиком продуктов и технологий IoT для OEM / ODM, предприятий и разработчиков. Компания представила несколько основанных на Qualcomm «TurboX Systems-on-Module» для интеллектуальных динамиков, устройств IoT LPWAN с возможностью подключения NB-IoT и LTE Cat M1, приложений для розничной торговли и устройств с питанием 5G.

Читать далее «Thundercomm представляет модули на базе Qualcomm для интеллектуальных динамиков, LTE IoT, Smart Retail и приложений 5G»

Paranoid Mute или глушитель микрофона вашего “Умного динамика” для повышения конфиденциальности

“Умные динамики” обычно непрерывно работают, прислушиваясь к слову-пробуждению, которое обрабатывается локально, прежде чем слушать вашу более сложную команду и отправлять звук на облако для обработки. Это означает, что большую часть времени данные не отправляются на облако, так как непрерывная обработка звука на облаке будет экономически не эффективной.

Однако, в отдельных случаях, компания может захотеть прослушать аудио-фрагменты, чтобы улучшить свой продукт (ы), и это возможно, поскольку аппаратные средства вполне способны на это. Кроме того, хакеры всегда могут получить доступ к вашему “умному динамику”. Поэтому, если вы беспокоитесь о своей конфиденциальности, и все же хотите комфортно пользоваться “умным динамиком“, стороннее решение для управления микрофоном должно повысить конфиденциальность устройства.

Читать далее «Paranoid Mute или глушитель микрофона вашего “Умного динамика” для повышения конфиденциальности»

Двухъядерный процессор Amlogic A113L Cortex-A35 предназначен для приложений Smart Audio и IoT

Более двух лет назад мы сообщали о процессорах Amlogic A111, A112, A113, предназначенных для аудио приложений, таких как интеллектуальные колонки. A111 имеет четыре 32-разрядных ядра Cortex-A5, а процессоры A112 и A113D/A113X поставляются с четырьмя ядрами Cortex-A53.

С тех пор мы почти ничего не слышали о них, но все эти процессоры все еще перечислены на веб-сайте Amlogic. A112, предположительно, используется в интеллектуальном динамике Xiaomi AI, а Amlogic A113X1 Far-Field Dev Kit по-прежнему включен в список комплектов для разработки Amazon для голосового сервиса Alexa, но на данный момент его нет в наличии.

Читать далее «Двухъядерный процессор Amlogic A113L Cortex-A35 предназначен для приложений Smart Audio и IoT»