Плата для разработки ESP32-Korvo AI использует голосовой помощник ESP-Skainet

В сентябре прошлого года компания Espressif Systems представила голосовой помощник ESP-Skainet, оптимизированный для беспроводных SoC ESP8266 и ESP32 с поддержкой WakeNet, позволяющий обнаруживать «слово пробуждения» и MultiNet – для распознавания речевых команд, причем первый требует всего 20 Кб оперативной памяти для одного слова, а второй поддерживает до 100 автономных команд, при 4 Мб или более SPI flash.

Читать далее «Плата для разработки ESP32-Korvo AI использует голосовой помощник ESP-Skainet»

Характеристики процессора Allwinner R329 для смарт-динамиков, с Arm China AIPU (блок обработки искусственного интеллекта)

Allwinner R328 – это процессор с двумя ядрами Cortex-A7 со встроенной оперативной памятью 64 Мб или 128 Мб, разработанный для недорогих смарт-динамиков, представленный в прошлом году и используемый в смарт-динамиках, продаваемых на материковом Китае.

Согласно недавнему пресс-релизу (только на китайском языке), компания выпустила 64-разрядное обновление – процессором Allwinner R329 с двумя ядрами Cortex-A53, оснащенным двойным HIFI4 DSP для пост-обработки и предварительной обработки звука, а также Arm China’s AIPU (блок обработки искусственного интеллекта), обеспечивающий до 0,256 TOPS при очень низкой мощности.

Читать далее «Характеристики процессора Allwinner R329 для смарт-динамиков, с Arm China AIPU (блок обработки искусственного интеллекта)»

Thundercomm представляет модули на базе Qualcomm для интеллектуальных динамиков, LTE IoT, Smart Retail и приложений 5G

Компания Thundercomm Technology Co., Ltd. (также известная как Thundercomm), расположенная в Калифорнии в США, является поставщиком продуктов и технологий IoT для OEM / ODM, предприятий и разработчиков. Компания представила несколько основанных на Qualcomm «TurboX Systems-on-Module» для интеллектуальных динамиков, устройств IoT LPWAN с возможностью подключения NB-IoT и LTE Cat M1, приложений для розничной торговли и устройств с питанием 5G.

Читать далее «Thundercomm представляет модули на базе Qualcomm для интеллектуальных динамиков, LTE IoT, Smart Retail и приложений 5G»

Paranoid Mute или глушитель микрофона вашего “Умного динамика” для повышения конфиденциальности

“Умные динамики” обычно непрерывно работают, прислушиваясь к слову-пробуждению, которое обрабатывается локально, прежде чем слушать вашу более сложную команду и отправлять звук на облако для обработки. Это означает, что большую часть времени данные не отправляются на облако, так как непрерывная обработка звука на облаке будет экономически не эффективной.

Однако, в отдельных случаях, компания может захотеть прослушать аудио-фрагменты, чтобы улучшить свой продукт (ы), и это возможно, поскольку аппаратные средства вполне способны на это. Кроме того, хакеры всегда могут получить доступ к вашему “умному динамику”. Поэтому, если вы беспокоитесь о своей конфиденциальности, и все же хотите комфортно пользоваться “умным динамиком“, стороннее решение для управления микрофоном должно повысить конфиденциальность устройства.

Читать далее «Paranoid Mute или глушитель микрофона вашего “Умного динамика” для повышения конфиденциальности»

Двухъядерный процессор Amlogic A113L Cortex-A35 предназначен для приложений Smart Audio и IoT

Более двух лет назад мы сообщали о процессорах Amlogic A111, A112, A113, предназначенных для аудио приложений, таких как интеллектуальные колонки. A111 имеет четыре 32-разрядных ядра Cortex-A5, а процессоры A112 и A113D/A113X поставляются с четырьмя ядрами Cortex-A53.

С тех пор мы почти ничего не слышали о них, но все эти процессоры все еще перечислены на веб-сайте Amlogic. A112, предположительно, используется в интеллектуальном динамике Xiaomi AI, а Amlogic A113X1 Far-Field Dev Kit по-прежнему включен в список комплектов для разработки Amazon для голосового сервиса Alexa, но на данный момент его нет в наличии.

Читать далее «Двухъядерный процессор Amlogic A113L Cortex-A35 предназначен для приложений Smart Audio и IoT»

UNISOC V5663 Arm Cortex-M33 AIoT SoC поставляется с 802.11 b/g/n/ac WiFi 5, Bluetooth 5.1

UNISOC выпустил новый процессор для приложений AIoT (Artificial Intelligence + IoT) с двухъядерным процессором Cortex-M3 V5663, поддержкой двухдиапазонного Wi-Fi 5, Bluetooth 5.1 и такими аудио функциями, как датчик голосовой активности и поддержка массива микрофонов. Все это должно сделать его идеальным для смарт- динамиков и других аудио-приложений.

Читать далее «UNISOC V5663 Arm Cortex-M33 AIoT SoC поставляется с 802.11 b/g/n/ac WiFi 5, Bluetooth 5.1»

Голосовой помощник Espressif ESP-Skainet предлагает механизм обнаружения «слова пробуждения» и распознавание речевых команд для встроенных микроконтроллеров

Теперь у нас есть ESP-Skainet, предоставленный Espressif Systems. ESP-Skainet – это интеллектуальный голосовой помощник, в котором реализован механизм обнаружения «слова пробуждения» WakeNet и распознание речевых команд MultiNet .

WakeNet

WakeNet был специально разработан для микроконтроллеров с низким энергопотреблением, таких как ESP8266 или ESP32, с небольшим объемом памяти (20 КБ ОЗУ) и высокой скоростью вычислений, что позволяет ему успешно обнаруживать «слово пробуждения» даже в шумной среде.

Читать далее «Голосовой помощник Espressif ESP-Skainet предлагает механизм обнаружения «слова пробуждения» и распознавание речевых команд для встроенных микроконтроллеров»

Использование Sony PS3 Eye Camera в качестве недорогого микрофонного массива

Примерно два года назад мы опубликовали статью, показывающую в сравнении работу микрофонного массива и одного USB-микрофона, и, последний продемонстрировал неудовлетворительную скорость обнаружения при пробуждении на расстоянии около 3 метров даже в тихой комнате, что усугублялось белым шумом или фоновой музыкой, в то время как микрофонный массив воспринимал слово «пробуждение» в любых условиях одинаково хорошо.

Стоимость комплектов для разработки умных акустических систем варьируется от 500 долларов США за комплект разработчика Intel с поддержкой распознания речи до 129 долларов США за комплект разработчика с 3-мя микрофонами Amazon AVS на базе Allwinner R18 и 99 долларов за ReSpeaker Core v2. Если у вас уже есть плата Raspberry Pi 3/4, вы можете получить более дешевые варианты, такие как ReSpeaker 4-Mic Array, за 25 долларов, но ничто не сравнится с ценой камеры Sony PS3 Eye, которая поставляется с массивом из 4 микрофонов и продается на Amazon примерно за 7,5 $. Возможно, у вас уже есть она, поэтому не стоит тратить дополнительные деньги. Читать далее «Использование Sony PS3 Eye Camera в качестве недорогого микрофонного массива»