В сентябре прошлого года компания Espressif Systems представила голосовой помощник ESP-Skainet, оптимизированный для беспроводных SoC ESP8266 и ESP32 с поддержкой WakeNet, позволяющий обнаруживать «слово пробуждения» и MultiNet – для распознавания речевых команд, причем первый требует всего 20 Кб оперативной памяти для одного слова, а второй поддерживает до 100 автономных команд, при 4 Мб или более SPI flash.
Читать далее «Плата для разработки ESP32-Korvo AI использует голосовой помощник ESP-Skainet»Характеристики процессора Allwinner R329 для смарт-динамиков, с Arm China AIPU (блок обработки искусственного интеллекта)
Allwinner R328 – это процессор с двумя ядрами Cortex-A7 со встроенной оперативной памятью 64 Мб или 128 Мб, разработанный для недорогих смарт-динамиков, представленный в прошлом году и используемый в смарт-динамиках, продаваемых на материковом Китае.
Согласно недавнему пресс-релизу (только на китайском языке), компания выпустила 64-разрядное обновление – процессором Allwinner R329 с двумя ядрами Cortex-A53, оснащенным двойным HIFI4 DSP для пост-обработки и предварительной обработки звука, а также Arm China’s AIPU (блок обработки искусственного интеллекта), обеспечивающий до 0,256 TOPS при очень низкой мощности.
Читать далее «Характеристики процессора Allwinner R329 для смарт-динамиков, с Arm China AIPU (блок обработки искусственного интеллекта)»Thundercomm представляет модули на базе Qualcomm для интеллектуальных динамиков, LTE IoT, Smart Retail и приложений 5G
Компания Thundercomm Technology Co., Ltd. (также известная как Thundercomm), расположенная в Калифорнии в США, является поставщиком продуктов и технологий IoT для OEM / ODM, предприятий и разработчиков. Компания представила несколько основанных на Qualcomm «TurboX Systems-on-Module» для интеллектуальных динамиков, устройств IoT LPWAN с возможностью подключения NB-IoT и LTE Cat M1, приложений для розничной торговли и устройств с питанием 5G.
Читать далее «Thundercomm представляет модули на базе Qualcomm для интеллектуальных динамиков, LTE IoT, Smart Retail и приложений 5G»Paranoid Mute или глушитель микрофона вашего “Умного динамика” для повышения конфиденциальности
“Умные динамики” обычно непрерывно работают, прислушиваясь к слову-пробуждению, которое обрабатывается локально, прежде чем слушать вашу более сложную команду и отправлять звук на облако для обработки. Это означает, что большую часть времени данные не отправляются на облако, так как непрерывная обработка звука на облаке будет экономически не эффективной.
Однако, в отдельных случаях, компания может захотеть прослушать аудио-фрагменты, чтобы улучшить свой продукт (ы), и это возможно, поскольку аппаратные средства вполне способны на это. Кроме того, хакеры всегда могут получить доступ к вашему “умному динамику”. Поэтому, если вы беспокоитесь о своей конфиденциальности, и все же хотите комфортно пользоваться “умным динамиком“, стороннее решение для управления микрофоном должно повысить конфиденциальность устройства.
Двухъядерный процессор Amlogic A113L Cortex-A35 предназначен для приложений Smart Audio и IoT
Более двух лет назад мы сообщали о процессорах Amlogic A111, A112, A113, предназначенных для аудио приложений, таких как интеллектуальные колонки. A111 имеет четыре 32-разрядных ядра Cortex-A5, а процессоры A112 и A113D/A113X поставляются с четырьмя ядрами Cortex-A53.
С тех пор мы почти ничего не слышали о них, но все эти процессоры все еще перечислены на веб-сайте Amlogic. A112, предположительно, используется в интеллектуальном динамике Xiaomi AI, а Amlogic A113X1 Far-Field Dev Kit по-прежнему включен в список комплектов для разработки Amazon для голосового сервиса Alexa, но на данный момент его нет в наличии.
Читать далее «Двухъядерный процессор Amlogic A113L Cortex-A35 предназначен для приложений Smart Audio и IoT»UNISOC V5663 Arm Cortex-M33 AIoT SoC поставляется с 802.11 b/g/n/ac WiFi 5, Bluetooth 5.1
UNISOC выпустил новый процессор для приложений AIoT (Artificial Intelligence + IoT) с двухъядерным процессором Cortex-M3 V5663, поддержкой двухдиапазонного Wi-Fi 5, Bluetooth 5.1 и такими аудио функциями, как датчик голосовой активности и поддержка массива микрофонов. Все это должно сделать его идеальным для смарт- динамиков и других аудио-приложений.
Голосовой помощник Espressif ESP-Skainet предлагает механизм обнаружения «слова пробуждения» и распознавание речевых команд для встроенных микроконтроллеров
Теперь у нас есть ESP-Skainet, предоставленный Espressif Systems. ESP-Skainet – это интеллектуальный голосовой помощник, в котором реализован механизм обнаружения «слова пробуждения» WakeNet и распознание речевых команд MultiNet .
WakeNet
WakeNet был специально разработан для микроконтроллеров с низким энергопотреблением, таких как ESP8266 или ESP32, с небольшим объемом памяти (20 КБ ОЗУ) и высокой скоростью вычислений, что позволяет ему успешно обнаруживать «слово пробуждения» даже в шумной среде.
Использование Sony PS3 Eye Camera в качестве недорогого микрофонного массива
Примерно два года назад мы опубликовали статью, показывающую в сравнении работу микрофонного массива и одного USB-микрофона, и, последний продемонстрировал неудовлетворительную скорость обнаружения при пробуждении на расстоянии около 3 метров даже в тихой комнате, что усугублялось белым шумом или фоновой музыкой, в то время как микрофонный массив воспринимал слово «пробуждение» в любых условиях одинаково хорошо.
Стоимость комплектов для разработки умных акустических систем варьируется от 500 долларов США за комплект разработчика Intel с поддержкой распознания речи до 129 долларов США за комплект разработчика с 3-мя микрофонами Amazon AVS на базе Allwinner R18 и 99 долларов за ReSpeaker Core v2. Если у вас уже есть плата Raspberry Pi 3/4, вы можете получить более дешевые варианты, такие как ReSpeaker 4-Mic Array, за 25 долларов, но ничто не сравнится с ценой камеры Sony PS3 Eye, которая поставляется с массивом из 4 микрофонов и продается на Amazon примерно за 7,5 $. Возможно, у вас уже есть она, поэтому не стоит тратить дополнительные деньги. Читать далее «Использование Sony PS3 Eye Camera в качестве недорогого микрофонного массива»