Оффлайн механизм для создания настраиваемых голосовых продуктов с искусственным интеллектом PicoVoice теперь имеет бесплатный уровень, который позволяет людям легко создавать собственные слова пробуждения и голосовые команды для трех пользователей на любом оборудовании, включая платы Raspberry Pi и Arduino.
Мы впервые узнали о PicoVoice около года назад, когда оффлайн механизм для создания голосовых продуктов с искусственным интеллектом был продемонстрирован на Raspberry Pi, оснащенном 4-микрофонным массивом ReSpeaker, что позволило представить собственный механизм пробуждающих слов Porcupine компании и механизм Rhino Speech-to-Intent. Демо-версия будет поддерживать 9 слов пробуждения с помощью Alexa, Bumblebee, Computer, Hey Google, Hey Siri, Jarvis, Picovoice, Porcupine и Terminator.
Что еще более важно, решение позволяет вам легко создавать свои собственные слова за считанные минуты из веб-интерфейса, просто набирая выбранное пробуждающее слово, без необходимости в сотнях образцов голоса или неделях ожидания, чтобы сделать это. Поэтому мы сначала попробовали команду «Эй ты», но она оказалась слишком короткой, поэтому мы изменили ее на «Дорогой хозяин» и смогли примерить её уже через 20 минут на нашем ноутбуке Ubuntu 20.04 с использованием браузера Firefox. На тот момент, механизм был доступен только для Windows, Linux или macOS, а для платформ Arm Linux требовалась коммерческая лицензия.
Но это на днях изменилось, поскольку уровень бесплатного пользования Picovoice позволяет любому, у кого есть адрес электронной почты или учетная запись GitHub, использовать Picovoice бесплатно, даже в коммерческих целях, для трех пользователей. Предложение включает в себя механизмы пробуждения Porcupine и Rhino Speech-to-Intent, а также новый механизм Cobra VAD. Компания заявляет: «Кредитная карта не требуется, никаких скрытых комиссий». Давай проверим.
Мы используем «Hello Omicron» и выбираем английский язык, но PicoVoice также поддерживает немецкий, испанский и французский. После того, когда мы нажмем кнопку «Train Wake Word», нас попросят выбрать платформу…
Хорошая новость в том, что мы больше не ограничены платформами x86, Raspberry Pi, BeagleBone, Nvidia Jetson, устройствами iOS и Android. macOS arm64 и даже Arm Cortex-M (например, Arduino Nano 33 BLE Sense ) поддерживаются на уровне бесплатного пользования. Мы не уверены в других платформах Arm Cortex-A Linux, может быть, если выбрать «Raspberry Pi» сработает? Единственное ограничение заключается в том, что вы можете тренировать только три слова для пробуждения в месяц, но этого должно хватить для большинства личных проектов.
На этот раз потребовалось всего несколько секунд после нажатия на «Train Wake Word», чтобы получить файл, необходимый для Raspberry Pi. У нас нет оборудования для этого, поэтому попробуем его более подробно в другой день, но мы все же можем подтвердить, что «Hello Omicron» отлично работает в Firefox, используя микрофон ноутбука. Прочтите документацию, чтобы узнать, с чего начать.
Что делать, если вам нужно обрабатывать более трех активных пользователей в месяц? Есть платный вариант за 899 долларов в месяц для 1000 активных пользователей. Мы не совсем понимаем, как он сравнивается с конкурентами, поскольку цены обычно не публикуются. Для компаний, которым требуется более 1000 пользователей, также предлагаются индивидуальные цены.
Выражаем свою благодарность источнику из которого взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.
Три активных пользователя в месяц. Имеется ввиду, что с одного аккаунта может работать 3 пользователя?
Это для одного из 3-х пользователей или три слова на один аккаунт?