DeepSeek работает на Rockchip RK3588 с ИИ-ускорением на скорости около 15 токенов/с

Модель DeepSeek R1 вышла несколько недель назад, и Брайан Реммеле заявил о её локальном запуске на Raspberry Pi со скоростью 200 токенов в секунду, пообещав выпустить образ для Raspberry Pi «как только все тесты завершатся». Он уточнил, что Raspberry Pi 5 использовал несколько HAT, включая акселератор Hailo AI, но это вся доступная на данный момент информация; предполагается, что применялась дистиллированная модель с 1,5 миллиардами параметров.

Джефф Герлинг провёл собственные тесты с DeepSeek-R1 (Qwen 14B), но только на ЦПУ со скоростью 1,4 токена/с; позже для повышения производительности он установил видеокарту AMD W7700. Другие разработали модели TinyZero на основе DeepSeekR1, оптимизированные для Raspberry Pi, но они специализированы для задач обратного отсчёта и умножения и также работают только на ЦПУ. Поэтому было приятно увидеть инструкции от Radxa по запуску DeepSeek R1 (Qwen2 1.5B) на НПУ — точнее, 6 TOPS NPU-акселераторе SoC Rockchip RK3588 — с использованием инструментария RKLLM .

Rockchip RK3588 DeepSeek R1 NPU acceleration

Полная инструкция объясняет самостоятельную компиляцию модели, но для быстрой проверки Radxa предоставляет предварительно скомпилированный RKLLM из ModelScope, доступный по команде:

Архив содержит четыре файла:

  • configuration.json – конфигурационный файл
  • librkllmrt.so – библиотека RKLLM
  • llm_demo – демонстрационная программа
  • DeepSeek-R1-Distill-Qwen-1.5B.rkllm (1.9GB) – DeepSeek R1 Qwen 1.5B, скомпилированный с RKLLM
  • README.md

Запуск теста выполняется командой:

Radxa сообщает, что RK3588 выдаёт 14,93 токена/с для математического запроса

Решите уравнения x+y=12, 2x+4y=34, найдите значения x и y.

RK3588 DeepSeek Qwen 1.5B performance

Тестирование проводилось на Radxa ROCK 5B . Лично я не проверял, так как плата сейчас недоступна… Метод должен работать на других платах с Rockchip RK3588/RK3588S и даже RK3576, поскольку они используют одинаковый НПУ. Banana Pi также опубликовала пост в X с видео работы DeepSeek R1 (Qwen 1.5B) на плате Banana Pi BPI-M7 (RK3588).

Выражаем свою благодарность источнику, с которого взята и переведена статья, сайту cnx-software.com.

Оригинал статьи вы можете прочитать здесь.

0 0 votes
Article Rating
Подписаться
Уведомление о
guest

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

0 Комментарий
Inline Feedbacks
View all comments