Rockchip представляет RK3668: 10-ядерный SoC Arm Cortex-A730/Cortex-A530 с NPU 16 TOPS и сопроцессор RK182X для LLM/VLM

Конференция разработчиков Rockchip 2025 (RKDC!2025) проходит в Фучжоу, Китай. Среди анонсов — процессор Rockchip RK3668 с 10 ядрами Arm Cortex-A730/A530, NPU 16 TOPS и сопроцессор RK182X на RISC-V, поддерживающий LLM (Large Language Model) или VLM (Vision Language Model) до 7B параметров.

10-ядерный SoC Rockchip RK3668 на Armv9

Rockchip RK3668

Рассмотрим SoC Rockchip RK3668, который выглядит весьма схожим с чипом RK3688, представленным в прошлом году , но имеет отличия.

Предварительные характеристики Rockchip RK3668:

  • ЦП – 4x Cortex-A730 + 6x Cortex-A530 (Armv9.3) с производительностью около 200K DMIPS; примечание: ни одно ядро еще не анонсировано Arm
  • ГП – Arm Magni GPU с производительностью до 1-1.5 TFLOPS
  • AI-ускоритель – NPU RKNN-P3 16 TOPS
  • ВПУ – Декодер видео 8K 60 FPS
  • ISP – AI-улучшенный ISP с поддержкой до 8K @ 30 FPS
  • Память – LPDDR5/5x/6 до 100 ГБ/с
  • Накопитель – UFS 4.0
  • Видеовыход – HDMI 2.1 до 8K 60 FPS, MIPI DSI
  • Интерфейсы периферии – PCIe, UCIe
  • Техпроцесс – 5~6 нм

RK3688 оснащается восемью большими и четырьмя малыми ядрами, тогда как RK3668 предлагает конфигурацию с четырьмя большими и шестью малыми ядрами. RK3688 также обладает AI-ускорителем 32 TOPS, пропускной способностью памяти LPDDR6 до 200 ГБ/с, декодером видео 16Kp30 и кодировщиком видео 8Kp60.

Rockchip RK3688 specifications

Публичной информации о RK3668 мало; данные найдены через Radxa в X , который планирует выпустить одноплатник ROCK 6 на основе нового SoC.

Ускоритель LLM/VLM Rockchip RK182X

Второй анонс, замеченный благодаря BG5SUN в X , касается сопроцессора RK182X 3B/7B LLM/VLM.

RK182X LLM VLM co processor

Он включает многоядерный ЦП RISC-V, DRAM 2.5 ГБ или 5 ГБ со “сверхвысокой пропускной способностью”, а также интерфейсы PCIe 2.0, USB 3.0 и Ethernet для подключения к хост-процессору. Компания указывает, что модели на 7B параметров (INT4/FP4) помещаются в 3.5 ГБ ОЗУ. Решение предназначено для SoC Rockchip RK3576/RK3588 (уже оснащенных NPU 6 TOPS) и других процессоров.

RKNN3 Toolkit RK3588 RK3576 RK182X AI accelerator

Поддержка обеспечивается RKNN3 Toolkit, включая фреймворки PyTorch, ONNX, TensorFlow и HuggingFace GGUF (GPT-Generated Unified Format).

Rockchip также предоставила данные производительности для популярных дистиллированных моделей, таких как Qwen2.5 и DeepSeek R1.

RK182X performance Qwen2.5 DeepSeek R1

Ранее отмечалась возможность запуска DeepSeek-R1-Distill-Qwen-1.5B на RK3588 с использованием его NPU 6 TOPS . Производительность при решении простого уравнения составляла 188.53 токенов/с (prefill) и 14.93 токенов/с (generate). Прямое сравнение с Qwen2.5-1.5B выше может быть некорректным, но данные демонстрируют прирост производительности с RK182X: свыше 2000 токенов/с (prefill) и около 120 токенов/с (decode). Это примерно в 8-10 раз быстрее, чем при использовании NPU (и памяти) RK3588.

Выражаем свою благодарность источнику, с которого взята и переведена статья, сайту cnx-software.com.

Оригинал статьи вы можете прочитать здесь.

0 0 votes
Article Rating
Подписаться
Уведомление о
guest

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

0 Комментарий
Inline Feedbacks
View all comments