Конференция разработчиков Rockchip 2025 (RKDC!2025) проходит в Фучжоу, Китай. Среди анонсов — процессор Rockchip RK3668 с 10 ядрами Arm Cortex-A730/A530, NPU 16 TOPS и сопроцессор RK182X на RISC-V, поддерживающий LLM (Large Language Model) или VLM (Vision Language Model) до 7B параметров.
10-ядерный SoC Rockchip RK3668 на Armv9
Рассмотрим SoC Rockchip RK3668, который выглядит весьма схожим с чипом RK3688, представленным в прошлом году , но имеет отличия.
Предварительные характеристики Rockchip RK3668:
- ЦП – 4x Cortex-A730 + 6x Cortex-A530 (Armv9.3) с производительностью около 200K DMIPS; примечание: ни одно ядро еще не анонсировано Arm
- ГП – Arm Magni GPU с производительностью до 1-1.5 TFLOPS
- AI-ускоритель – NPU RKNN-P3 16 TOPS
- ВПУ – Декодер видео 8K 60 FPS
- ISP – AI-улучшенный ISP с поддержкой до 8K @ 30 FPS
- Память – LPDDR5/5x/6 до 100 ГБ/с
- Накопитель – UFS 4.0
- Видеовыход – HDMI 2.1 до 8K 60 FPS, MIPI DSI
- Интерфейсы периферии – PCIe, UCIe
- Техпроцесс – 5~6 нм
RK3688 оснащается восемью большими и четырьмя малыми ядрами, тогда как RK3668 предлагает конфигурацию с четырьмя большими и шестью малыми ядрами. RK3688 также обладает AI-ускорителем 32 TOPS, пропускной способностью памяти LPDDR6 до 200 ГБ/с, декодером видео 16Kp30 и кодировщиком видео 8Kp60.
Публичной информации о RK3668 мало; данные найдены через Radxa в X , который планирует выпустить одноплатник ROCK 6 на основе нового SoC.
Ускоритель LLM/VLM Rockchip RK182X
Второй анонс, замеченный благодаря BG5SUN в X , касается сопроцессора RK182X 3B/7B LLM/VLM.
Он включает многоядерный ЦП RISC-V, DRAM 2.5 ГБ или 5 ГБ со “сверхвысокой пропускной способностью”, а также интерфейсы PCIe 2.0, USB 3.0 и Ethernet для подключения к хост-процессору. Компания указывает, что модели на 7B параметров (INT4/FP4) помещаются в 3.5 ГБ ОЗУ. Решение предназначено для SoC Rockchip RK3576/RK3588 (уже оснащенных NPU 6 TOPS) и других процессоров.
Поддержка обеспечивается RKNN3 Toolkit, включая фреймворки PyTorch, ONNX, TensorFlow и HuggingFace GGUF (GPT-Generated Unified Format).
Rockchip также предоставила данные производительности для популярных дистиллированных моделей, таких как Qwen2.5 и DeepSeek R1.
Ранее отмечалась возможность запуска DeepSeek-R1-Distill-Qwen-1.5B на RK3588 с использованием его NPU 6 TOPS . Производительность при решении простого уравнения составляла 188.53 токенов/с (prefill) и 14.93 токенов/с (generate). Прямое сравнение с Qwen2.5-1.5B выше может быть некорректным, но данные демонстрируют прирост производительности с RK182X: свыше 2000 токенов/с (prefill) и около 120 токенов/с (decode). Это примерно в 8-10 раз быстрее, чем при использовании NPU (и памяти) RK3588.
Выражаем свою благодарность источнику, с которого взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.