Arm представляет процессоры Cortex-X925 и Cortex-A725, GPU Immortalis-G925, ПО Kleidi AI

Arm анонсировала новые процессоры Armv9 и GPU Immortalis для мобильных SoC, а также ПО Kleidi AI, оптимизированное для процессоров Arm от архитектур Armv7 до Armv9.

Arm SoC with Cortex-X925 Cortex-A725 Cortex-A520 CPU with Immortalis-G925 GPU
Пример SoC с IP Arm 2024 года (TCS 2024)

Новые ядра Armv9.2 включают Cortex-X925 “Blackhawk” со значительным ростом производительности CPU и AI, Cortex-A725 с улучшенной энергоэффективностью, и обновленную версию Cortex-A520 с 15-процентным приростом эффективности. Также представлены три новых GPU: флагманский Immortalis-G925 (до 14 ядер) с ростом производительности 3D-графики до 37% по сравнению с прошлогодним 12-ядерным Immortalis-G720 , Mali-G725 (6-9 ядер) для премиум-смартфонов и Mali-G625 (1-5 ядер) для умных часов и устройств начального уровня.

Arm Cortex-X925

Cortex-X925 демонстрирует 36% улучшение пиковой однопоточной производительности в Geekbench 6.2 по сравнению с флагманским Android-смартфоном на Cortex-X4, и примерно 41% прирост производительности AI по времени до первого токена tiny-LLama (Q4). Ядро реализовано на FPGA-платформе со следующей конфигурацией: Cortex-X925 @ 3.8 ГГц, 2 МБ L2, 16 МБ L3, 32 МБ SLC, DSU @ 2 ГГц, память LPDDR5x-8533.

Cortex-X925 performance benchmarks

Измеренный прирост производительности AI для Phi3 по времени до первого токена составил 46%. Также заявлено ускорение запуска приложений на 33% в среднем для пяти из топ-10 Android-приложений и ускорение веб-сёрфинга на 60% по бенчмарку Speedometer 2.1. Поддерживаются ОС Android, Linux и Windows, что предполагает использование не только в смартфонах, но и в мобильных/ИИ-ПК.

Ядро Cortex-X925 оптимизировано для 3-нм техпроцессов. Детали доступны на сайте разработчика .

Arm Cortex-A725 и улучшения ядра Cortex-A520.

Cortex-A725 performance and efficiency

Cortex-A725 превосходит Cortex-A720 и Cortex-A780 по производительности и эффективности. Он обеспечивает 35% рост энергоэффективности относительно Cortex-A720, 25% улучшение энергопотребления и 20% снижение трафика L3. Энергоэффективность здесь — отношение прироста производительности к приросту энергопотребления для достижения этой производительности. Пиковые показатели получены на 3-нм тестовом чипе с кэшами 64 КБ L1 и 8 МБ L3 против 4-нм Cortex-A720. Arm утверждает, что основной вклад в рост эффективности вносит микроархитектура Cortex-A725.

Cortex-A520 energy savings

Cortex-A520 обновлен реализацией и 3-нм техпроцессом, что дает до 15% прироста эффективности относительно Cortex-A520 в TCS23.

GPU Immortalis-G925, Mali-G725 и Mali-G625

Immortalis-G925 GPU performance benchmarks

Как и Cortex-X925, Immortalis-G925 значительно превосходит Immortalis-G720: +37% в графических приложениях, +34% в ИИ-выводах (тестирование в fp16), +52% в трассировке лучей. По данным Arm , средний прирост производительности Immortalis-G925 в мобильных устройствах составляет 46% против Immortalis-G720. Примеры: Genshin Impact (+49%), Roblox (+46%). Тестирование Call of Duty Mobile, Diablo Immortal, The Day After Tomorrow, Fortnite и PUBG Mobile показало прирост от 29% до 72%. Средняя энергоэффективность в топовых играх улучшена на 30%.

Immortalis-G925 AI ML performance

Улучшения производительности AI Immoratlis-G925 в задачах классификации изображений, сегментации, детекции объектов, NLP и других…Детали о Mali-G725 и Mali-G625 не раскрываются. Это уменьшенные версии Immortalis-G925 с меньшим числом ядер и поддержкой трассировки лучей для устройств среднего и начального уровня.

Immortalis-G925, Mali-G725, Mali-G625

ПО Kleidi AI

Arm Kleidi — набор библиотек и сообществ разработчиков для ускорения разработки ИИ. Библиотеки поддерживают популярные ИИ-фреймворки и оптимизированы для процессоров Arm от Armv7 (с использованием расширения SIMD для ML-задач) до Armv9 (с функциями для генеративного ИИ на CPU Arm).

Arm KleidiAI

Kleidi включает два проекта: KleidiAI (нейронные сети и движки вывода) и KleidiCV (оптимизация библиотеки компьютерного зрения OpenCV).

KleidiAI содержит оптимизированные ИИ-ядра, работающие через MediaPipe (через XNNPACK), LLAMA.cpp, PyTorch (через ExecuTorch) и TensorFlow Lite (через XNNPACK). Заявлено ускорение времени до первого токена для LLM Llama 3 (Meta) и Phi-3 (Microsoft) через llama.cpp на 190% на Cortex-X925 относительно эталонной реализации llama.cpp. KleidiAI также интегрируется в ИИ-движок Unity Sentis для разработчиков игр.

KleidiCV создан совместно с OpenCV для оптимизации 2500+ алгоритмов компьютерного зрения. Реализации с оптимизацией NEON/SVE2 дают в среднем 75% прироста производительности. Сборки для Android добавляются в репозиторий Maven Central для компонентов ПО с открытым исходным кодом в разработке на Java.

Arm KleidiCV

Дополнительные сведения о Kleidi доступны в анонсе .

Всё это формирует Arm Compute Subsystems for Client (Arm CSS for Client) для интеграции в SoC ИИ-ПК, смартфонов и потребительских устройств. Первые устройства на Cortex-X925 или Cortex-A725 ожидаются не ранее 2025 года.

Выражаем свою благодарность источнику, с которого взята и переведена статья, сайту cnx-software.com.

Оригинал статьи вы можете прочитать здесь.

0 0 votes
Article Rating
Подписаться
Уведомление о
guest

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

0 Комментарий
Inline Feedbacks
View all comments