На этой неделе мы видели два анонса высокопроизводительных ядер RISC-V с процессорами SiFive P670 и Andes AX65, каждый из которых имеет 4-канальный конвейер, но T-Head Semiconductor Xuantie C908 от Alibaba немного отличается, имея 9-ступенчатым встроенный конвейер и поддержку ускорения расширения вектора RISC-V, предназначенного для AIoT-приложений среднего класса.
64-разрядное ядро RISC-V C908 принимает инструкцию RV64GCB[V] и соответствует профилю RVA22 для лучшей совместимости с Android и другими «богатыми» операционными системами. Компания заявляет, что его производительность находится между ядрами C906 и C910, представленными в 2020 и 2019 годах, соответственно.
Особенности XuanTie C908:
- 32-разрядная архитектура RV32GCB[V] и 64-разрядная архитектура RISC-V RV64GCB[V] с манипулированием битами и (дополнительно) расширениями векторных операций
- Поддержка режима RV32 COMPAT, который позволяет 64-битным процессорам RISC-V запускать 32-битный двоичный код, был объединен с Linux 5.19 .
- Расширения XuanTie, включая Instruction, Memory Attributes Extension (XMAE).
- Совместимость с профилем RVA22
- Кластер от 1 до 4 ядер
- 9-этапный конвейер двойного выпуска по заказу
- Привилегированные режимы — Машина, Супервизор и Пользователь.
- Виртуальная адресная система Sv39/Sv48
- Двухуровневая система кэш-памяти для поддержки согласованности аппаратного кэш-памяти и дополнительного ECC.
- Интерфейс шины — протокол AXI4/ACE с двумя дополнительными интерфейсами: портом согласованности устройств (DCP) и портом с низкой задержкой (LLP).
- Модуль расширенной защиты физической памяти (ePMP) с поддержкой до 64 областей.
- Отладка RISC-V и контроллер прерываний на уровне платформы (PLIC), с возможностью настройки до 1023 источников прерываний
Компания также предоставляет сравнение производительности с однопроцессорным процессором T-Head C906, но не предоставляет никаких данных, показывающих, как он сравнивается с процессором более высокого уровня C910.
C908 обеспечивает повышение производительности на 24-64% по сравнению с C906 с помощью синтетических тестов, таких как Linkpacks, Coremark, Whetstone и Dhrystone. Но нам ничего не говорят о техпроцессе и частоте тестируемых ядер, поэтому результаты могут быть бессмысленными, если только оба ядра не использовали один и тот же узел и частоту.
При этом XuanTie C908 может работать на частоте до 2 ГГц и обеспечивает динамическое энергопотребление всего 52,8 мВт/ГГц на ядро при использовании 12-нм техпроцесса TSMC. Энергоэффективность XuanTie C908 была улучшена более чем на 20% по сравнению с XuanTie C906 в (неопределенных) типичных сценариях при той же частоте и тех же ограничениях процесса.
Расширение RISC-V Vector Extension 1.0 действительно помогает с рабочими нагрузками ИИ, поскольку C908 в 2–3,5 раза быстрее, чем C906, мы полагаем, при тех же условиях, для обнаружения пробуждающих слов, классификации изображений, определения ключевых слов и обнаружения аномалий в MLPerf tiny. Тест производительности логического вывода V0.7 с использованием типа данных INT4.
Новое ядро C908 в конечном итоге должно быть размещено на веб-сайте T-Head, но на данный момент единственная публичная информация, которую нам удалось найти, была в блоге RISC-V.
Выражаем свою благодарность источнику из которого взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.