Ядро T-Head XuanTie C908 RISC-V предназначено для AIoT-приложений

На этой неделе мы видели два анонса высокопроизводительных ядер RISC-V с процессорами SiFive P670 и Andes AX65, каждый из которых имеет 4-канальный конвейер, но T-Head Semiconductor Xuantie C908 от Alibaba немного отличается, имея 9-ступенчатым встроенный конвейер и поддержку ускорения расширения вектора RISC-V, предназначенного для AIoT-приложений среднего класса.

64-разрядное ядро ​​RISC-V C908 принимает инструкцию RV64GCB[V] и соответствует профилю RVA22 для лучшей совместимости с Android и другими «богатыми» операционными системами. Компания заявляет, что его производительность находится между ядрами C906 и C910, представленными в 2020 и 2019 годах, соответственно.

Особенности XuanTie C908:

  • 32-разрядная архитектура RV32GCB[V] и 64-разрядная архитектура RISC-V RV64GCB[V] с манипулированием битами и (дополнительно) расширениями векторных операций
  • Поддержка режима RV32 COMPAT, который позволяет 64-битным процессорам RISC-V запускать 32-битный двоичный код, был объединен с Linux 5.19 .
  • Расширения XuanTie, включая Instruction, Memory Attributes Extension (XMAE).
  • Совместимость с профилем RVA22
  • Кластер от 1 до 4 ядер
  • 9-этапный конвейер двойного выпуска по заказу
  • Привилегированные режимы — Машина, Супервизор и Пользователь.
  • Виртуальная адресная система Sv39/Sv48
  • Двухуровневая система кэш-памяти для поддержки согласованности аппаратного кэш-памяти и дополнительного ECC.
  • Интерфейс шины — протокол AXI4/ACE с двумя дополнительными интерфейсами: портом согласованности устройств (DCP) и портом с низкой задержкой (LLP).
  • Модуль расширенной защиты физической памяти (ePMP) с поддержкой до 64 областей.
  • Отладка RISC-V и контроллер прерываний на уровне платформы (PLIC), с возможностью настройки до 1023 источников прерываний

Компания также предоставляет сравнение производительности с однопроцессорным процессором T-Head C906, но не предоставляет никаких данных, показывающих, как он сравнивается с процессором более высокого уровня C910.

C908 обеспечивает повышение производительности на 24-64% по сравнению с C906 с помощью синтетических тестов, таких как Linkpacks, Coremark, Whetstone и Dhrystone. Но нам ничего не говорят о техпроцессе и частоте тестируемых ядер, поэтому результаты могут быть бессмысленными, если только оба ядра не использовали один и тот же узел и частоту.

При этом XuanTie C908 может работать на частоте до 2 ГГц и обеспечивает динамическое энергопотребление всего 52,8 мВт/ГГц на ядро ​​при использовании 12-нм техпроцесса TSMC. Энергоэффективность XuanTie C908 была улучшена более чем на 20% по сравнению с XuanTie C906 в (неопределенных) типичных сценариях при той же частоте и тех же ограничениях процесса.

Расширение RISC-V Vector Extension 1.0 действительно помогает с рабочими нагрузками ИИ, поскольку C908 в 2–3,5 раза быстрее, чем C906, мы полагаем, при тех же условиях, для обнаружения пробуждающих слов, классификации изображений, определения ключевых слов и обнаружения аномалий в MLPerf tiny. Тест производительности логического вывода V0.7 с использованием типа данных INT4.

Новое ядро ​​C908 в конечном итоге должно быть размещено на веб-сайте T-Head, но на данный момент единственная публичная информация, которую нам удалось найти, была в блоге RISC-V.

Выражаем свою благодарность источнику из которого взята и переведена статья, сайту cnx-software.com.

Оригинал статьи вы можете прочитать здесь.

5 1 vote
Article Rating
Подписаться
Уведомление о
guest

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

0 Комментарий
Inline Feedbacks
View all comments