Запустили процессор Qualcomm Centriq 2400 ARM для центров обработки данных и сравнили его с Intel Xeon SoC


Над серверным процессором Qualcomm Centriq 2400 ARM работают уже четыре года. Компания продемонстрировала первый коммерческий образец в четвертом квартале 2016 года, используя технологию 10-нм FinFET, процессор содержит до 48 ядер Qualcomm Falkor на основе архитектуры ARMv8, оптимизированные для рабочих нагрузок центра обработки данных. Совсем недавно, компания предоставила несколько подробностей о ядре Falkor, полностью настроенный с использованием 64-битной микроархитектуры на основе ARMv8 / Aarch64.

Теперь компания официально запустила Систему на кристалле и объявила о начале коммерческих поставок процессора Centriq 2400.

Основные характеристики и спецификации Qualcom Centriq 2400:

  • Процессор – до 48 физических ARMv8 совместимых 64-битных ядра Falkor @ 2.2 ГГц (базовая частота) / 2.6 ГГц (пиковая частота)
  • Кэш – 64 Кб L1 кэш инструкция с 24 Кб одиночным циклом L0 кэша, 512 Кб кэш L2 для каждой пары; 60 МБ унифицированного кеша L3; Кэш QoS
  • Память – 6 каналов DDR4 2667 МГц для оперативной памяти до 768 Гб; пик совокупной пропускной способности 128 Гб / с; линейное сжатие пропускной способности
  • Интегрированные чипсеты – 32 линии PCIe Gen3 с 6 контролерами PCIe; низкоскоростные входы и выходы; контроллер управления
  • Безопасность – Root of trust, EL3 (TrustZone) и EL2 (гипервизор)
  • TDP — <120 Вт (~ 2,5 Вт на ядро)
Нажмите, чтобы увеличить

Система на кристалле совместима с ARM SBSA v3, это может означать, что она может работать с любой совместимой операционной системой, не прибегая к “Cute Embedded Nonsense Hacks“. Процессор оптимизирован для облачных рабочих нагрузок, а также  компания продемонстрировала и объяснила, что система на кристалле уже используется для следующих задач:

  • Веб-интерфейс с HipHop Virtual Machine
  • Базы данных NoSQL, включая MongoDB, Varnish, Scylladb
  • Облачные средства организации и автоматизации, включая Kubernetes, Docker, metal-as-a-service (MAAS)
  • Аналитика данных, включая Apache Spark
  • Модели глубинного обучения
  • Виртуализация сетевых функций
  • Ускорение обработки видео и изображений
  • Многоядерная автоматизация электронного проектирования
  • Высокопроизводительная вычислительная биоинформатика
  • Нейронные сети
  • Платформа OpenStack
  • Развертывание серверных систем SAN с NVMe
  • Сетевая разгрузка на сервере

Сегодня уже доступно три комплекта Qualcom Centriq 2400:

  • Centriq 2434 – 40 ядер @ 2.3 / 2.5 ГГц; 50 Мб L3 кэш; TDP 110 Вт
  • Centriq 2452 – 46 ядер @ 2.2 / 2.6 ГГц; 57.5 Мб L3 кэш; TDP 120 Вт
  • Centriq 2460 – 48 ядер @ 2.2 / 2.6 ГГц; 60 Мб L3 кэш; TDP 120 Вт

Для сравнения с процессором Qualcomm Centriq 2460 (48-ядра) был взят Intel Xeon Platinum 8160 с 24-ядра / 48 потоков (150 Вт) и было обнаружено, что он немного лучше работает как в целом, так и в тестах с плавающей запятой.

Наиболее важными показателя для серверных SoC является производительность на Ватт, производительность на поток и производительность на доллар, поэтому компания Qualcomm сравнила свои процессоры Centriq 2460, 2452 и 2434 с процессорами Intel Xeon Platinum 8180 (28 ядер / 205 Вт TDP), Xeon Gold 6152 (22 ядра / 140 Вт TDP) и Xeon Silver 4116 (12 ядер / 85 Вт TDP). Было установлено, что при использовании теста SPECint_rate2006 производительность на Ватт была значительно лучше у чипа Qualcomm.

SoC Qualcomm тоже выглядит превосходно в производительности на доллар, но …

Qualcomm взяли цены на процессоры Xeon из Intel ARK и там последние цены не всегда соответствуют реальной стоимости продажи чипов, по крайне мере, для процессоров с низким энергопотреблением Apollo Lake / Cherry Trail.

Это по сравнению с ценами на Centriq 2434 ($880), Centriq 2452 ($1,373) и Centriq 2460 ($1,995).

Qualcomm также может похвастаться лучшей производительностью на mm2 и символическим энергопотреблением Centriq 2460 при нагрузке около 60 Вт, что значительно ниже 120 Вт TDP. Потребляемая мощность в режиме ожидания составляет около 8 Вт, а с использованием режима C1, меньше 4 Вт.

Если у вас есть какие-нибудь сомнения в предоставленных тестах компании, то можно взглянуть на независимые тесты от Cloudflare серверных процессоров Qualcomm Centriq и Intel  Skylake / Broadwell, используя Openssl speed, алгоритмы сжатия (gzip, brotli…), Go, веб-сервер NGINX и другие.

Производительность Multicore OpenSSL

Как правило, производительность одноядерных процессоров Intel лучше, но поскольку ARM имеет больше ядер, многопоточная производительность часто лучше на ARM. Вот выводы:

Инженерный образец, который был получен, очень впечатляющий. Это огромный шаг вперед по сравнению с всеми предыдущими попытками серверов на базе ARM. Конечно, ядро Intel Skylake гораздо лучше, но как только вы посмотрите на системный уровень, производительность становиться очень привлекательной.

Производственная версия Centriq SoC будет содержать до 48 ядер Falkor, работающих на частоте до 2,6 ГГц, что повысит производительность на 8%.

Очевидно, что сервер Skylake, который был протестирован, это не флагман Platinum блока, имеющий 28 ядер, поскольку 28 ядер обладают большей ценой и более 200 Вт TDP, тогда как многие прямо заинтересованы в показателях в производительности на доллар и на Ватт.

На данный момент основной проблема является слабая производительность языка Go, но это обязательно должно быстро улучшится, поскольку серверы на базе ARM начали занимать некоторую долю рынка.

Производительность C и LuaJIT является очень конкурентоспособной, и во многих случаях превосходит Skylake. Почти во всех тестах Falkor показывает себя в качестве достойного обновления от Broadwell.

Самая большая победа для Falkor — это конечно же низкое энергопотребление. Хотя он имеет 120 Вт TDP , но во время тестов он ни раз не превысил 89 Вт. Для сравнения, Skylake и Broadwell превысили более 160 Вт, в то время как TDP обоих процессоров составляет 170 Вт.

Вернемся к программному обеспечению, SoC поддерживает большие экосистемы с такими технологиями, как memcached, MongoDB, MySQL, …, облачные решения для управления, такие как Openstack и Kubernetes, языки программирования (Java, Python, PHP, Node, Golang…), инструменты (GVV/ LLVM, GBD…), решения для визуализации включая KVM, Xen и Docker, а также операционные системы: Ubuntu, Redhat, Suse и Centos.

Компания Qualcomm уже работает над следующим поколением SoC: Firetail на базе ядра Qualcomm Saphira. Но пока нет никаких подробностей.

Выражаем свою благодарность источнику с которого взята и переведена статья, сайту cnx-software.com.

Оригинал статьи вы можете прочитать здесь.

Комментарии:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.