Ник Смит уже несколько лет занимается созданием кластера из плат на базе архитектуры Arm, начиная с плат Raspberry Pi, включая кластер с 5 узлами RPI 3, перед тем как перейти на другие платы, такие как Orange Pi 2E, Pine A64 + или NanoPC-T3.
Его последний дизайн основан на двенадцати платах NanoPi Fire3 с 8 ядрами, в результате чего общее количество ядер доходит до 96. Платформа может быть не очень полезной для реальных приложений HPC из-за ограниченной мощности и памяти, но, может быть полезной для применения в сфере обучения и разработки, особенно учитывая то, что это портативное решение. Ник также указал на несколько интересных моментов и разоблачений.
Внешне устройство выглядит красиво – с блестящими мигающими светодиодами, и, похоже, имеет надлежащее охлаждение. Кластер может доставлять 60 000 MFLOPS с Linpack, что позволяет отнести его к 250 самых быстрых компьютеров в мире! Подобная характеристика возвращает нас в 2000 годы? на сегодняшний день , это довольно медленно, но это интересный исторический факт.
Ник также сравнил цены NanoPi Fire3 и Raspberry Pi 3 в Великобритании, а также с доставкой, НДС и пошлинами (фактически нет). Обе платы имеют одинаковую цену (34,30 против 33,59 фунтов стерлингов), но, основываясь на его тестах производительности, NanoPi Fire 3 более чем в 6 раз быстрее.
Это не совсем нормально. Обе платы поставляются с ядрами Cortex A53: RPI 3, оснащена четырехъядерным процессором Broadcom BCM2737 с частотой 1,2 ГГц, а NanoPi Fire3 октановым процессором Samsung S5P6818 с частотой 1,4 ГГц. Разница в аппаратного обеспечения означает, что в Linpack для одиночной платы следует ожидать 2 x (1,4/1,2) = 2,3 раза лучшую производительность. Вероятно, он использует Raspbian (32-битную) на RPi 3 и, возможно, 64-битную ОС на Fire3, что добавит еще 30% дополнительной производительности к общей сложности или примерно в 3 раза быстрее. Поэтому должны быть некоторые другие объяснения, такие как размер кеша, разные флаги компилятора или так далее.
Когда дело доходит до производительности многослойной печатной платы, следует полагаться на масштабирование для Raspberry Pi с ее Fast Ethernet-соединением, которое не будет таким же как на портах GbE, которыми оснащен кластер с платами NanoPi Fire3. Это выглядит примерно так:
- узел из 5x Pi 3 против одиночной Raspberry Pi 3:3,28x лучше производительность
- узел из 5x Fire 3 против одиночной NanoPi Fire3: 4.06x более высокая производительность
Также стоит отметить, что в единичном конкретном бенчмарке одиночная NanoPi FIre3 в два раза быстрее, чем 5 плат Pi 3.
Обе платы потребляют примерно одинаковую мощность, хотя NanoPi Fire3 немного больше, что приводит к тому, что Fire3 в 5,8 раза эффективнее, чем RPi3 в тесте Linpack.
2D-дизайн конструкции
Вся установка открыта, и вы можете скачать файлы DXF/SVG для лазера, а также получить список частей в предыдущем сообщении блога. Возможно так же выбрать вентиляторов, который предоставляется с различными частотами вращения и размерами, а также результатами теста производительности (дросселирование процессора или нет). Общая стоимость установки со всеми 12 платами NanoPi и доставкой составляет 543,27£ (эквивалентно 720 американским долларам).
Если вас интересуют руководства по запуску распределенного программного обеспечения на кластере NanoPi Fire3, вы можете время от времени проверять сайт Ника, так как он планирует написать два учебника, а именно: «Майнинг криптовалюты на суперкомпьютере с архитектурой Arm» в третьем квартале 2018 года , и «Глубинное обучение ИИ на суперкомпьютере с архитектурой Arm» в четвертом квартале 2018 года.
Выражаем свою благодарность источнику с которого взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.