Меню Закрыть

Вычислительный кластер 2

В лаборатории СибИПСА используется вычислительный кластер, специально созданный для решения задач оптимизации сверхбольшой размерности (large-scale global optimization). Кластер спроектирован и администрируется сотрудником института Алексеем Вахниным.

Кластер используется для решения различных задач анализа данных и моделирования, однако основное направление – разработка и исследование новых алгоритмов глобальной оптимизации для задач, представленных моделью типа «черный ящик» (информация о целевой функции отсутствует, задача задана в виде алгоритма, симуляции и т.д.). Подобные задачи требуют довольно длительного времени работы алгоритма оптимизации, а традиционные алгоритмы не могут найти приемлемое решение задачи. При использовании вычислительного кластера появляется возможность в разумные сроки проверить большое количество новый гипотез и провести больше расчетов при исследовании и сравнении алгоритмов, что невозможно сделать на обычных, даже высокопроизводительных стационарных ПК.

Для управления кластером разработано специализированное программное обеспечение, которое обеспечивает процесс распараллеливания вычислительных экспериментов и конкретного программного кода на основе технологии MPI. Особенностью решаемых исследовательских задач является то, что они поддаются только крупнозернистому (coarse-grain) распараллеливанию, в кластере каждая вычислительная единица решает самостоятельную задачу оптимизации.

Кластер работает на ОС Ubuntu, имеет систему удаленного доступа и управления, а также режим автоматического сбора и анализ данных, полученных в ходе численных экспериментов, и формирования отчетов. Реализация ПО выполнена на языке программирования C++ с оптимизацией под архитектуру кластера для повышения скорости вычислений.

Кластер представляет собой одноуровневую распределенную систему (ГРИД-систему), объединенную локальной сетью, состоящую из 8 высокопроизводительных машин. Один из узлов выполняет роль сервера.

Текущие характеристики:

  • Общее число ядер CPU — 64, общее число вычислительных потоков — 128.
  • Общий объем оперативной памяти — 72 Гб.
  • Используется распределенная файловая система NFS объемом 300 Гб.

Текущая конфигурация:

  • Master-PC: AMD Ryzen 7 Pro 3700 (8 ядер), 16 ОЗУ
  • Slave-1, Slave-2: AMD Ryzen 7 Pro 3700 (8 ядер), 8 ОЗУ
  • Slave-3 -Slave-7: AMD Ryzen 7 1700X (8 ядер), 8 ОЗУ