Семинар по высокопроизводительным вычислениям: практические вопросы
Очередной семинар НИУ ВШЭ по высокопроизводительным вычислениям был посвящен практическим вопросам - отказоустойчивости суперкомпьютеров и состоянию аппаратной и программной составляющих суперкомпьютерного комплекса (СКК) НИУ ВШЭ.
Михаил Якобовский (выпускник МИЭМ, ныне заместитель директора по научной работе Института прикладной математики им. М.В. Келдыша и член-корреспондент РАН) рассказал о развиваемом под его руководством подходе по решению проблемы проведения расчетов при наличии отказов суперкомпьютеров. Проблема состоит в том, что с ростом числа узлов и ядер в суперкомпьютерах уменьшается интервал бесперебойной работы комплекса в целом. Оценка для планируемых на 2021 экзафлопсных комплексов равна 30 минутам работы без сбоев. Были обсуждены варианты решения проблемы проведения долговременных расчетов в таких условиях, которые прошли апробацию на имеющихся суперкомпьютерных системах. Доклад вызвал живой интерес слушателей, среди которых заметно растет число студентов.
Второй доклад был сделан сотрудниками нового отдела НИУ ВШЭ - суперкомпьютерного моделирования. Перед гостями выступили начальник отдела Павел Костенецкий и инженер Роман Чулкевич. За три месяца ими была проделана большая работа по выявлению и замене неисправных блоков СКК, дооснащению и наладке программного обеспечения. В настоящее время загрузка СКК достигла 72 процентов, что является очень хорошим показателем для начального этапа работы. Растет число пользователей, проводящих научные расчеты. Также СКК начали использовать некоторые магистерские программы для обучения студентов новым технологиям суперкомпьютерного моделирования и машинного обучения. Подробности можно найти на сайте семинара, где выложены презентации докладов.
После доклада последовало длительное и детальное обсуждение практических вопросов использования СКК в научной и учебной деятельности. Слушатели высоко оценили проделанную сотрудниками отдела работу.
Сотрудники отдела достигли обеспечения эффективной эксплуатации суперкомпьютерного комплекса НИУ ВШЭ. Конкретные вопросы слушателей ясно выявили возможные тенденции как в развитии аппаратного и программного обеспечения СКК, так и возможные проблемы по определению приоритетов использования СКК. В настоящее время СКК используется в трех направлениях - суперкомпьютерное моделирование, машинное обучение и учебная работа. Эти три направления требуют различных подходов к организации процесса и к программному обеспечению. Требуется провести дальнейшую работу по выработке принципов организации процесса проведения вычислений, порядка подготовки документов и решений, а также организации работы по планированию развития СКК
Щур Лев Николаевич
Заведующий базовой кафедрой «Прикладные информационно-коммуникационные средства и системы» ВЦ РАН МИЭМ НИУ ВШЭ