Летняя школа по биоинформатике 2016
С 25 по 30 июля 2016 года состоялась четвертая Летняя школа по биоинформатике, которую организовал Институт биоинформатики совместно с Академическим Университетом Санкт-Петербурга.
В мероприятии приняло участие 100 студентов, которых поделили на два потока, в соответсвии с образовательной программой в их университетах : биологов и информатиков. В их числе были, как и только начинающие путь бакалавры, так и уже определившиеся со своей научной карьерой молодые аспиранты.
Программа школы была рассчитана на начальный уровень подготовки, но в то же время была насыщена лекциями, освещающие актуальные исследования и открытые проблемы биоинформатики. Благодаря лекторам - выдающимся ученым и исследователям в самых разных областях, начиная от иммунологии и заканчивая транскриптомикой, мне посчастливилось прочувсвовать научную среду и поработать в ней в рамках исследовательских проектов. Как мне кажется, это один из самых больших преимуществ школы - вовлечение более половины участников в работу над командными научными проектами под руководством менторов, тематика которых была самой разнообразной. Команда, в которой состоял я, работала над предсказыванием силы связывания пептидов c главным комплексом гистосовмести (major histocompatibility complex - MHC) имунной системы человека и других позвоночных. С увеличением объема экспериментльных данных о том, какие гены MHC и белки связываются, стало возможным обучать предсказательные модели для силы связывания. Другая команда, например, применяла методы машинного обучения для диагностики болезни Альцгеймера путем анализа антител в сыворотке крови.
Для понимания и постановки задачи крайне важным аспектом было командной работой и активном взаимодейсвии между биологами и информатиками в команде. Именно это позволило уже на второй день школы продвинуться в решении нашей задачи и подобрать биологически обоснованные признаки для регрессии на основе машины опорных векторов (Support Vector Regression). Наше итоговое решение использовало градиентный бустинг (Gradient Boosting Machine). Главным результатом было достижение результатов работы нашей линейной модели результатов передовых решений, которые используют нелинейные модели(нейронные сети), которые хуже интерпретируются.
Задачи, поставленные перед студентами в исследовательских проектах, зачастую, требовали больших вичислительных мощностей, которые были предоставлены Институтом биоинформатики в виде мощных кластеов.
Организаторами были приглашены ведущие биоинформатики и статистики из различных универститетов: Михаил Райко (University of California, San Diego), Никита Алексеев (George Washington University), Дмитрий Чудаков (Masaryk University ), Дмитрий Фишман (University of Tartu).
Кроме студента 3 курса “Прикладной математики" Лайко Рудольфа, в школе приняли участие студенты и других образовательных программ: Бородин Ростислав, Вахрамеева Елизавета, Воронкова Дарья, Гаврилова Анна, Менделевич Ася, Мухаметшина Даяна, Пушкарёва Ольга и Толстоухова Софья.
Лайко Рудольф
студент 3 курса образовательной программы "Прикладная математика"