«Самый вдохновляющий момент — когда модель оживает. Чувствуешь себя творцом и радуешься каждому улучшению», — Илья Трофименко, выпускник мастерской ИМШ НИУ ВШЭ и VK

Знакомство с мастерской
Мастерскую мне посоветовал друг, который учится в ИМШ НИУ ВШЭ и VK. Он рассказал, что можно работать над интересными проектами, использовать их для диплома и получать стипендию 40 000 рублей — вдвое больше, чем в обычной лаборатории. Отбор включал: репликацию модели из статьи, обсуждение идей из другой статьи и собеседование с базовыми вопросами, а также немного специфики по теме проекта (в моём случае — ML в звуке).
Что повлияло на выбор
Выбрал мастерскую по прикладному ИИ, так как лучше разбираюсь в ML и DL, а не в инфраструктуре, поэтому искал проекты именно в этой области. А ещё руководитель мастерской был академическим наставником моего друга в магистратуре, и тот отзывался о нём крайне положительно, как об очень внимательном человеке, готовом действительно вникать в проблемы студентов.
В проекте вдохновляет
Больше всего вдохновляет момент первого запуска обученной собственными руками модели — чувствуешь себя творцом. Затем пробуешь новые подходы и радуешься каждому улучшению.
Роль в проекте
Разрабатывал и улучшал модели для предсказания метрики SBS на паре аудио, искал и обрабатывал датасеты, а также выкладывал результаты нашей работы в открытый доступ на hf, создавая интерфейс для взаимодействия пользователя с моделью прямо в браузере.
В итоге мы обучили три большие модели для предсказания MOS и SBS — MOSNet, SBSNet и WhisperBert — а также их варианты для работы с текстовой модальностью: MOSNetBert и SBSNetBert. Эти модели выложили на hf, написали статью для Хабра, а сейчас планируем подготовить научную публикацию для конференции или журнала.
Куратор VK
Куратор и тимлид нашей команды всегда были на связи и открыты ко всем вопросам — не только по проекту, но и по индустрии, карьерным возможностям и перспективам. Тимлид Никита Шевцов помог мне улучшить резюме, а куратор Илья Чигин предложил пройти стажировку в компании.
Атмосфера в команде
У нас была дружелюбная атмосфера: работа распределялась равномерно, без кранчей и дедлайнов, все были заинтересованы в проекте, поэтому конфликтов не возникало. Несколько раз мы встречались в офисе VK и кафе, чтобы поиграть в настолки и просто пообщаться.
Личный рост
Я получил больше опыта в исследовательских задачах, научился декомпозировать задачи, лучше управлять временем и внимательнее относиться к коду. Обучение моделей занимает много времени, ошибки проявляются не сразу и сильно сдвигают сроки, поэтому важно делать всё качественно с самого начала, чтобы оставалось время что-то исправить, если баг всё-таки проскочит.
Советы новичкам
Читайте больше научных публикаций и препринтов с ведущих конференций, даже если они не по вашей теме. Идеи в ML и DL часто находятся на стыке нескольких сфер, и широкий кругозор помогает привносить новое в работу, участвовать в обсуждениях на равных с коллегами или работодателями на ревью и собеседованиях.