Математика и лингвистика: ресурс проверки знаний изучаемого языка
С 4 по 9 июня в рамках программы повышения квалификации доцент департамента компьютерной инженерии МИЭМ НИУ ВШЭ Клышинский Э.С. прошел научную стажировку в Хельсинкском университете (департамент современных языков).
В рамках стажировки обсуждался совместный проект департаментов компьютерных наук и современных языков Хельсинкского университета, кафедры математической лингвистики СПбГУ и департамента компьютерной инженерии МИЭМ НИУ ВШЭ в области математических методов выделения терминов и ключевых фраз из текстов на естественных языках. Выделение терминов из текстов позволяет автоматизировать такие процессы, как составление словарей, онтологий и тезаурусов предметных областей, повысить точность определения близости текстов, уточнять результаты информационного поиска.
Одним из профилей обучения на департаменте современных языков Хельсинкского университета является изучение славистики и, в частности, русского языка как иностранного. В соответствии с этим направлением, в рамках стажировки проводились работы по разработке сайта для обучения русскому языку как иностранному: http://cococo.cosyco.ru/. Данный ресурс позволяет обучаемому получить наиболее устойчивые сочетания с интересным для него словом.
Обсуждались методы автоматической генерации тестов для проверки знаний изучаемого языка в рамках проекта «Ревита», посвященного восстановлению и изучению редких языков: https://revita.cs.helsinki.fi/.
В рамках программы пребывания Клышинский Э.С. провел мастер-класс по применению библиотек машинного обучения и использованию программных инструментов для решения задач выделения терминов из текстов на естественных языках.