• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Московский институт электроники
и математики им. А.Н. Тихонова

Новые цифровые технологии и современное общество: Интернет-исследования

29 мая – 1 июня 2018 г. в Санкт-Петербурге состоялась международная конференция «Цифровые трансформации и глобальное общество» (Digital Transformation & Global Society), посвященная междисциплинарным Интернет-исследованиям, на которой выступили с докладом студенты МИЭМ НИУ ВШЭ.

Данная конференция организована совместно Университетом ИТМО и Национальным исследовательским университетом «Высшая школа экономики» (Санкт-Петербург).

Целью конференции являлось создание представительной площадки для обсуждения вопросов, связанных с влиянием новых цифровых технологий на социальные, экономические и политические процессы. 

На конференции и семинарах выступили спикеры более чем из 15 стран.

Высшую Школу Экономики представляли студенты МИЭМ НИУ ВШЭ Екатерина Козлова и Константин Ломотин, специальность – «Информатика и вычислительная техника».

Тема доклада, представленного на семинаре «Компьютерная лингвистика» «Применение современных алгоритмов обработки естественного языка: автоматический классификатор текста». По результатам данного исследования студентами написана статья, которая принята к публикации в журнале «Communications in Computer and Information Science» (Springer), и будет индексироваться в системе SCOPUS (Q3). Результаты, представленные Екатериной Козловой и Константином Ломотиным основаны на результатах экспериментов по обучению моделей машинного обучения для автоматической классификации научных текстов при участии их научного руководителя кандидата технических наук, доцента департамента компьютерной инженерии МИЭМ НИУ ВШЭ Романова Александра Юрьевича.

В докладе были представлены результаты опытного внедрения разработанной системы автоматической классификации в процесс работы Всероссийского института научной и технической информации Российской академии наук (ВИНИТИ РАН). Одной из задач института является сбор, классификация и хранение научных текстов, публикуемых по всему миру.

Обученный алгоритм машинного обучения позволяет решить две задачи: помогает экспертам-разметчикам повысит точность ручной классификации, а также позволяет автоматизировать процесс первичной разметки. Система, представленной на конференции, позволяет обработать в автоматическом режиме 10 000 текстов в час.

Следует отметить также, что полученные теоретические результаты могут быть использованы для решения проблемы автоматической рубрикации текста, т.к. необходимость в подобных системах возрастает с увеличением количества текстовой информации в мире.

Конференция прошла в доброжелательной обстановке. Выступление Константина и Екатерины вызвало интерес присутствующих членов научного сообщества, были вопросы и адекватные ответы выступавших.