Система автоматической проверки лексической приемлемости студенческих отчетов
Преподаватели тратят значительное время на проверку отчетов, анализ расчетов и контроль за соблюдением стандартов оформления, что снижает оперативность обратной связи для студентов. Система автоматической проверки позволит стандартизировать процесс оценки, сократить временные затраты и обеспечить поступление качественной обратной связи. Кроме того, система автоматической проверки поможет повысить объективность оценивания, уменьшив влияние человеческого фактора и улучшив контроль за соблюдением требований, в первую очередь —оформление документации в соответствии с ГОСТ.
Целью работы является разработка программного обеспечения, которое позволит загружать студенческие научно-исследовательские работы и получать отчет о лексической, синтаксической и морфологической приемлемости текста.
Задачи проекта:
- разработать парсер отчетов студентов в форматах .docx / .doc для их последующей обработки моделями, основанными на больших языковых моделях;
- доработать модуль проверки ошибок на основе датасета с типичными ошибками студентов из НИР прошлых лет;
- обучить большую языковую модель классификации предложений на приемлемые и неприемлемые с лексической точки зрения;
- рассчитать функционалы качества полученной модели и провести сравнительный анализ с существующими моделями;
- доработать программное обеспечение для формирования отчета с рекомендациями по исправлению предложений, библиографических ссылок;
- повысить отказоустойчивость и стабильность работы серверной части веб-приложения;
- разработать дизайн для пользовательской части веб-приложения.
Текущие результаты
На данный момент разработана основа серверной части веб-приложения, собран и размечен датасет для обучения модели, написан парсер для документов формата .docx.
Команда проекта
- Плесовских Александр Евгеньевич (тимлид, системный администратор) ответственен за разработку пользовательской части веб-приложения и парсера документов форматов .docx / .doc.
- Аношин Виктор Иванович (ML-разработчик) – разработка алгоритма тренировки большой языковой модели для поиска лексически неприемлемых предложений.
- Канукова Лилия Аслановна (технический писатель, дата-аналитик) – сбор предложений из НИР и расширение датасета RuCoLA, разработка rule-based стратегий поиска ошибок.
- Орлов Кирилл Олегович (backend разработчик) – разработка серверной части веб-приложения.
- Романова Татьяна Владимировна (ML-разработчик) – разработка алгоритма проверки библиографических ссылок.
- Хомин Максим Вячеславович (стажер) – разработка модуля поиска и цветового выделения классифицированных моделью фрагментов текста.
- Палиенко Мария Алексеевна (стажер) – разметка предложений из студенческих НИР.
- Голуб Владислав Витальевич (стажер) – помощь в разработке серверной части веб-приложения.
Руководитель проекта
Департамент компьютерной инженерии: Доцент
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.