Датасет автомобильных аварий
Для предотвращения аварий важно развивать системы предсказания столкновений. Существующие системы, основанные на датчиках расстояния, имеют высокую стоимость и все еще недостаточно эффективны. Одно из перспективных направлений развития предложено исследователями из Тайваня. Они разработали систему предсказания ДТП на основе датасета записей с видеорегистраторов.
В России регистраторы широко распространены, в открытом доступе содержится значительное количество записей, но в исследовательских целях они не используются. Создаваемый датасет позволит учесть российские дорожные условия и развивать системы предсказания ДТП. Он также может быть использован и для множества других применений, например, в беспилотных автомобилях.
Задачи проекта
Достижение цели снижения аварийности на дорогах за счет разработки датасета и моделей машинного обучения для предсказания аварийных ситуаций возможно при выполнении следующих задач:
- Разработка конвейера (комплекса программных средств и ML-моделей) для сбора, обработки, разметки и формирования датасета, состоящего из видеофрагментов автомобильных аварий.
- Уточнение классификации типов аварий и других параметров, которые являются значимыми для разрабатываемого датасета.
- Сбор размеченного датасета видео дорожных происшествий, учитывающий специфику дорог постсоветского пространства (не менее 1000 записей) и размещение его на платформе zenodo.
- Проведение статистического анализа созданного датасета, результаты которого позволят выявить закономерности возникновения аварийных ситуаций на российских дорогах.
● Проведение апробации различных ML-моделей предсказания автомобильных аварий с использованием разработанного датасета.Для предотвращения аварий важно развивать системы предсказания столкновений. Существующие системы, основанные на датчиках расстояния, имеют высокую стоимость и все еще недостаточно эффективны. Одно из перспективных направлений развития предложено исследователями из Тайваня. Они разработали систему предсказания ДТП на основе датасета записей с видеорегистраторов.
В России регистраторы широко распространены, в открытом доступе содержится значительное количество записей, но в исследовательских целях они не используются. Создаваемый датасет позволит учесть российские дорожные условия и развивать системы предсказания ДТП. Он также может быть использован и для множества других применений, например, в беспилотных автомобилях.
Текущие результаты
На данный момент изучена предметная область, рассмотрены уже имеющиеся датасеты автомобильных аварий, составлен исчерпывающий обзор имеющихся видеодатасетов в области дорожных происшествий. Создана база с видео ДТП, продумана система классификации видео с опорой на опыт разработчиков подобных датасетов и российские нормативно-правовые акты. Изучена форма представления записей в датасете. Создана памятка по хранению датасета и взаимодействия с облачным хранилищем при разработке датасета. Разработан пайплайн по выгрузке и обработке видео, рассматривающий все этапы сборки датасета от скачивания видео до его хранения. Разработанаа инструкция по разметке видео, включая регламентацию разметки и систему меток. Обработаны первые видео.
Планируемые результаты
Конечным результатом работы над проектом будет размеченный датасет видео ДТП на не менее 1000 записей, приложенная уточненная классификация типов аварий, результаты статистического анализа, а также тестовые модели машинного обучения, натренированные на датасете. Более того, будет предоставлено полное и понятное пользовательское описание конвейера для сбора, обработки, разметки и формирования датасета, состоящего из видеофрагментов автомобильных аварий.
Команда проекта
- Анджушева Манца Мергеновна — Data scientist, лидер проекта (обзор имеющихся датасетов дорожных происшествий; формирование методики обработки, представлении и хранения данных; разметка данных)
- Беломытцева Алена Владимировна — Стажер (организация хранения датасета; разметка данных; изучение недостатков систем беспилотного вождения)
- Бичурина Елизавета Петровна — Data scientist (классификация аварий;
- изучение имеющихся моделей предсказания аварий; разметка данных)
- Маркелов Макар Станиславович — Data scientist (подбор оптимального ПО для разметки видео; анализ платформ для размещения датасета; разметка данных)
- Овчинникова Екатерина Юрьевна — Data scientist (классификация аварий; разметка данных)
- Равдин Леонид Владимирович — Стажер (формирование базы видеороликов аварий; формирование методики по выгрузке и обработке видео; разметка данных)
- Сивохо Андрей Андреевич — Стажер (представление видео в датасете; формирование методики разметки данных; разметка данных)
Департамент компьютерной инженерии: Доцент
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.