Создать для портала «Работа в России» модель машинного обучения, позволяющую оценить стоимость навыков, которыми обладает работник.

Предпосылки

При поиске новой работы соискателю, как правило, сложно сориентироваться в условиях, которые предлагает рынок, и оценить, на какую заработную плату он может рассчитывать, обладая определенным набором навыков и характеристик.

Эти проблемы актуальны и для пользователей сервисов портала «Работа в России» –– официального государственного портала, осуществляющего помощь в трудоустройстве. Поэтому порталу нужен сервис, предсказывающий заработную плату, предложение которой может ожидать соискатель, исходя из тех характеристик (включая навыки и квалификацию), которыми он обладает.

Участникам хакатона предлагается создать статистическую модель, которая по профилю соискателя на портале «Работа в России» предсказывает заработную плату в зависимости от указанных соискателем характеристик и навыков. Лучшее решение мы определим, протестировав точность работы моделей на тестовой выборке.

Формат решения

Основная часть соревнования в данном треке будет проводится на платформе kaggle. Участники получат обучающую выборку, используя которую, должны будут построить модель, предсказывающую заработную плату. Точность  модели проверяется на тестовой выборке на платформе. Подробный порядок загрузки решений на платформу участники получат в первый день хакатона.

Данные


Описание полей обучающей выборки

resume_description.pdf


Критерии оценки

70 баллов распределяется в соответствии с  результатом, который ML-модель показала на kaggle-соревновании. Учитывается не место в турнирной таблице напрямую, а значение ошибки на тестовой выборке относительно величины ошибок других участников. По результатам kaggle-соревнования на очную защиту перед жюри допускается не более 10 команд.

30 баллов распределяется по результатам оценки кода, выложенного в открытый репозиторий, а также выступления на очной защите в соответствии со следующими критериями :