Создать для портала «Работа в России» модель машинного обучения, позволяющую оценить стоимость навыков, которыми обладает работник.
При поиске новой работы соискателю, как правило, сложно сориентироваться в условиях, которые предлагает рынок, и оценить, на какую заработную плату он может рассчитывать, обладая определенным набором навыков и характеристик.
Эти проблемы актуальны и для пользователей сервисов портала «Работа в России» –– официального государственного портала, осуществляющего помощь в трудоустройстве. Поэтому порталу нужен сервис, предсказывающий заработную плату, предложение которой может ожидать соискатель, исходя из тех характеристик (включая навыки и квалификацию), которыми он обладает.
Участникам хакатона предлагается создать статистическую модель, которая по профилю соискателя на портале «Работа в России» предсказывает заработную плату в зависимости от указанных соискателем характеристик и навыков. Лучшее решение мы определим, протестировав точность работы моделей на тестовой выборке.
Основная часть соревнования в данном треке будет проводится на платформе kaggle. Участники получат обучающую выборку, используя которую, должны будут построить модель, предсказывающую заработную плату. Точность модели проверяется на тестовой выборке на платформе. Подробный порядок загрузки решений на платформу участники получат в первый день хакатона.
Описание полей обучающей выборки
70 баллов распределяется в соответствии с результатом, который ML-модель показала на kaggle-соревновании. Учитывается не место в турнирной таблице напрямую, а значение ошибки на тестовой выборке относительно величины ошибок других участников. По результатам kaggle-соревнования на очную защиту перед жюри допускается не более 10 команд.
30 баллов распределяется по результатам оценки кода, выложенного в открытый репозиторий, а также выступления на очной защите в соответствии со следующими критериями :