Рубрикатор |
Все новости | Новости компаний |
Александра КРЫЛОВА | 16 февраля 2015 |
Кто построил лучшую модель?
Подведены итоги первого открытого конкурса по анализу данных, проведенного среди практикующих специалистов – data scientist – и студентов.
Его организаторами стали компания SAS Россия/СНГ и международная платформа датамайнинга «АлгоМост». Конкурсантам, в числе которых были как практикующие специалисты в области математической статистики, так и студенты-старшекурсники, предлагалось разработать аналитическую модель на основании информации о банковских данных, проданных коллекторскому агентству. При этом в качестве среды разработки разрешалось использовать только программный продукт SAS University Edution. Этот первый в истории SAS Institute бесплатный набор инструментов для статистики и углубленного анализа данных, открытый для использования в учебных целях, в целях некоммерческих исследований, был выпущен в 2014 г.
После прохождения процедуры регистрации участники конкурса получали доступ к двум наборам реальных, но обезличенных данных заемщиков, - тренировочному и тестовому. В первой выборке содержалась информация о банковских займах, проданных коллекторскому агентству (их характеристики, характеристики просрочки, а также данные о заемщике), при этом для каждого ID заемщика в отдельной графе таблицы отмечалось: производит или не производит выплату он выплату долга. Взяв эту информацию за основу, конкурсанты должны были разработать как можно более точно и стабильно работающую модель - алгоритм для второй, тестовой выборки, позволявший прогнозировать вероятность возврата «плохого долга» для каждого из содержавшихся в ней ID. Качество модели определялось в автоматическом режиме путем подсчета индекса Джини.
Поставленная задача заинтересовала большое количество практикующих математических статистов и студентов в России и СНГ. Несмотря на не очень объемный общий призовой фонд конкурса, для участия в нем зарегистрировалось несколько сотен человек.
«Наша конкурсная модель, - сказал обозревателю «ИКС» Михаил Левиев, генеральный директор «АлгоМост», - позволяет понять, какие подходы к решению поставленной задачи лучше всего работают. Там мы увидели, например, что все победители использовали для построения модели метод логистической регрессии, наиболее популярный для решения таких задач, однако в работах каждого из них мы нашли и много интересных трансформаций».
Тем не менее, как показало подведение итогов, признанные лучшими модели отличались между собой по коэффициенту Джини только в третьем знаке, а у алгоритмов, поделивших между собой втрое и третье место, значения этого коэффициента и вовсе оказались одинаковыми.
Первое место занял Олег Куликов, второе и третье поделили Валерий Ващенко и Ирина Макарова, все они работают в банковском секторе, используют аналитические инструменты SAS для решения своих профессиональных задач. А вот Андрей Шапулин, студент 4-го курса факультета вычислительной математики и кибернетики МГУ, чья модель показала в соревновании четвертый результат и была признана лучшей студенческой работой конкурса, познакомился с возможностями SAS University Edution впервые. Приз за лучшее оформление работы получил Эдуард Бабаян, также практикующий банковский аналитик.
«Первый опыт проведения конкурса я считаю позитивным, - сказал Валерий Панкратов, генеральный директор SAS России/СНГ, - точность моделей, которые мы получили, достаточно высока, и мы думаем о том, как эту форму развивать».
Компания заинтересована в том, чтобы и дальше давать возможность профессионалам, работающим с аналитическим программным обеспечением других поставщиков, бесплатно и с «определенной денежной мотивацией» попробовать инструментарий SAS и убедиться в его эффективности и удобстве.
Эффективность же точечной работы с техническими вузами, в том числе по подготовке специалистов в области SAS-технологий для компаний-заказчиков, и с академическим сообществом, которую проводит компания подтверждена ее результатами. По словам В. Панкратова, по итогам 2014 г. SAS Россия/СНГ вышла на одно из первых мест по темпам роста продаж.
Оставить свой комментарий:
Комментарии по материалу
Данный материал еще не комментировался.