Rambler's Top100
Реклама
 
Статьи
03 августа 2020

Не Python’ом единым: как развивается русскоязычное сообщество дата-сайентистов

О том, насколько сильно и конкурентоспособно сообщество дата-сайентистов в России и СНГ, одним ли путем идут фундаментальная наука и индустрия и почему не Python'ом единым жив ИТ-рынок -- Евгений Бурнаев, доцент Сколтеха и лауреат премии им. Ильи Сегаловича от компании «Яндекс».  

– Недавно вы стали лауреатом премии «Яндекса» им. Ильи Сегаловича за вклад в развитие научного сообщества и подготовку молодых ученых 2020 года. В чем значимость этой премии для развития сообщества?

– Компания Яндекс одной из первых осознала, что в России испытывает недостаток в студентах по направлению «машинное обучение», и вот уже на протяжении многих лет вкладывает силы и средства в подготовку профессионалов. Машинное обучение — дисциплина комплексная и сложная: чтобы ею заниматься, требуется хорошее знание вычислительных методов, линейной алгебры, теории вероятности, математической статистики. Именно на основе сложной математики разрабатываются эффективные алгоритмы. Когда «Яндекс» в 2006–2007 годах запускал обучение в России, полноценной программы по направлению «Науки о данных» фактически не было (были отдельные специализации в ФУПМ МФТИ, ВМК МГУ и на некоторых факультетах других вузов), но уже было понятно, что спрос есть, что методы машинного обучения требуются для большого числа продуктов, приложений, которые «Яндекс» начинал делать. Это побудило компанию вложиться в образование, связанное с машинным обучением. В значительной степени благодаря этим вложениям и тому, что была организована школа анализа данных, в России существенно ускорилось формирование сообщества инженеров-ученых, которое занимается машинным обучением профессионально.

Для меня важно, что это не просто премия компании «Яндекс»: это премия имени Ильи Сегаловича. Будучи одним из основателей компании, он активно продвигал ИТ в целом и направление, связанное с обработкой данных в частности. Мне посчастливилось быть с ним знакомым: Илья заражал любовью к технологиям. То есть это премия имени человека, который много сделал для ИТ в России. Я в меру своих возможностей тоже стараюсь эти технологии развивать и привлекать молодых людей, обучать их, показывать им наиболее перспективные направления и проекты, в том числе индустриальные. Надо дать им понимание, зачем нужны соответствующие математические методы, и помочь наработать опыт их использования на практике. Еще один важный момент: на эту премию не руководители подают заявки, а студенты и аспиранты номинируют своих научных руководителей. Заявку рассматривают известные ученые, принимая решение на основе как научных достижений руководителя, так и отзывов аспирантов. В некотором смысле это народная премия.

– На награду могут претендовать специалисты из России, Белоруссии и Казахстана, ведущие исследования в области машинного обучения, компьютерного зрения и т.д. Какими исследованиями могут похвастаться эти страны?

– Эти страны во многом объединяет существовавшая ранее система образования. Математический уровень подготовки студентов в них высок. Есть хорошие университеты. И школьники из этих стран традиционно занимают высокие места в соревнованиях по математике. А дисциплина машинного обучения требует серьезной математической подготовки. Как следствие, в перечисленных странах есть сильные коллективы, которые выступают на международной арене в сфере создания индустриальных приложений.

Если в начале десятилетия о стартапах в Белоруссии мало говорили и самих инновационных предпринимательских проектов было немного, то за последнее время ситуация сильно изменилась: есть достойные проекты, среди них известные всем maps.me, Viber, masquerade (MSQRD) и другие. За всеми этими достижениями стоит хорошая инженерная и математическая подготовка. Сильные ребята.

При этом, хотя ситуация с поддержкой науки и улучшилась, в России, например, не так много коллективов, публикующихся на мировых конференциях. В других странах постсоветского пространства их еще меньше. В августе я провожу школу машинного обучения SMILES с лекциями от большого количества известных в мире ученых как раз с целью привлечь сильных ребят, которые хотят делать не просто индустриальные приложения, а более фундаментальные вещи. Наша задача помочь им попасть в струю. Ведь зачастую молодым исследователям не хватает именно понимания, какие научные темы в области машинного обучения и искусственного интеллекта сейчас актуальны, какие задачи в этом направлении ставятся и какие методы применяются.

– Готовы ли наши страны к специалистам уровня западной школы? Ждут ли их на рынке труда с новыми знаниями?

– Вопрос резонный. Начнем с позитивных моментов. Есть ниша для тех, кто готов и хочет развивать академическую науку. Кроме того, ориентация на автоматизацию в современной индустрии высокая. Даже отрасли казалось бы «старой школы и философии» приходят к пониманию, что необходимы подвижки в сторону технологического бизнеса. Автоматизация активно внедряется, и практика показывает отраслям, что это живая прибыль. Во многих индустриальных компаниях велика потребность не просто в инженерах-программистах, а в тех, кто понимает основы математических методов и может эти методы применять. Ведь задачи, которые надо решать, каждый раз новые и имеют свои особенности: готовое решение в интернете не возьмешь и одним Python и Scikit-learn сыт не будешь. И именно в таких людях нуждается рынок: готовых заняться содержательными задачами за нормальные деньги.

А если у ребят есть предпринимательская жилка, то, развивая передовую тему машинного обучения на самом острие науки, можно прийти к созданию высокотехнологичных и прибыльных стартапов.

– В ряде областей научных знаний Россия и страны постсоветского пространства находятся на позициях догоняющих. Каковы наши шансы «догнать и перегнать» в сфере машинного обучения? Есть ли у сообщества с постсоветского пространства перспективы в конкуренции с могиканами из «кремниевых долин»?

– Принцип «а не замахнуться ли нам на Вильяма, понимаете ли, нашего Шекспира» здесь, конечно, не сработает: для начала важно научиться быть локальными лидерами. Для этого должны быть созданы центры притяжения с сильными научными группами, которые смогут привлечь молодых людей и готовить их для индустрии и науки, где требуются серьезные знания, а не банальное программирование. Это дело не одного года. Если количество научных групп будет расти, со временем в ряде направлений будет создаваться сильная конкуренция и возникнут возможности для локального лидерства.

– Авторы альманаха «Искусственный интеллект. Итоги 2019», который был подготовлен при поддержке Минкомсвязи, Аналитического центра при Правительстве РФ и ряда других организаций Центром компетенций Национальной технологической инициативы на базе МФТИ по направлению «Искусственный интеллект», пришли к заключению, что «сейчас в России очень мало качественных исследований и публикаций по области ИИ. И не потому, что у нас меньше талантов, а потому, что у исследователей нет мотивации». Что вы об этом думаете?

– Публикаций действительно немного. Все статьи по ИИ, компьютерному зрению публикуются в первую очередь в трудах крупных конференций типа CVPR, ICML, NeurIPS и др. Из поданных статей принимается процентов 10. Израиль, например, подает существенно больше статей, чем Россия, при несоизмеримых масштабах. Это спорт высоких достижений. Отметим и положительную тенденцию: количество участников такого рода конференций от России растет. Многие крупные компании, у которых бизнес связан с машинным обучением, посылают туда своих сотрудников. Но число их не очень велико. Это системная проблема. Нужна планомерная работа.

Специалисты по анализу данных — одни из самых востребованных на рынке. За плечами многих наших специалистов сильная математическая школа и фундаментальная наука. Но не всегда даже хороший специалист знает, что сегодня в машинном обучении действительно передовое. Надеюсь, что мои знания и опыт помогут открыть новые возможности для русскоязычного сообщества дата-сайентистов.

Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!

Продолжение использования сайта пользователем интерпретируется как согласие на обработку фрагментов персональных данных (таких, как cookies) для целей корректной работы сайта.

Согласен