Rambler's Top100
Статьи
Николай НОСОВ  03 июня 2024

Прыжок в эру ИИ, или Пять вопросов к проекту «Экономика данных»

Взаимодействие с бизнесом, предоставление открытых данных, требования к их качеству и безопасность — темы, раскрытие которых хотелось бы увидеть в документах нового нацпроекта. 

Вопросы безопасности

Прошедший в Москве на прошлой неделе дата-саммит «Прыжок в эру ИИ» начался с красочного представления. Демонстрирующие «прыжок» акробаты на прикрепленных к ногам пружинах высоко взлетали и кувыркались в воздухе под потолком лофта Quattro Space. Красиво, молодежно, современно и… немного нервно. Особенно для сидящих в первом ряду, в метре от которых с потолка, грозно размахивая механическими приспособлениями, падали серебристые спортсмены.

Не знаю, входило ли это в замысел организаторов, но шоу породило вопрос — насколько будет безопасным прыжок в эру ИИ. В памяти всплыли страшилки — от ставшего с появлением боевых дронов с ИИ реальностью Терминатора до полностью контролирующего поведение всех людей ИИ-бога из третьего сезона сериала «Мир Дикого Запада».
Выступает Павел Лихницкий

Среди ключевых тем мероприятия – подготовка данных для эффективной работы с искусственным интеллектом и обсуждение концепции национального проекта «Экономика данных». Перспективы нацпроекта, как можно было заключить из рассказа открывшего саммит генерального директора DIS Group Павла Лихницкого,  весьма радужные. Инвестиции в него до 2027 г. достигнут 1,6 трлн руб., а ожидаемый вклад в ВВП страны составит 11,2 трлн руб. П. Лихницкий привел также данные опроса Gartner, согласно которым к основным проблемам генеративного ИИ относятся качество данных (указали 46% опрошенных) и вопросы безопасности (39%).
Источник: Gartner

Для нашей страны вопросы информационной безопасности более чем актуальны. Причем не стоит забывать, что ИБ включает не только защиту персональных и критичных для функционирования экономики и обороноспособности страны данных, но и этику ИИ. Пока до конца непонятно, как эти вопросы будут решаться в рамках нового нацпроекта.

Качество данных

Искусственный интеллект неэффективен без качественных данных. Если обучать его на всем подряд из интернета, то получим скандалы, подобные тому, когда на вопрос, почему в мультфильме «Маша и Медведь» девочка живет одна, яндексовская Алиса ответила, что Маша – это призрак убитой девочки. Генеративный ИИ AI Overviews от Google пошел еще дальше и, не поняв шутку в комментариях, предложил добавлять в соус для пиццы клей, а для борьбы с депрессией – спрыгнуть с моста «Золотые ворота». 

Точность, достоверность и прозрачность обеспечивается в рамках систем управления данными. Ниши, возникшие на рынке после ухода зарубежных вендоров, успешно заполняют российские компании, недостаток компетенций восполняющие за счет кооперации и создания альянсов. Примером может служить подписание соглашения о стратегическом сотрудничестве компании DIS Group, занявшей в мае 2024 г., по данным исследования ЦСР «Рынок систем управления и обработки данных», первое место по доле рынка (23%), и «Ростелекома». Это серьезная заявка на успех в борьбе за контракты нацпроекта с основными конкурентами, среди которых Сбер. Вопрос в требованиях к обеспечению качества данных, которые будут предъявляться к участникам конкурсов.

Готовность бизнеса и общества

В отличие от традиционной экономики, где основной акцент делается на производстве и распределении материальных благ, экономика данных базируется на обработке информации. Переход требует не только развертывания технических решений, но и зрелости в управлении данными, готовности общества и бизнеса использовать новые технологии, такие как машинное обучение и искусственный интеллект. 
Источник: DIS Group
   
Готов ли российский бизнес к переходу на «экономику данных»? Обсуждение показало, что прогресс есть. Согласно представленному на дата-саммите исследованию DIS Group «Оценка зрелости управления данными», в период с 2018 по 2023 гг. доля компаний, которые находятся в процессе реализации инициатив по управлению данными, выросла с 17 до 89%.

Метрика «Бизнес-ценность» от управления данными увеличилась по сравнению с 2018 г. на 22%, что свидетельствует о растущем желании бизнеса получать выгоды и извлекать дополнительную ценность из имеющихся данных. Существенный рост, более 25% по сравнению с 2018 г., наблюдается по метрике «Компетенции», так что инвестиции компаний в развитие навыков и опыта сотрудников дают свои плоды. Радужно выглядят перспективы: согласно прогнозу DIS Group, к 2028 г. доля компаний, реализующих инициативы по управлению данными, приблизится к 98%.

Стоит отметить, что опрос проводился среди ведущих российских компаний, четверть которых — банки. Если бы опрашивались представители среднего и малого бизнеса, а также госслужащие, картина была бы не столь оптимистичной.

Открытые данные

Лет пять назад в стране активно обсуждались вопросы открытых данных (ОД) — свободно доступных, лицензионно чистых, машиночитаемых хранилищ первичных данных, в том числе государственных данных, собираемых госорганами при выполнении их функций. Преимущества очевидны: ОД повышают доверие к органам госвласти, создают условия для работы исследователей, предпринимателей и разработчиков новых сервисов, способствуют развитию технологий, включая разработку новых методов анализа данных и инструментов для их визуализации.

Первые шаги внушали оптимизм. Был создан федеральный портал открытых данных РФ (data.gov.ru), появились разделы с ОД на региональных порталах, в частности на портале Москвы. 

Однако в последнее время интерес государства к этой теме снизился — региональные базы данных перестали обновлять, а федеральный портал уже год как не работает. «Многие не готовы открывать реально необходимые данные, а те, что открываются, как правило, бесполезны для отрасли. На портале открытых данных собрали много разных, но индустрия не нашла способов их использования», — пояснил вице-президент, директор по ИИ и управлению данными «Ростелекома» Сергей Носов.

Эксперт отметил, что в рамках проекта «Экономика данных» и развития ИИ видит большой запрос государства, в частности Минцифры, на создание платформы открытых данных, в рамках которой будет собираться именно то, что нужно бизнесу. Минцифры активно взаимодействует с отраслью, запрашивает, что интересно и для каких задач, прорабатывает логику обезличивания, шифрования и предоставления такого сервиса вовне. Есть планы до конца года создать такое решение в отдельной предметной области. 

«Считаю, что потребность в открытых данных есть. Рынку интересен синергический эффект от обезличенных данных, открытых данных о номенклатуре изделий, ГОСТах. В текущей парадигме эта информация разрозненная. Предоставление открытых данных в рамках нацпроекта или государственного сервиса привело бы к повышению эффективности, ведь они участвуют в цепочках создания ценностей предприятий. Такие идеи обсуждаются, в том числе на уровне Гостеха. Вопрос — какие данные можно без ущерба сделать общедоступными», — дал комментарий нашему изданию генеральный директор DIS Group Павел Лихницкий.

Директор и соучредитель некоммерческого партнерства «Информационная культура» Иван Бегтин считает, что ситуация с ОД в стране внушает тревогу: «Все данные, названные на сайтах госорганов открытыми, таковыми не являются, бесполезны или не обновлялись от четырех до восьми лет. Создать портал открытых данных без государства не столь сложно, сколь сложно его держать актуальным. Самые очевидные направления для перезапуска темы открытых данных в России — машиночитаемые нормативные документы, тексты для машинного обучения, систематизация и агрегация научных данных и много-много-много дата-сетов. Это недорого, но этим некому заниматься внутри государства, и не похоже, что кто-то появится в ближайшие годы».

Некоторые эксперты рассматривают в качестве платформы ОД создаваемую Минцифры государственную информационную систему для организации работы с большими данными, в которую будут загружаться обезличенные дата-сеты. Но доступ в нее будет предоставляться не всем, а только авторизованным разработчикам. Есть опасение, что в их число не попадут независимые исследователи, небольшие компании и стартапы. Строго говоря, ОД эти дата-сеты считать нельзя. Так что  вопрос — будет ли государство заниматься открытыми данными в новом нацпроекте, и если да, то как станет трактовать этот термин — остается пока без ответа.

Обещанного три года ждут

Но главный вопрос — когда появится проект «Экономика данных». Не рассуждения, что он уже запущен, а текст и утверждающий его приказ Президента РФ. Сначала анонсировалось, что проект запустят до конца 2023 г. В ноябре 2023 г. на стратегической сессии по формированию национального проекта «Экономика данных» заявлялось, что паспорт нацпроекта «Экономика данных» с конкретными показателями и результатами будет подготовлен к лету 2024 г. Лето началось, а документов пока нет.

Выполнение нацпроекта «Цифровая экономика» завершается в 2024 г. Так что для утверждения идущего ему на смену проекта «Экономика данных» времени осталось немного.
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!