Рубрикатор |
Статьи | ИКС № 01-02 2014 |
27 января 2014 |
Big Data в поиске себя
Где проходят границы обозначаемого термином Big Data явления? Какие технологии они выделяют? Несмотря на активность вендоров в продвижении своих решений, термин Big Data еще не до конца устоялся.
«ИКС»: Согласны ли вы с тем, что Big Data скорее маркетинговый термин, чем набор технологий и архитектур?
Александр ВАСИЛЕНКО, глава представительства, VMware в России и СНГ: Не согласен. Технологии Big Data с каждым днем все больше проникают как в научно-исследовательскую деятельность, так и в коммерческий сектор и сферу госуправления. Сегодня мы переживаем самый прорывной период в истории индустрии – каждый день создается 2,5 квинтиллиона байт данных, грани между консьюмерским и корпоративным ИТ стираются: у нас есть социальные сети, мобильные технологии, BYOD, облака… «Большие данные» весьма критичны для бизнеса, и в будущем их значение будет только возрастать.
Денис ПЕРВУШИН, директор департамента бизнес-приложений Oracle, «АйТи»: Говорить о том, что Big Data – только маркетинговый термин, не вполне корректно. Несмотря на то что решения для обработки больших объемов информации в основе своей содержат компоненты, которые были разработаны и до появления самого термина Big Data, новизна подхода заключается в том, что производители предлагают преднастроенные и оптимизированные для выполнения нового класса задач аппаратно-программные комплексы. Изменилась и архитектура решений: например, для эффективного бизнес-анализа больших объемов данных потребовались такие технологии, как In-Memory Database, без которых задача оптимального кэширования данных для построения аналитики вряд ли была бы приемлемо решена.
Сергей ЗНАМЕНСКИЙ, технический консультант, HP Россия: С одной стороны, Big Data – это термин, обозначающий границы возможностей (применимости) аналитических систем (business in-telligence) на основе реляционных СУБД. Он не дает четкого определения границы, за которой начинаются «большие данные», эта граница может быть индивидуальна для каждой компании, использующей аналитические системы, и начинается от десятков или сотен терабайт. С другой стороны, Big Data – это область применения технологий и архитектур нового поколения, оптимизированных для обработки «больших данных», как структурированных, так и неструктурированных.
Сергей ЛИХАРЕВ, руководитель продаж, IBM Big Data Solutions: В первую очередь это набор технологий и архитектур, помогающий эффективно делать вещи, которые раньше были компаниям и организациям недоступны. Термин, по-моему, вторичен, а составные части понятия Big Data – объективная реальность. Мало кто будет спорить, что объемы генерируемых данных становятся просто гигантскими, что скорость поступления данных в организацию – это по сути отражение событий реального времени в окружающей среде, что данные представлены в самых разных форматах. Значит, технологии и архитектуры, помогающие компаниям анализировать информацию и принимать решения на основе анализа «больших данных», которые возникают в режиме реального времени, – совершенно практическая вещь.
Александр ЗЕЙНИКОВ, региональный менеджер по продажам в России и СНГ, LSI: Big Data – это не маркетинговый, а технический термин. Он обозначает комплекс проблем при обработке больших объемов информации. Восприятие же этого термина как маркетингового связано с чрезмерным его использованием в маркетинговых материалах, посвященных решению проблем при обработке больших объемов данных. На сегодняшний день есть целый набор архитектур и решений, а соответственно и компаний, напрямую ассоциированных с Big Data с помощью маркетинговых коммуникаций. Все это нормальный процесс коммерциализации технических проблем, возникающих с развитием вычислительных систем.
Алексей ТОСКИН, генеральный директор, T-Systems CIS: Новые технологии за термином есть, это бесспорно, но в красивой маркетинговой обертке. Иногда в понятие Big Data включают такие тенденции, как увеличение количества информации, снижение скорости обработки и разнообразие источников и типов информации, а также вызванная ими потеря структурированности. Хотя в принципе Big Data – это большой объем любых данных, структура и тип данных неважны (они могут быть и однородными). Если время отклика системы больше 10 секунд и это не вызвано производительностью сервера базы данных, то, скорее всего, данные большие.
Андрей ПРОЗОРОВ, ведущий эксперт по ИБ, InfoWatch: Big Data – это скорее новая возможность быстрой обработки больших и плохо структурированных данных, которую мы получили с развитием ИТ. А становление систем виртуализации и облаков дают мощный толчок к совершенствованию распределенных вычислений, необходимых для обработки Big Data.
Ирина ЯХИНА, руководитель отдела технологических решений, Hitachi Data Systems в России и странах СНГ: Big Data – явление, которое связано с изменениями в объемах и типах информации, поступающей из большого количества разрозненных источников. Ее сбор и хранение – задача важная, но далеко не единственная, актуализируются и другие проблемы: как обеспечить эффективный поиск, анализ и извлечение данных, как гарантировать оперативный доступ к наиболее важной для бизнеса информации и т. д. Полученные данные могут быть представлены в несовместимых друг с другом форматах, что значительно усложнит работу с ними. В результате требуются специальные решения для оптимизации работы с такими массивами информации. На практике для многих компаний Big Data начинается примерно с 50 Тбайт и может достигать петабайт, т.е. термин имеет не только качественные, но и количественные характеристики.
Александр ХЛУДЕНЕВ, заместитель гендиректора по перспективным технологиям, КРОК: Есть информация, что термин Big Data пришел из академической научной среды. В то же время это и набор технологий, таких как потоковая аналитика и аналитика неструктурированных данных, распределенные файловые системы и базы данных, массивно-параллельная обработка. Часть из них – относительно новые для массового применения в ИТ, а часть получили «второе дыхание» благодаря интересу к Big Data, в силу расширения возможностей решения реальных задач.
Денис АНДРИКОВ, заместитель технического директора по работе с заказчиками, «Открытые Технологии»: Любая новая технология в своем развитии проходит разные стадии: заявление о себе, набирание оборотов, резкий рост, расцвет и, наконец, спад, – двигаясь по свое-образному hype-cycle. Сейчас Big Data как раз находится на пике, в стадии активного роста, поэтому можно сказать, что пока маркетинговое продвижение опережает технологическое развитие. Полностью проработанной технологической базы еще нет.
Виктор СУСОЙКИН, директор по консалтингу Центра финансовых решений, РДТЕХ: Big Data – это техническая концепция, предполагающая определенные подходы, ИТ-инструменты и методики для аналитической работы с большими объемами разнородных данных. В силу популяризации данной концепции вендоры не могут не пользоваться ее названием, и потому понятие Big Data стало еще и устоявшимся маркетинговым термином.
Сергей КУЗНЕЦОВ, директор по технологиям дивизиона данных, IBS: Термин Big Data символизирует новый виток архитектуры и технологий для обработки не только большого объема данных, но и абсолютно новых типов интерактивных, быстро изменяющихся и неструктурированных данных. Как пример можно привести адаптированные программно-аппаратные комплексы для хранения таких структур (SAP HANA, Exadata). Появились и абсолютно новые подходы в анализе и хранении – «лямбда-архитектура», которая помогает анализировать в том числе потоковые данные и существенно сокращает время принятия решения.
«ИКС»: Как вы оцениваете готовность компаний в мире и в России внедрять и использовать такие продукты и решения?
Д. ПЕРВУШИН: Потребность в использовании того или иного нового продукта зависит от наличия бизнес-задач, решение которых старым способом становится неэффективным или даже невозможным. К внедрению решений Big Data готовы те компании, которые на практике столкнулись с проблемами обработки больших массивов данных за приемлемое время. Это касается прежде всего организаций, которые работают с розничным потребителем, – операторов связи, крупных банков, ритейлеров. В этих отраслях уже есть примеры внедрения Big Data-решений.
Денис РОМАНОВСКИЙ, технический директор, Artezio: В России спрос на решения и технологии «больших данных» только формируется. Процесс этот идет не очень быстро. Основные причины в том, что пока еще мало успешных примеров использования Big Data; велики риски, связанные с окупаемостью проектов; нет четких перспектив развития технологий.
С. ЛИХАРЕВ: Когда мы с заказчиками разбираем сценарии, реализованные у клиентов по всему миру, и анализируем уже доступные сегодня технологии, я вижу, что они готовы и хотят иметь возможность сопоставлять разные данные для получения новых идей для своего бизнеса. С точки зрения технологической и организационной готовности ситуация менее продвинутая. Кто-то создал уже внутренний центр компетенции по Big Data, привлек к работе специалистов по исследованию и анализу данных, сформировал список инициатив и начал активно пилотировать и внедрять первые проекты. Кто-то пока смотрит на тему как на исследовательскую. Кто-то реализовал первые проекты и наслаждается приобретенным конкурентным преимуществом. Кстати, во многом из-за этого, на мой взгляд, сейчас так сложно найти заказчика, готового поделиться не только фактом реализации проекта, но и его бизнес-результатами.
А. ЗЕЙНИКОВ: Благодаря шумихе вокруг Big Data многие из тех, кто еще не столкнулись с проблемой лицом к лицу, потенциально готовы внедрять такие решения в ближайшем будущем. Крупнейшие интернет-проекты как в России, так и за рубежом уже используют специальные архитектуры для оптимизации своих вычислительных ресурсов под Big Data. Иногда это open source-проекты, иногда самостоятельные разработки.
Андрей МЕДВЕДЕВ, руководитель направления технологического консалтинга, QlikTech: Мне кажется, уже очень многие компании российского рынка готовы внедрять решения на базе Big Data. В первую очередь это компании, деятельность которых связана с большими объемами данных: телеком, владельцы крупных интернет-проектов, сетевой ритейл, транспортные компании, нефтеперерабатывающие предприятия, компании, занимающиеся производством и продажей электроэнергии, финансовый сектор.
И. ЯХИНА: Многие компании не только готовы, но уже применяют на практике решения для работы с Big Data. Время является одним из решающих факторов успеха в конкурентной борьбе, поэтому особенно востребованы такие решения там, где благодаря быстрому анализу больших объемов клиентских данных бизнес получает возможность оперативно реагировать на рыночные изменения, своевременно предлагать клиентам актуальные для них продукты.
А. ВАСИЛЕНКО: Большинство компаний в России, к сожалению, пока не понимают всех возможностей «больших данных» и их аналитики. На мой взгляд, это одна из тех сфер, которая еще не получила достаточного развития, но имеет огромный потенциал. Я уверен, в ближайшее несколько лет мы будем наблюдать лавинообразное развитие технологий Big Data.
А. ХЛУДЕНЕВ: В мире спрос на технологии Big Data выше – это объясняется жесткой конкурентной ситуацией во всех сегментах экономики. Благодаря большим данным удается либо сократить операционные затраты компании, либо получить конкурентное преимущество и повысить выручку. Российский рынок больших данных незрелый – согласно исследованию IDC технология внедрена всего у 4% компаний. Заинтересованность в ней проявляют единицы – в основном это телеком, банки, ритейл. Интересно, что и государственные структуры обращаются к Big Data. Им интересны различные формы контроля и анализа информации из открытых источников: цены, проведение торгов и конкурсов подведомственными организациями, мониторинг и анализ интернет-сообщества на предмет восприятия деятельности госорганов.
Д. АНДРИКОВ: Желание внедрять подобные решения у российских компаний есть, так как объем хранимой и обрабатываемой ежедневно информации огромен. И налицо необходимость ее как-то анализировать, оптимизировать. Однако инфраструктура у большинства заказчиков еще недостаточно развита, культура хранения информации у нас отсутствует, данные часто хранятся разрозненно, часто дублируются, нет классификаторов.
В. СУСОЙКИН: С точки зрения технической зрелости ИТ-инструменты готовы к первым проектам в области Big Data. РДТЕХ, будучи партнером Oracle, может говорить о том, что для каждого из компонентов Big Data уже есть свой инструментарий. Но с точки зрения вызревания самой потребности в применении подобного инструментария можно некоторое время подождать и одновременно поработать над кристаллизацией этой потребности, над формированием у потребителя представления о четкой коммерческой ценности комплексного внедрения концепции Big Data.
«ИКС»: Какие факторы сдерживают внедрение решений и инструментов для работы с Big Data в мире и в России?
С. ЗНАМЕНСКИЙ: Внедрение аналитических систем нового поколения – эволюционный процесс, сдерживающими факторами являются риски, связанные с относительной новизной таких систем и недостатком опыта успешных внедрений; необходимость дополнительных инвестиций в оборудование и ПО для их развертывания, в обучение и подготовку персонала к работе с ними.
С. ЛИХАРЕВ: Сдерживающие факторы, на мой взгляд, классические: нет понимания, с чего начать и как обосновать инвестиционную привлекательность проекта, есть недостаток квалифицированных специалистов и руководителей проектов в области «больших данных». Проблема недостатка data scientists стоит несколько особняком, так как затрагивает вопросы фундаментального образования и подготовки кадров на уровне страны. Еще один фактор – невысокий уровень конкуренции в отдельных отраслях экономики. К тому же не все компании готовы перестраивать бизнес-процессы под открывшиеся возможности.
А. МЕДВЕДЕВ: Основные сдерживающие факторы – слабая готовность компаний-интеграторов, а также отсутствие отраслевых референсных проектов, которые могли бы продемонстрировать все плюсы технологии. Заказчики смотрят на классические решения, видят реальный эффект от внедрения и зачастую прекращают поиск альтернативных подходов, несмотря на то что решения на базе Big Data могут быть дешевле, производительнее и быстрее окупаться.
А. ПРОЗОРОВ: Первый сдерживающий фактор – это стоимость. Второй – сложность внедрения (длительность и потребность в специалистах). Третий – невысокий уровень зрелости ИТ-процессов во многих компаниях.
А. ВАСИЛЕНКО: Самым серьезным препятствием к применению аналитики «больших данных» является пробел в знаниях о возможностях, которые дают эти технологии. Большинство людей просто не понимают, насколько инновационные вещи можно делать с большими объемами данных и аналитикой. Им нужно наглядно объяснять, что эти технологии способны полностью изменить весь их бизнес, вывести компанию на новый уровень развития, предоставив ей конкурентные преимущества. Лучше всего этого можно добиться, продемонстрировав на практике возможности инструментов аналитики.
Д. АНДРИКОВ: Основным сдерживающим фактором является требование государств к информационной безопасности: внедрение Big Data особенно актуально для госсектора, а именно там все строго регламентировано. Коммерческие компании в этом смысле гибче и мобильнее. Чем меньше компания, тем меньше она задумывается о рисках информационной безопасности, но в то же время тем меньше она нуждается в таких инструментах, как Big Data. C другой стороны, такие программы, как Google Analytics и «Яндекс Аналитика», уже сегодня для них таковыми и являются.
И. ЯХИНА: Работа с Big Data – это для многих настоящее, которое уже наступило. Для кого-то при принятии решения ключевым является фактор цены, для кого-то – качество и скорость внедрения, кто-то же предпочитает вовсе не задумываться над решением этого вопроса. В любом случае все барьеры на пути к внедрению преодолимы, а анализ перспектив и выгод от внедрения новых систем показывает, что средства, направленные на развитие ИТ-инфраструктуры, – это не затраты, а инвестиции.