Rambler's Top100
Статьи
Светлана ГРЖЕЩУК  03 апреля 2019

Корпоративный поиск должен стать «умным»

Интерфейсы современных поисковиков стали настолько привычны, что строка поиска – первое место, куда обращается человек, чтобы найти ответ на любой интересующий его вопрос и приступить к изучению информации.

Почему эффективный поиск важен

В корпоративном поиске заинтересованы компании разного масштаба: крупный и средний бизнес, органы государственной власти. Всех их объединяет масштабный документооборот и заинтересованность в развитии ИТ-инфраструктуры.

Наличие в корпоративной информационной системе эффективного поиска обеспечивает доступ к нужной информации здесь и сейчас. При этом снижается вероятность принятия решений, основанных на недостоверной или неполной информации. Сокращаются трудозатраты на поиск нужных данных. Пользователь может ввести запрос в свободной форме, даже если не помнит точных наименований и реквизитов.

Предотвращаются дублирование информации в базе данных и потеря важных сведений. Сотрудники могут быть уверены, что в нужный момент получат доступ к нужной информации из сохраненных документов. Исключаются ситуации, когда пользователи предпочитают локальное хранение документов использованию корпоративной информационной системы.

Свои поводы обратиться к поисковой системе есть у каждой службы в компании: у бизнес-подразделений, проектных офисов, служб внутреннего контроля и аудита, служб поддержки, контакт-центров и т.п. Делопроизводители и секретари занимаются поиском входящих/исходящих документов, организационно-распорядительной документации, нормативных документов. Кадровые службы ищут сотрудников с определенными компетенциями по базе неструктурированных документов.

Юристам может быть интересен поиск по большой договорной базе или, например, поиск информации для проведения внутренних расследований. Бухгалтерам и экономистам поисковая система предоставляет первичные учетные и другие финансовые документы, например, для подготовки к проверкам. Если в компании имеется крупная база инженерной и конструкторской текстовой документации, то поиск помогает найти, например, ТЗ на деталь/инструмент или продукт. Учебным центрам нужна удобная навигация по учебным материалам и библиотеке знаний компании.

Последствия неэффективного поиска очевидны:
  • операционные потери, поскольку сотрудникам нужно просматривать и отсеивать большое количество ненужной информации;
  • нарушение сроков выполнения задач;
  • потеря важной информации и дублирование данных.
Хороший поиск – искусство, порядок или новые технологии?

Ожидания заказчиков – «хотим поиск, как в Google» -- понятны. Но корпоративный поиск, какой бы масштабной ни была компания, имеет свою специфику. Универсальной модели или формулы релевантного поиска, которую можно было бы просто взять и наложить на корпоративную среду, не существует.

Поиск в корпоративном сегменте имеет свою специфику:
  • Поисковые гиганты исследуют потребности и поведение пользователей на базе миллионов ежедневных запросов, в корпоративном секторе статистика гораздо скромнее – несколько тысяч запросов ежемесячно.
  • Необходимо принимать во внимание качество подготовки контента, т.е. занесения его в информационную среду. Занесение документа в корпоративную систему сопровождается чаще всего заполнением карточки с небольшим набором обязательных реквизитов. Возможности поиска были бы гораздо шире, если бы документ сопровождался подробным набором метаданных, включающих информацию о содержании, разделах документа, уникальных фактах из текста.
  • Для расчета релевантности корпоративных источников имеют значение такие критерии, как версии документа, их состояние, частота обращений к документу. В разных корпоративных средах вес критериев может быть различным. Например, если в организации ключевой запрос – найти документ (например, шаблон типовой формы договора) для пересылки, то вес критерия «поиск по наименованию» может быть выше. Иногда вес смещается в сторону популярности объекта (частоты обращений, просмотров), например при поиске инструкций и нормативных документов.
Существует множество универсальных и специализированных методов поиска документов в корпоративных системах. Например, поиск по регистрационным данным, по реквизитам документа, по содержимому (полнотекстовый поиск). Для того чтобы быстрее находить информацию, пользователи зачастую размещают документы по проектам в своих папках и виртуозно ориентируются в созданной под себя структуре. Это удобно, когда набор документов типовой, а иерархия папок имеет в основе легкую классификацию.

Однако есть ситуации, когда возможности встроенного поиска или привычных методов «наведения порядка» не позволяют выполнить поиск полноценно.

Во многих компаниях при подготовке к важным переговорам часто требуется быстро найти всю переписку с контрагентом за некоторый период. Ключевые слова здесь «всё» и «быстро», т.е. нужно обеспечить максимальную полноту поиска. Сеть компаний крупного контрагента может быть велика: 100 компаний в структуре – это даже не предел. Для заполнения критерия поиска по организации потребуется выбирать компании из большого списка, это неудобно и долго. Поиск переписки подразумевает выбор нескольких видов документов.

Хочется иметь возможность задать критерии быстрее и при этом не упустить важные документы в результатах. Как это сделать, несмотря на специфику поиска в корпоративной среде?

Интеллектуальные механизмы на службе корпоративного поиска

Решить встающие проблемы помогут современные поисковые технологии и механизмы искусственного интеллекта, подключенные к массиву накопленной информации.

В числе таких технологий следует отметить автоматически подбираемые категории поиска и механизм фильтрации. Это подход мы видим в интернет-магазинах или на сайтах бронирования. Некоторые корпоративные потребности он закрывает наиболее подходящим способом: в едином интерфейсе в несколько кликов можно быстро сузить выборку результатов.

Рис. 1. Фильтры помогают сузить выборку результатов

Конечно, при больших объемах данных категорирование может усложниться. К примеру, на сайтах небольших интернет-магазинов и глобальных интернет-магазинов или тур-агрегаторов реализация категорирования и фильтрации различается. Чтобы не превратить удобные инструменты поиска в «свалку», к определению наборов категорий и фильтров надо подходить взвешенно и развивать работу с ними программно: в категориях запоминать обращения пользователя, в фильтрах – индивидуальный порядок для пользователя, схлопывание пустых фильтров и т.п.
Рис. 2. Подсказки по истории запросов облегчают задание нового запроса

Еще одно важное новшество – информативное представление результата поиска. Что нужно сделать, чтобы не тратить время на переход и просмотр карточки или тела каждого документа в поисках нужной информации? Сниппеты (выдержки текста, содержащие искомые слова) давно зарекомендовали себя в поисковиках и отлично вписываются в поиск корпоративных данных. В дополнение можно отобразить любой набор реквизитов. Например – значок наличия электронной подписи у документа, информацию о сотруднике, ответственном за договор. Все это в совокупности призвано дать искомые данные уже в процессе беглого просмотра.

К современному корпоративному поисковому решению предъявляются, как правило, следующие требования:
  • быстрый и релевантный поиск в больших объемах документов;
  • удобный интерфейс с поисковой строкой;
  • обработка запросов на естественном языке, полнотекстовый поиск с учетом словоформ и синонимов;
  • исправление опечаток и неправильной раскладки клавиатуры при вводе запроса, подсказки по истории запросов и наименованиям общедоступных документов, работа с фильтрами;
  • технологии машинного обучения для подготовки значимых метаданных при занесении документов в систему;
  • обработка тел документов для обогащения полезными фактами и метаданными, используемыми при поиске;
  • семантический анализ запросов и извлечение фактов для автоматического подбора категории поиска и установки фильтров;
  • быстрая навигация в результатах поиска: фильтры, категории, выдержки из текста документов в результатах выдачи;
  • быстрый переход к предпросмотру документа.
А какие требования к корпоративному поиску вы считаете наиболее актуальными?

Светлана Гржещук, ИТ-аналитик, DIRECTUM
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!

Продолжение использования сайта пользователем интерпретируется как согласие на обработку фрагментов персональных данных (таких, как cookies) для целей корректной работы сайта.

Согласен