Рубрикатор |
Статьи |
Александра КРЫЛОВА  | 23 сентября 2014 |
Хотите поговорить … с роботом?
После прохождения этим летом теста Тьюринга виртуальным собеседником Евгением Густманом вопрос: «Может ли машина думать?»,- переходит из разряда философских – в технические. Сценарии распознавания речи, а также способы их монетизации оказались в поле зрения конференции «AINL: искусственный интеллект и естественный язык».
Как сознался Сергей Уласень, один из трех разработчиков Евгения Густмана, которого в ходе теста Тьюиринга члены жюри в 33% случаев приняли за подростка из Одессы, эта компьютерная программа создавалась не как коммерческий бот, а как «болталка», поддерживающая разговор на самые разные темы на протяжении долгого времени. Ее первая модель с базой диалоговой системы и базой знаний была создана еще в 2001 г. в Санкт-Петербурге, а затем команда ее создателей переехала в США. С этих пор система развивалась, приобретала индивидуальность, - словом, продолжалось ее непрерывное совершенствование , перемежающееся с ежегодным участием в тестах, вплоть до июня 2014-го до тех пор, когда чат-бот Евгений Густман, к этому времени научившийся поддерживать разговор на более, чем 100 тем, наконец, не преодолел планку в 30% в организованном универститетом Рединга в Лондоне тесте Тьюринга.
Впрочем, опыт российских компаний - московской «Наносемантики» и санкт-петербургского «Центра речевых технологий» показывавает, что виртуальные консультанты (в терминологии «Наносемантики» - «Инфы») сегодня все больше востребованы бизнесом. Их внедряют банки, операторы связи и платежные системы, на которые обрушивается шквал обращений клиентов, для того чтобы снизить нагрузку на свои контакт-центры и, получить возможность экономии. Робот-консультант, работающий на первой линии, при отсутствии в его базе знаний необходимой информации сам принимает решение о подключении к диалогу человека - оператора call-центра. (Такое решение демонстрировала на форуме «Наносемантика»). Cистемы голосового самообслуживания, разработанные «Центром речевых технологий», используются в контактных центрах ОАО «РЖД», «Газпромбанка», МТС и «МегаФона». В числе клиентов «Наносемантики» компании группы «ВымпелКом», в том числе и «Билайн» Казахстан, ВТБ24, Yota.
Разумеется, речевой интерфейс имеет свои особенности. Во-первых, как отмечает Владислав Мараев, ЦРТ, компьютер распознает речь человека иначе, чем человек, во-вторых, грамматики и языковые модели, которые им используются, по сравнению с живой человеческой речью, которая часто носит спонтанный характер, ограничены. Кроме того, попытка живого собеседника помочь виртуальному, произнося то или иное слово по слогам, вызывает у системы ошибки.
Открытыми вопросами для дискуссии специалистов в области речевых технологий остаются, например, выбор голоса для виртуального собеседника (как показывает опыт компании ЦРТ, женщинам не нравится женские голоса сильнее, чем нравятся мужские), выбор участника диалога, на стороне которого (системы или человека) должна быть инициатива? В каждом конкретном случае приходится выбирать технологию, позволяющую виртуальному консультанту говорить – синтез речи или предзаписанное сообщение. В последнем случае диалог с системой больше похож на разговор с человеком. Однако является ли на практике сходство виртуального собеседника с человеком злом или благом, то есть надо ли специально маскировать робота под человека?
Анна Власова, «Наносемантика», считает, что поскольку у людей нет опыта ведения диалога с роботами, такая возможность их пугает, хотя признает, что в отдельных случаях «маскировка» все-таки допустима. А Вячеслав Мараев рекомендует сразу информировать абонента о том, что его собеседник – автоматическая система, которая управляется голосом.
Отказ от антропоморфизма, то есть наделения человеческими качествами машин-носителей искусственного интеллекта, взяли на вооружение сразу два стартапа, разрабатывающие виртуальных собеседников для домашнего применения - CubicRobotics и «Викрон». Продукт первого, компании CubicRobotics, – персональный робот-помощник Cubic предсказуемо имеет форму куба и голосовое управление. Он может вступать в диалог с хозяином, сообщать ему новости и прогноз погоды, давать справки из Wikipedia и множества других словарей, напоминать ему о важных делах, играть с ним в речевые игры, а также управлять двумя электрическими розетками со встроенными радиомодулями.
Компания «Викрон», в партнерстве с «Наносемантикой» разработала виртуального собеседника Лекси с похожим функционалом в форме сферы. По словам Дмитрия Суворова, «Викрон», создавая голосового помощника, разработчики, в том числе, ставили перед собой задачу разгрузить визуальный канал общения, заменив его голосовым, не менее естественным. Лекси оснащен видеокамерой и двумя микрофонами, благодаря чему узнает своих собеседников по голосу и по фото, он может подключаться к Интернету через Wi-Fi и сам направляет диалог в нужное русло.
Наличия двух микрофонов для работы с персональным помощником в шумном помещении недостаточно, считает Юрий Буров, основатель CubicRobotics. «Мы полтора года разрабатывали плату на 16 микрофонов, чтобы с ее помощью очищать звук от реверберации», - говорит он. Сейчас, на этапе тестирования, микрофоны обеспечивают «захват звука» на расстоянии 8 м прямо и 4 м по бокам. Проблема, заключается в том, с ней продукт становится вполовину дороже.
Первый кубик, по словам Юрия, представлял собой подарочную коробку, внутри у которой находится смартфон с операционной системой Android, а снаружи была прикручена аудиоколонка для компьютера. Этот прототип уже тогда умел здороваться и управлять розеткой со встроенным радиомодулем. В процессе совершенстовования он расширял свой лексический запас (для распознавания речи была использована технология Google) и дополнялся новыми функциями, А потом компании CubicRobotics удалось привлечь инвестиции в размере $600 тыс. на развитие продукта. Оно дошло до стадии производства, которое размещено в Китае. На сайте разработчика ведется сбор заявок на персонального помощника и таких уже собрано свыше 2,5 тыс.
Стоить виртуальные помощники Cubic и Лекси на первых порах будут примерно одинаково – около 20 тыс. руб. По словам Юрия Бурова, в настоящее время в Китае началось производство первой партии из 100 «кубиков», а в следующей партии их будет уже 3 тысячи. Похожей ценовой и производственной политики – сначала 100 штук, потом 100, а потом 100 тыс. придерживается компания «Викрон», правда, финальная рабочая версия Лекси будет готова через 3 месяца.
Так или иначе, но оба игрока CubicRobotics и «Викрон» - первопроходцы, усилиями которых создается массовый рынок не похожих на людей домашних голосовых виртуальных помощников и собеседников, призванных развлекать своих владельцев и скрашивать их одиночество.