Речевая аналитика (Speech analytics) – это инновационная технология, позволяющая автоматизировать процесс записи и обработки устной речи: распознавание, переведение в текстовый формат, извлечение основных мыслей. Чаще всего инструмент применяется в контакт-центрах. Там, где бизнес построен на постоянных телефонных переговорах, важно не оставлять без внимания ни один звонок, своевременно отвечать на каждый и отвечать на вопросы клиентов. Автоматизация телефонии позволяет точнее выявлять маркетинговые проблемы, повышать качество коммуникации с клиентами, оптимизировать продажи.
Однако инновацию используют не только в бизнесе, но и в других областях профессиональной, общественной жизни, а также в быту. Это статья о том, как работает технология, в чём преимущества её использования и как выбрать интеллектуального помощника.
Алгоритм действия речевой аналитики
- Звукозаписывающее устройство производит запись речи, которую надо обработать. Это может быть телефонный разговор, конференция, собрание или встреча.
- Обработка разговора. На этом этапе машина разделяет звуковые дорожки собеседников. Это необходимо, чтобы точно распознать речь каждого. Иногда дорожки пересекаются. Это означает, что собеседники говорят одновременно, перебивая друг друга, что может затруднить распознавание.
- Конвертация разговора в текст. На этой стадии ИИ выявляет звуки и буквы, затем складывает из них слоги, предложения.
- Расшифровка. Полученный текст анализируется в зависимости от поставленных задач. Например, можно запрограммировать систему на определение эмоциональной окраски разговора, распознавание ключевых слов или фраз, выявление тем, тегов.
- Классификация данных. Здесь робот «раскладывает по полкам» информацию о ключевых словах, темах и других выявленных аспектах разговора. Если технология применяется для работы с клиентами, то она помогает определить наиболее частые запросы, эффективные методы решения, настроения звонящих, иные параметры.
- Визуализация данных. Для наглядности робот строит графики или диаграммы, в которых отображает данные, полученные на этапе классификации.
- Анализ полученных данных. На заключительной стадии ИИ выявляет закономерности, составляет выводы, формирует возможные решения.
Speech analytics для бизнеса

Внедрение технологий речевой аналитики в бизнес позволяет:
- Повысить качество обслуживания. Мониторинг телефонных переговоров позволяет выделить сильные и слабые стороны маркетинговых подходов, например, с какими проблемами клиенты чаще всего обращаются к менеджеру и какие из предложенных решений действуют наиболее эффективно.
- Отслеживать эффективность рекламных кампаний, определяя реакцию аудитории и устанавливая, какие приёмы нашли положительный отклик, а какие не сработали или вызвали негативную реакцию публики.
- Повысить качество обратной связи: менеджер получает возможность быстрее реагировать на проблему и принимать оперативные решения.
- Увеличить объёмы продаж. Использование ИИ помогает определять, какие тактики продажи приносят наибольшую конверсию, а какае работают плохо.
- Повысить эффективность обучения персонала. Расшифровки диалогов можно использовать в качестве учебных материалов на тренингах и курсах повышения квалификации для менеджеров. Выдержками из расшифровок эксперты могут проиллюстрировать сильные и слабые стороны переговоров.
- Контролировать менеджеров, выявляя наиболее эффективных. В каждой компании есть отдел, в котором работают специалисты, контролирующие действия менеджеров во время диалога с клиентом. Они отслеживают диалоги, определяют, соблюдает ли менеджер скрипт, достаточно ли он вежлив, как он реагирует на ту или иную ситуацию в разговоре. Контроль необходим, чтобы помогать менеджерам применять более эффективные схемы переговоров, а также вовремя реагировать на конфликтные ситуации с клиентами. Проконтролировать все звонки невозможно, поскольку за день их может быть несколько сотен. Поэтому проверку осуществляют выборочно, охватывая не более 25% звонков. Внедрение речевой аналитики позволит увеличить этот показатель до 100%, а также сразу получать готовые отчёты по каждому звонку и собирать базу данных.
- Накапливать базу данных переговоров, чтобы затем её просматривать, анализировать, сравнивать текущие результаты с предыдущими.
Технологии речевой аналитики
- Автоматическая транскрибация в текст аудио- и видеороликов, а также конференций, телефонных разговоров.
- Голосовое управление. Эта технология позволяет управлять приборами голосом, например:
- давать задание навигатору в автомобиле;
- управлять приборами в «умном доме»;
- искать информацию в интернете.
- Распознавание эмоциональной тональности. Обычные сервисы помогают распознать, расшифровать и записать речь, а некоторые – провести ряд аналитических манипуляций. Распознавание эмоций – это более продвинутый уровень speech analytics, позволяющий определить настроение говорящего, оценивать его восклицания, восторг, неуверенность, раздражение. Понимание эмоций говорящего – важный аспект в оценивании хода переговоров. Не все люди повышают голос или начинают грубо разговаривать, когда их что-то не устраивает. Многие ведут себя сдержанно, но это не означает, что их всё устраивает. Технология распознавания эмоционального состояния помогает распознать скрытые эмоции и повернуть разговор в нужное русло.
- Переводчик. Эти системы владеют многими языками. Некоторые можно использовать только как переводчиков, другие также могут распознавать речь и трансформировать в текст на нужном языке.
- Аналитические системы – это роботы, которые умеют извлекать из речи нужную информацию, например, ключевые слова, фразы, определять темы, договорённости, даты. Такие программы полезны для исследований потребностей клиентов.
Применение speech analytics в разных сферах

Искусственный интеллект для анализа человеческой речи применяется не только в сфере торговли, но также:
- В банках и иных финансовых учреждениях. С помощью ИИ проводят контроль звонков с целью анализа потребительских запросов, а также выявления мошенничества.
- В медучреждениях. Транскрибация диалога врача и пациента на приёме позволяет освободить врача от необходимости вести запись вручную и даёт больше времени на выяснение подробностей состояния и подбор схемы лечения. Технология помогает повысить качество медобслуживания, а также мониторить соблюдение стандартов внутри учреждения.
- В контактных центрах крупных компаний. Обычно в них трудятся десятки, а иногда и сотни операторов. Проконтролировать работу каждого, выявить ошибки или лучшего работника без применения нейросетей практически невозможно.
- На транспорте и в службах логистики нейросети применяют для переговоров операторов с водителями, находящимися в рейсе, а также партнёрами.
Как выбрать систему речевой аналитики
Подбирать следует, исходя из особенностей бизнеса. Например, если компания работает с иностранными партнёрами, для неё важно, чтобы нейросеть понимала иностранную речь. Если это медклиника, то робот должен правильно распознавать медицинскую терминологию. Но есть и ряд общих параметров, на которые следует обращать внимание. Так, сервис должен:
- легко интегрироваться с существующей в компании платформой CRM;
- иметь навыки аналитики, распознавания эмоционального фона;
- транскрибировать диалоги с высокой точностью – не ниже 90%;
- подходить для работы в реальном времени;
- иметь хорошую техподдержку.
Ну и, конечно, его стоимость должна соответствовать перечню возможностей и качеству работы.
Лучшие сервисы speech analytics
Название | Что умеет |
Roistat | Записывает и транскрибирует диалог, выделяя ключевые слова и фразы.Оценивает работу оператора по 22 критериям.Контролирует соблюдение скриптов.Анализирует диалоги, выявляя негатив, жалобы, отказы, благодарности.Уведомляет о проблемных звонках.Имеет 21 словарь для проверки.Легко интегрируется с сервером телефонной связи |
Mango Office | Распознаёт и переводит аудио в текст с точностью 95%.Классифицирует диалоги по заданным параметрам.Распознаёт эмоции.Пишет отчёты по 12 критериям (время переговоров, соблюдение скрипта, уровень вежливости).Для анализа использует 32 словаря, которые можно дополнять. |
Speech analytics | Транскрибирует с точностью 95%.Составляет текст переговоров в виде диалога.Оценивает беседу по 24 параметрам, включая паузы, перебивания.Распознаёт падежи.Анализирует речь по 20 словарям, может определить фразы жалобы, агрессии, недовольства. |
Imot.io | Может работать с аудио записями телефонных разговоров, а также видеоконференций в Zoom. Распознаёт речь на 90%, эмоции с точностью до 70%.Работая со звонками, может сортировать их по заданным словам, тегам.Работает со словарями с профильной терминологией, которые можно дополнять |
Tinkoff VoiceKit | Анализирует звонки и чаты с повышенной точностью: может даже распознавать сарказм.Быстро обрабатывает большие массивы данных.Систематизирует звонки по категориям.Создаёт отчёты по заданным параметрам.Проводит семантический анализ, т. е. ищет информацию не по словам или фразам, а по смыслу контекста.Для анализа использует 21 словарь |
WordPuls | Анализирует неструктурированные диалоги.Мониторит соблюдение скрипотв.Извлекает полезную информацию в соответствии с настройкой фильтров.Анализирует информацию и составляет прогнозы.Отслеживает эмоциональный фон беседы |
BSS Speech Analytics | Анализирует качество работы менеджеров и составляет отчёты по 12 шаблонам.Собирает аналитику по уровню удовлетворенности клиента, эффективности работы менеджера по ряду показателей и т. п.Может рассылать отчёты по заданному расписанию |
3iTech | Распознаёт запросы по темам.При распознавании пользуется 20 словарями.Может определять эмоциональное состояние звонящего, а также его пол и возраст.Имеет настройку на оповещение об инцидентах, связанных с переговорами в чатах, по телефону, мессенджерах или e-mail.Адаптируется под работу со специфической лексикой.Распознаёт речь на русском, английском, казахском и узбекском языках. |
Заключение
Технология речевой аналитики – это эффективный инструмент, упрощающий работу маркетинговых отделов, а также служб контроля за переговорами сотрудников. Используя нейросети, человек получил возможность переложить часть тяжёлой рутинной работы на робота:
- анализировать переговорный процесс;
- выявлять нарушения скриптов;
- определять проблемные звонки и быстро реагировать на них;
- отслеживать эмоциональный фон беседы, работу с возражениями со стороны менеджера;
- выявлять рабочие и нерабочие приёмы, направленные на повышение продаж;
- определять наиболее эффективных работников.