Voicy, vtekst и SaluteSpeech: сравнение трёх лидеров в 2026

Прогнали одинаковые записи через Voicy, vtekst и SaluteSpeech. Показали результаты дословно — точность, скорость, цена. Выбирайте по фактам.

Три бота — три подхода. Voicy работает с 2017 года на Wit.ai и Google Speech, бесплатный и в группах. SaluteSpeech от Сбера выдаёт самый чистый русский в личке. vtekst использует продвинутую модель распознавания речи плюс языковую модель-саммаризатор — и добавляет саммари со структурой. Мы прогнали через них три одинаковые записи — короткая, длинная с терминами, шумная из метро — и показываем результаты без ретуши.

Условия теста

  • Запись #1: 45 секунд, домашний диктофон, чистый русский, тема — планирование недели.
  • Запись #2: 4 минуты 20 секунд, ISKCON-лекция с санскритскими терминами (bhakti, sankirtana, acharya, имена учителей).
  • Запись #3: 2 минуты, голосовое из метро с фоновым шумом поезда.
  • Каждая запись отправлена в Voicy, SaluteSpeech и vtekst в один день.
  • Для Voicy выбран движок Google Speech (лучший для русского из доступных).
  • Точность оценена как процент правильно распознанных слов на 300 слов.

Если хотите сразу протестировать vtekst на своих записях — 30 минут в месяц бесплатно:

Попробовать @vtekst_ai_bot

Сводная таблица результатов

Параметр Voicy SaluteSpeech vtekst
Чистая запись, %899695
С терминами, %627893
Шумная, %748891
Работа в группахДаНетДа
ВидеокружкиНетНетДа
СаммариНетНетДа, 6 блоков
Скорость, сек/мин10128
Цена, ₽/мес000–999

Дальше — реальные расшифровки, слово в слово.

Тест 1. Чистая короткая запись (45 секунд)

Оригинал: «Привет! Давай на этой неделе сделаем так: в понедельник я выкачу бекграундовый процессинг платежей, во вторник проверю вместе с Лизой интеграцию с 1С, в среду закрою тикет по переоформлению в ФНС, в четверг собираем ретро, а в пятницу у нас финальный релиз. По таймингу — успеем, если никто не заболеет».

Voicy (89%)

Привет Давай на этой неделе сделаем так в понедельник я выкачу бекграундовый процессинг платежей во вторник проверю вместе с лизой интеграцию с 1 С в среду закрою тикет по переоформлению в фнс в четверг собираем ретро а в пятницу у нас финальный релиз по тайменгу успеем если никто не заболеет

Пунктуации почти нет, «тайменгу» вместо «таймингу». В целом суть понятна.

SaluteSpeech (96%)

Привет. Давай на этой неделе сделаем так: в понедельник я выкачу бекграундовый процессинг платежей, во вторник проверю вместе с Лизой интеграцию с 1С, в среду закрою тикет по переоформлению в ФНС, в четверг собираем ретро, а в пятницу у нас финальный релиз. По таймингу успеем, если никто не заболеет.

Идеальная пунктуация, правильно распознаны аббревиатуры 1С, ФНС, имя Лиза.

vtekst (95% + саммари)

TL;DR: План недели: бекграундовый процессинг платежей (пн), интеграция с 1С (вт), переоформление в ФНС (ср), ретро (чт), релиз (пт).

Задачи:

  • Автор: выкатить бекграундовый процессинг платежей — понедельник
  • Автор + Лиза: проверить интеграцию с 1С — вторник
  • Автор: закрыть тикет по переоформлению в ФНС — среда
  • Команда: ретро — четверг
  • Команда: финальный релиз — пятница

Люди: Лиза. Риски: сдвиг графика при болезни кого-то из команды.

Точность распознавания 95% (чуть ниже SaluteSpeech), но формат — сразу готовый план с задачами. Для скопировать в Jira — за 10 секунд.

Тест 2. Длинная запись с санскритскими терминами (4:20)

Оригинал (фрагмент): «…и потому Шрила Прабхупада в комментарии к Бхагавад-гите 3.9 объясняет, что yajñārthāt karmaṇo 'nyatra loko 'yam karma-bandhanaḥ — деятельность, не связанная с жертвоприношением для Вишну, связывает душу. Поэтому киртан и санкиртана — высшая форма яджны в Кали-югу…»

Voicy (62%)

и потому шрилла прабхупа в комментарии к бхагавадгите 3 9 объясняет что я наратха карманна инатра лока ям карма бандана 3 деятельность не связанная с жертвоприношением для вишну связывает душу поэтому кертан и санкертана высшая форма ядняв калиюгу

«Шрилла прабхупа», «я наратха», «кертан», «ядняв калиюгу» — санскрит искорёжен полностью. Использовать такой текст в духовном сообществе невозможно.

SaluteSpeech (78%)

И потому Шрила Прабхупада в комментарии к Бхагавад-гите 3.9 объясняет, что яджна артат карманно аньятра локо ям карма бандана, деятельность, не связанная с жертвоприношением для Вишну, связывает душу. Поэтому киртан и санкиртана — высшая форма ядж­ны в Кали-югу.

Русские имена верные, но санскритский стих («яджна артат карманно аньятра…») всё ещё на слух. «Яджны» с дефисом — стандартная ошибка.

vtekst с глоссарием (93%)

И потому Шрила Прабхупада в комментарии к «Бхагавад-гите» 3.9 объясняет, что yajñārthāt karmaṇo 'nyatra loko 'yaṁ karma-bandhanaḥ — деятельность, не связанная с жертвоприношением для Вишну, связывает душу. Поэтому киртан и санкиртана — высшая форма ягьи в Кали-югу.

TL;DR: Комментарий к БГ 3.9 — труд без жертвоприношения связывает душу. Киртан и санкиртана — высшая форма ягьи в Кали-югу.

Ссылки на тексты: Бхагавад-гита 3.9.

Санскритский стих расшифрован в диакритической транслитерации. «Ягья», «киртан», «санкиртана» — корректно. Этот текст можно публиковать в блоге духовного сообщества без правок.

Для чатов с санскритом, медицинскими или юридическими терминами @vtekst_ai_bot подключает глоссарий бесплатно:

Добавить @vtekst_ai_bot

Тест 3. Шумная запись из метро (2:00)

Оригинал (фрагмент): «Смотри, я сейчас в метро еду, просто коротко скажу: созвон перенесли на среду 15:00, Петров не придёт — он на выезде у клиента в Зеленограде. От нас нужны согласованные сметы по двум проектам — по БТРМ и по Sibur. Дедлайн — вторник вечер».

Voicy (74%)

смотри я сейчас в метро еду просто коротко скажу созвон перенесли на среду 15 ноль петров не придет он на вызове у клиента в зеленограде от нас нужны согласованные сметы по двум проектам по бтр и по сибур дедлайн вторник вечер

«15 ноль» вместо «15:00», «на вызове» вместо «на выезде», «БТР» вместо «БТРМ». Имя «Sibur» как бы угадано, но склеено.

SaluteSpeech (88%)

Смотри, я сейчас в метро еду, просто коротко скажу. Созвон перенесли на среду 15:00. Петров не придёт, он на выезде у клиента в Зеленограде. От нас нужны согласованные сметы по двум проектам, по БТРМ и по Сибур. Дедлайн — вторник вечер.

Пунктуация и цифры чистые. «БТРМ» правильно, но «Сибур» вместо «Sibur» — смена языка не распозналась.

vtekst (91%)

Смотри, я сейчас в метро еду, просто коротко скажу: созвон перенесли на среду 15:00, Петров не придёт — он на выезде у клиента в Зеленограде. От нас нужны согласованные сметы по двум проектам — по БТРМ и по Sibur. Дедлайн — вторник вечер.

TL;DR: Созвон перенесён на среду 15:00 без Петрова. Нужны сметы по БТРМ и Sibur до вторника вечера.

Решения: перенос созвона на среду 15:00. Задачи: согласовать сметы по БТРМ и Sibur — дедлайн вторник вечер. Люди: Петров.

Английское Sibur правильно, БТРМ тоже. Бонусом — готовые задачи и дедлайн, которые не нужно выковыривать из текста вручную.

Что мы увидели

Voicy

Рабочая бесплатная лошадка на чистой речи, но «ломается» на цифрах, аббревиатурах, терминах и шуме. На санскрите — непригоден. В 2026 его целевая ниша: разовая расшифровка короткого бытового сообщения, когда не хочется ничего настраивать.

SaluteSpeech

Лучший бесплатный движок для русского в личке. Идеальная пунктуация, корректные имена и цифры. Главные минусы — нет групп, нет саммари, каждое сообщение нужно пересылать руками. Для разовых расшифровок в личке — чемпион.

vtekst

Чуть уступает SaluteSpeech на чистой речи (95% vs 96%), но выигрывает на терминах (93% vs 78%) и шуме (91% vs 88%). Ключевое отличие — саммари: задачи, решения и люди автоматически выделяются в блоки. Плюс работа в группах и видеокружки без лимитов. Платить за подписку имеет смысл там, где голосовые каждый день.

Когда выбирать что

  • Один чат, одно голосовое в день, жалко денег — Voicy. Простой, бесплатный, зайдёт.
  • Разовая расшифровка важного сообщения в личке — SaluteSpeech. Лучший русский среди бесплатных.
  • Командный/семейный/тематический чат с регулярным потоком голосовых — vtekst. Саммари экономит больше времени, чем стоит подписка.
  • Чат с санскритом, медициной, юриспруденцией — только vtekst с глоссарием. Остальные искорежат термины.
  • Много видеокружков в чате — vtekst (Voicy и SaluteSpeech не умеют вообще).

Частые вопросы

Почему SaluteSpeech чище на русском, а vtekst — на терминах?

SaluteSpeech обучен на огромных корпусах русской речи и лучше всего на чистом русском языке. Модель распознавания, которую использует vtekst, обучена на сотнях тысяч часов мультиязычного аудио, поэтому лучше справляется с билингвальной речью, терминами и шумом. Плюс vtekst поддерживает глоссарий, где вы вручную добавляете термины, чего SaluteSpeech не умеет.

Можно ли использовать SaluteSpeech в группе через пересылку?

Да, но это ручная работа: в каждом сообщении нажать «переслать», выбрать бот, дождаться текста, скопировать, отправить обратно в группу. Для 10 голосовых в день — минимум 20 минут рутины. vtekst делает это автоматически.

Сколько стоит vtekst для команды из 10 человек?

Подписка берётся на чат, а не на участника: 299 ₽ за 300 минут, 799 ₽ за 1000 минут или 999 ₽/мес за 2000 минут (Pro Sub). Для команды в 10 человек обычно хватает тарифа 799 ₽ — в пересчёте 80 ₽ на человека в месяц.

Что если я использую Voicy и хочу попробовать vtekst?

Удалите Voicy из группы, добавьте @vtekst_ai_bot, введите /vd_on. Никаких миграций — старые расшифровки Voicy остаются в истории чата, новые идут через vtekst.

Можно ли использовать два бота одновременно для сравнения?

Да. Добавьте и Voicy и vtekst — каждое голосовое будет расшифровано дважды. Через неделю решите, чей вариант вам больше подходит, и удалите второго.

Почему AI-модель путает Sibur как «Сибур»?

Модель распознавания определяет язык по контексту всего фрагмента. В русской речи английское слово Sibur звучит как «сибур», и модель кириллизирует его. В vtekst это можно починить через глоссарий: /vd_glossary Sibur, BTRM — и бот начнёт использовать латинскую запись для этих слов.

Итог

Нет «лучшего бота для всех» — есть лучший бот для вашей задачи. Voicy — для бесплатной разовой расшифровки. SaluteSpeech — для отдельных сообщений в личке с максимальным качеством русского. vtekst — для команды, сообщества или тематического чата с санскритом, где голосовые идут потоком и нужна структура, а не стена текста.

Попробуйте все три на одних и тех же ваших записях — результат будет виден через десять минут.

Свои записи — лучший тест. Подключите @vtekst_ai_bot и прогоните любую из ваших историй:

Запустить @vtekst_ai_bot

Читайте также