Voicy, vtekst и SaluteSpeech: сравнение трёх лидеров в 2026
Прогнали одинаковые записи через Voicy, vtekst и SaluteSpeech. Показали результаты дословно — точность, скорость, цена. Выбирайте по фактам.
Три бота — три подхода. Voicy работает с 2017 года на Wit.ai и Google Speech, бесплатный и в группах. SaluteSpeech от Сбера выдаёт самый чистый русский в личке. vtekst использует продвинутую модель распознавания речи плюс языковую модель-саммаризатор — и добавляет саммари со структурой. Мы прогнали через них три одинаковые записи — короткая, длинная с терминами, шумная из метро — и показываем результаты без ретуши.
Условия теста
- Запись #1: 45 секунд, домашний диктофон, чистый русский, тема — планирование недели.
- Запись #2: 4 минуты 20 секунд, ISKCON-лекция с санскритскими терминами (bhakti, sankirtana, acharya, имена учителей).
- Запись #3: 2 минуты, голосовое из метро с фоновым шумом поезда.
- Каждая запись отправлена в Voicy, SaluteSpeech и vtekst в один день.
- Для Voicy выбран движок Google Speech (лучший для русского из доступных).
- Точность оценена как процент правильно распознанных слов на 300 слов.
Если хотите сразу протестировать vtekst на своих записях — 30 минут в месяц бесплатно:
Попробовать @vtekst_ai_botСводная таблица результатов
| Параметр | Voicy | SaluteSpeech | vtekst |
|---|---|---|---|
| Чистая запись, % | 89 | 96 | 95 |
| С терминами, % | 62 | 78 | 93 |
| Шумная, % | 74 | 88 | 91 |
| Работа в группах | Да | Нет | Да |
| Видеокружки | Нет | Нет | Да |
| Саммари | Нет | Нет | Да, 6 блоков |
| Скорость, сек/мин | 10 | 12 | 8 |
| Цена, ₽/мес | 0 | 0 | 0–999 |
Дальше — реальные расшифровки, слово в слово.
Тест 1. Чистая короткая запись (45 секунд)
Оригинал: «Привет! Давай на этой неделе сделаем так: в понедельник я выкачу бекграундовый процессинг платежей, во вторник проверю вместе с Лизой интеграцию с 1С, в среду закрою тикет по переоформлению в ФНС, в четверг собираем ретро, а в пятницу у нас финальный релиз. По таймингу — успеем, если никто не заболеет».
Voicy (89%)
Привет Давай на этой неделе сделаем так в понедельник я выкачу бекграундовый процессинг платежей во вторник проверю вместе с лизой интеграцию с 1 С в среду закрою тикет по переоформлению в фнс в четверг собираем ретро а в пятницу у нас финальный релиз по тайменгу успеем если никто не заболеет
Пунктуации почти нет, «тайменгу» вместо «таймингу». В целом суть понятна.
SaluteSpeech (96%)
Привет. Давай на этой неделе сделаем так: в понедельник я выкачу бекграундовый процессинг платежей, во вторник проверю вместе с Лизой интеграцию с 1С, в среду закрою тикет по переоформлению в ФНС, в четверг собираем ретро, а в пятницу у нас финальный релиз. По таймингу успеем, если никто не заболеет.
Идеальная пунктуация, правильно распознаны аббревиатуры 1С, ФНС, имя Лиза.
vtekst (95% + саммари)
TL;DR: План недели: бекграундовый процессинг платежей (пн), интеграция с 1С (вт), переоформление в ФНС (ср), ретро (чт), релиз (пт).
Задачи:
- Автор: выкатить бекграундовый процессинг платежей — понедельник
- Автор + Лиза: проверить интеграцию с 1С — вторник
- Автор: закрыть тикет по переоформлению в ФНС — среда
- Команда: ретро — четверг
- Команда: финальный релиз — пятница
Люди: Лиза. Риски: сдвиг графика при болезни кого-то из команды.
Точность распознавания 95% (чуть ниже SaluteSpeech), но формат — сразу готовый план с задачами. Для скопировать в Jira — за 10 секунд.
Тест 2. Длинная запись с санскритскими терминами (4:20)
Оригинал (фрагмент): «…и потому Шрила Прабхупада в комментарии к Бхагавад-гите 3.9 объясняет, что yajñārthāt karmaṇo 'nyatra loko 'yam karma-bandhanaḥ — деятельность, не связанная с жертвоприношением для Вишну, связывает душу. Поэтому киртан и санкиртана — высшая форма яджны в Кали-югу…»
Voicy (62%)
и потому шрилла прабхупа в комментарии к бхагавадгите 3 9 объясняет что я наратха карманна инатра лока ям карма бандана 3 деятельность не связанная с жертвоприношением для вишну связывает душу поэтому кертан и санкертана высшая форма ядняв калиюгу
«Шрилла прабхупа», «я наратха», «кертан», «ядняв калиюгу» — санскрит искорёжен полностью. Использовать такой текст в духовном сообществе невозможно.
SaluteSpeech (78%)
И потому Шрила Прабхупада в комментарии к Бхагавад-гите 3.9 объясняет, что яджна артат карманно аньятра локо ям карма бандана, деятельность, не связанная с жертвоприношением для Вишну, связывает душу. Поэтому киртан и санкиртана — высшая форма яджны в Кали-югу.
Русские имена верные, но санскритский стих («яджна артат карманно аньятра…») всё ещё на слух. «Яджны» с дефисом — стандартная ошибка.
vtekst с глоссарием (93%)
И потому Шрила Прабхупада в комментарии к «Бхагавад-гите» 3.9 объясняет, что yajñārthāt karmaṇo 'nyatra loko 'yaṁ karma-bandhanaḥ — деятельность, не связанная с жертвоприношением для Вишну, связывает душу. Поэтому киртан и санкиртана — высшая форма ягьи в Кали-югу.
TL;DR: Комментарий к БГ 3.9 — труд без жертвоприношения связывает душу. Киртан и санкиртана — высшая форма ягьи в Кали-югу.
Ссылки на тексты: Бхагавад-гита 3.9.
Санскритский стих расшифрован в диакритической транслитерации. «Ягья», «киртан», «санкиртана» — корректно. Этот текст можно публиковать в блоге духовного сообщества без правок.
Для чатов с санскритом, медицинскими или юридическими терминами @vtekst_ai_bot подключает глоссарий бесплатно:
Добавить @vtekst_ai_botТест 3. Шумная запись из метро (2:00)
Оригинал (фрагмент): «Смотри, я сейчас в метро еду, просто коротко скажу: созвон перенесли на среду 15:00, Петров не придёт — он на выезде у клиента в Зеленограде. От нас нужны согласованные сметы по двум проектам — по БТРМ и по Sibur. Дедлайн — вторник вечер».
Voicy (74%)
смотри я сейчас в метро еду просто коротко скажу созвон перенесли на среду 15 ноль петров не придет он на вызове у клиента в зеленограде от нас нужны согласованные сметы по двум проектам по бтр и по сибур дедлайн вторник вечер
«15 ноль» вместо «15:00», «на вызове» вместо «на выезде», «БТР» вместо «БТРМ». Имя «Sibur» как бы угадано, но склеено.
SaluteSpeech (88%)
Смотри, я сейчас в метро еду, просто коротко скажу. Созвон перенесли на среду 15:00. Петров не придёт, он на выезде у клиента в Зеленограде. От нас нужны согласованные сметы по двум проектам, по БТРМ и по Сибур. Дедлайн — вторник вечер.
Пунктуация и цифры чистые. «БТРМ» правильно, но «Сибур» вместо «Sibur» — смена языка не распозналась.
vtekst (91%)
Смотри, я сейчас в метро еду, просто коротко скажу: созвон перенесли на среду 15:00, Петров не придёт — он на выезде у клиента в Зеленограде. От нас нужны согласованные сметы по двум проектам — по БТРМ и по Sibur. Дедлайн — вторник вечер.
TL;DR: Созвон перенесён на среду 15:00 без Петрова. Нужны сметы по БТРМ и Sibur до вторника вечера.
Решения: перенос созвона на среду 15:00. Задачи: согласовать сметы по БТРМ и Sibur — дедлайн вторник вечер. Люди: Петров.
Английское Sibur правильно, БТРМ тоже. Бонусом — готовые задачи и дедлайн, которые не нужно выковыривать из текста вручную.
Что мы увидели
Voicy
Рабочая бесплатная лошадка на чистой речи, но «ломается» на цифрах, аббревиатурах, терминах и шуме. На санскрите — непригоден. В 2026 его целевая ниша: разовая расшифровка короткого бытового сообщения, когда не хочется ничего настраивать.
SaluteSpeech
Лучший бесплатный движок для русского в личке. Идеальная пунктуация, корректные имена и цифры. Главные минусы — нет групп, нет саммари, каждое сообщение нужно пересылать руками. Для разовых расшифровок в личке — чемпион.
vtekst
Чуть уступает SaluteSpeech на чистой речи (95% vs 96%), но выигрывает на терминах (93% vs 78%) и шуме (91% vs 88%). Ключевое отличие — саммари: задачи, решения и люди автоматически выделяются в блоки. Плюс работа в группах и видеокружки без лимитов. Платить за подписку имеет смысл там, где голосовые каждый день.
Когда выбирать что
- Один чат, одно голосовое в день, жалко денег — Voicy. Простой, бесплатный, зайдёт.
- Разовая расшифровка важного сообщения в личке — SaluteSpeech. Лучший русский среди бесплатных.
- Командный/семейный/тематический чат с регулярным потоком голосовых — vtekst. Саммари экономит больше времени, чем стоит подписка.
- Чат с санскритом, медициной, юриспруденцией — только vtekst с глоссарием. Остальные искорежат термины.
- Много видеокружков в чате — vtekst (Voicy и SaluteSpeech не умеют вообще).
Частые вопросы
Почему SaluteSpeech чище на русском, а vtekst — на терминах?
SaluteSpeech обучен на огромных корпусах русской речи и лучше всего на чистом русском языке. Модель распознавания, которую использует vtekst, обучена на сотнях тысяч часов мультиязычного аудио, поэтому лучше справляется с билингвальной речью, терминами и шумом. Плюс vtekst поддерживает глоссарий, где вы вручную добавляете термины, чего SaluteSpeech не умеет.
Можно ли использовать SaluteSpeech в группе через пересылку?
Да, но это ручная работа: в каждом сообщении нажать «переслать», выбрать бот, дождаться текста, скопировать, отправить обратно в группу. Для 10 голосовых в день — минимум 20 минут рутины. vtekst делает это автоматически.
Сколько стоит vtekst для команды из 10 человек?
Подписка берётся на чат, а не на участника: 299 ₽ за 300 минут, 799 ₽ за 1000 минут или 999 ₽/мес за 2000 минут (Pro Sub). Для команды в 10 человек обычно хватает тарифа 799 ₽ — в пересчёте 80 ₽ на человека в месяц.
Что если я использую Voicy и хочу попробовать vtekst?
Удалите Voicy из группы, добавьте @vtekst_ai_bot, введите /vd_on. Никаких миграций — старые расшифровки Voicy остаются в истории чата, новые идут через vtekst.
Можно ли использовать два бота одновременно для сравнения?
Да. Добавьте и Voicy и vtekst — каждое голосовое будет расшифровано дважды. Через неделю решите, чей вариант вам больше подходит, и удалите второго.
Почему AI-модель путает Sibur как «Сибур»?
Модель распознавания определяет язык по контексту всего фрагмента. В русской речи английское слово Sibur звучит как «сибур», и модель кириллизирует его. В vtekst это можно починить через глоссарий: /vd_glossary Sibur, BTRM — и бот начнёт использовать латинскую запись для этих слов.
Итог
Нет «лучшего бота для всех» — есть лучший бот для вашей задачи. Voicy — для бесплатной разовой расшифровки. SaluteSpeech — для отдельных сообщений в личке с максимальным качеством русского. vtekst — для команды, сообщества или тематического чата с санскритом, где голосовые идут потоком и нужна структура, а не стена текста.
Попробуйте все три на одних и тех же ваших записях — результат будет виден через десять минут.
Свои записи — лучший тест. Подключите @vtekst_ai_bot и прогоните любую из ваших историй:
Запустить @vtekst_ai_bot