8 типов голосовых: как vtekst разбирает речь и почему структура у каждого своя
Просьба, вопрос, встреча, статус, объявление, обсуждение, рассказ, бытовое — для каждого типа бот выбирает свою разметку. Разбираем на примерах, почему так и где это экономит время.
Голосовое голосовому рознь. «Аня, выгрузи отчёт к среде» — это просьба с дедлайном. «Как вы решаете учёт времени?» — вопрос с открытыми пунктами. «Доделал лендинг, осталось согласовать FAQ» — статус. Если показывать все три одинаковой стеной из «Главное / Тезисы / Решения / Задачи», пустые блоки засоряют чат, а нужное теряется. Поэтому vtekst сам определяет жанр голосового и выбирает структуру под него — без настроек и команд.
Почему один шаблон не подходит всем
Долгое время бот возвращал одну и ту же разметку на каждое голосовое: TL;DR, тезисы, решения, задачи, открытые вопросы. На длинной встрече это работало хорошо. На коротком «Привет, мы доехали до дачи, всё ок» — выглядело абсурдно: пустые «Решения», пустые «Задачи», пустые «Открытые вопросы», и одна строка по делу.
Логичный шаг — научить бота сначала понимать что сказали, а потом выбирать как это показать. На входе — расшифровка. На выходе — JSON с полем kind и набор блоков под этот kind. Дальше форматтер берёт нужные блоки в нужном порядке и собирает сообщение.
Восемь жанров, которые бот распознаёт
1. Просьба — задача с адресатом и дедлайном
Иконка: 📌 «просьба». Структура: сначала Задачи, потом тезисы и открытые вопросы.
Пример: «Аня, нужно выгрузить сырые данные из CRM до среды. Лёша соберёт сводный отчёт до пятницы. Формат — PDF плюс короткое summary в почту».
Что бот вернёт:
- Просьба: Нужно собрать отчёт по продажам за апрель и прислать к пятнице.
- Задачи: Аня → выгрузить сырые данные из CRM, до среды; Лёша → собрать сводный отчёт, до пятницы.
- Тезисы: формат PDF + summary в почту; данные из CRM, вкладка «Сделки 2026».
Ключевая фишка: задачи — наверху, ещё до тезисов. Кому-то достаточно увидеть свою фамилию и дедлайн, чтобы пойти делать. Тезисы — для контекста, если интересно.
2. Вопрос — открытый запрос мнений
Иконка: ❓ «вопрос». Структура: сам вопрос в заголовке + контекст в тезисах + дополнительные пункты в «Открытых вопросах».
Пример: «Как вы решаете учёт времени по проектам? Toggl и Harvest не зашли команде, пишем в Notion, занимает 20 минут в день. Может, есть автотрекинг по календарю?».
Что бот вернёт:
- Вопрос: Как вы решаете учёт времени по проектам? Какие тулзы пробовали?
- Тезисы: пробовали Toggl и Harvest — не зашли; пишут вручную в Notion, 20 минут в день.
- Открытые вопросы: Есть решения с автотрекингом по календарю? Кто пробовал интеграцию Linear → Toggl?
В отличие от просьбы, тут нет блока «Задачи» — никто никому ничего не должен. Зато подробно расписаны открытые пункты, чтобы кто-то из чата сразу мог ответить по делу.
3. Встреча — длинное обсуждение с решениями и задачами
Иконка: 🤝 «встреча». Структура: тезисы → решения → задачи → открытые вопросы. Самая полная разметка из всех.
Пример: восьмиминутное голосовое, в котором обсудили продажу помещения, текущие платежи, кому что делать, и что осталось непрояснённым.
Что бот вернёт:
- Главное: Обсудили продажу помещения и текущие платежи по содержанию.
- Тезисы: помещение нежилое, аренда не растёт; платёж 863 ₽/мес с 1 января; собрала 20 конвертов с платёжками от Романа.
- Решения: продать помещение Оле за 275 тыс. ₽.
- Задачи: Лёша → уточнить общую сумму долга, к понедельнику; Светлана → позвонить Оле и подтвердить продажу.
- Открытые вопросы: точная сумма долга по содержанию? кто оплачивает оформление сделки?
Этот режим — ровно то, для чего бота добавляют в рабочие чаты. Кто-то сел и наговорил восемь минут — а в чате появляется структурированный протокол. Слушать переслушивать никому не надо.
Если у вас в чате идёт поток голосовых длиннее минуты — попробуйте на реальной неделе, бесплатно:
Подключить @vtekst_ai_bot4. Статус — отчёт «сделано / делаю / блокеры»
Иконка: ✅ «статус». Структура: «Сделано / делаю» в TL;DR, тезисы по пунктам, блокеры — в «Открытых вопросах».
Пример: «Доделал лендинг, выкатил на тест. Hero, calculator и FAQ работают. Mobile проверил на iPhone 12 и Pixel. Tracking-события в Метрику добавил, проверка завтра. Когда маркетинг согласует тексты FAQ?».
Руководителю не нужно слушать минуту — он видит, что готово, что в работе, и единственный блокер. Идеально для асинхронных команд и стендапов «голосом вместо текстом».
5. Объявление — короткая новость без обсуждения
Иконка: 📢 «объявление». Структура: только TL;DR и тезисы — никаких «решений» и «задач», потому что это анонс, а не обсуждение.
Примеры: «С понедельника переезжаем в новый офис на Тверской 12, второй этаж», «Билет одобрили, бюджет на конференцию выделен», «Завтра планёрки не будет».
6. Обсуждение — мысли вслух без явных задач
Иконка: 💭 «обсуждение». Структура: тезисы + открытые вопросы. Похоже на встречу, но без блока «Решения» и «Задачи» — потому что их нет, обсуждали вообще.
Пример: «Думаю, нам надо переосмыслить онбординг — текущий слишком длинный, но если резать — потеряем половину фич. Может, разбить на две части?».
7. Рассказ — история, опыт, поучение
Иконка: 📖 «рассказ». Структура: только тезисы — без задач, без вопросов. Бот сохраняет имена, места и ключевые повороты.
Полезен в семейных чатах («бабушка рассказала, как съездила к врачу») и в обучающих сообществах, где наставники наговаривают истории и опыт. Слушать 10 минут не у всех есть время.
8. Бытовое — личное и эмоциональное
Иконка: 💬 без подписи. Структура: только короткое «о чём» в одну фразу — никаких блоков.
Пример: «Привет! Мы доехали до дачи, всё ок, отдыхаем. Целую».
Здесь любая разметка избыточна. Бот просто пишет одну строчку — что и было сказано — и не добавляет пустых «Решения», «Задачи», «Открытые вопросы».
Как бот определяет жанр
На вход языковой модели уходит расшифровка целиком плюс контекст: автор речи, длительность. Модель отвечает в JSON-формате: {"kind": "task", "tldr": "…", "todos": […], "bullets": […]} — то есть сама и классифицирует, и заполняет нужные поля. Дальше форматтер сверяется с конфигом «какие блоки и в каком порядке показывать для этого kind» и собирает сообщение.
Если модель ошиблась с жанром (бывает на пограничных случаях — «вопрос или обсуждение?»), бот всё равно покажет адекватную разметку: и там, и там есть тезисы и открытые вопросы. Никаких ломающихся шаблонов нет.
Зачем это в рабочем чате
- Меньше визуального шума. Короткое голосовое не превращается в полупустой бланк с тремя пустыми разделами.
- Главное — на нужном месте. На просьбе сверху — кому что делать. На вопросе — сам вопрос. На рассказе — содержание без выдуманных «решений».
- Быстрее сканировать чат. По иконке в шапке — 📌 / ❓ / 🤝 / ✅ — сразу видно, нужно ли вчитываться: «это просьба, я проверю, тут моя фамилия» или «это рассказ, прочту вечером».
Частые вопросы
А если в одном голосовом и просьба, и встреча, и рассказ — как бот решит?
Модель смотрит на доминанту — что в речи занимает больше всего смысла. Если человек 80% говорит про дедлайн, а в конце упоминает «и кстати, на даче было тепло», бот выберет «просьба» и упомянет дачу одним bullet'ом. Жёсткой смеси типов не бывает, потому что в реальной речи всегда есть основное намерение.
Можно ли вручную задать тип голосового?
В MVP — нет. Жанр определяется автоматически. Если кейс пограничный и хочется управлять разметкой — напишите в поддержку, добавим команду /vd_kind <тип> в следующих версиях.
Что будет, если бот ошибётся с типом?
На практике мисклассификация бывает на коротких голосовых, где разница между «вопросом» и «обсуждением» условна. Структура у этих типов очень похожа (тезисы + открытые вопросы), так что результат одинаково читаемый. Если ошибка повторяется на ваших записях — напишите, с примерами это правится тонкой настройкой промпта.
Итого
Один шаблон на все голосовые — это «полотно» текста с пустыми разделами. Восемь специализированных шаблонов — это адекватный пост в чате под каждый тип сообщения, без визуального шума и с нужным акцентом. Бот делает классификацию автоматически и форматирует под жанр — пользователю не надо настраивать ничего.
Подключите бота в свой чат и проверьте на реальных записях — заметнее всего разница на длинных встречах и коротких бытовых ГС.
30 минут в месяц бесплатно. Не подойдёт — просто удалите бота из чата:
Запустить @vtekst_ai_bot