Куда деваются ваши голосовые: privacy-аудит мессенджеров и сервисов расшифровки

Что происходит с аудио, когда вы отправляете голосовое в Telegram, WhatsApp, или загружаете в сервис расшифровки. Где хранится, кто читает, можно ли удалить. Privacy-аудит для тех, кто работает с чувствительными данными.

30 April 2026 · 10 мин чтения

Куда деваются ваши голосовые сообщения — privacy-аудит

Когда вы нажимаете «отправить» на голосовом сообщении — файл уходит куда-то. Куда именно, на какие сервера, кто имеет к нему доступ, как долго он там лежит — большинство пользователей не задумывается. Для бытовых разговоров это и не важно. Но если речь о юридической консультации, медицинском вопросе, корпоративной стратегии или просто личном — стоит знать. В этой статье — privacy-аудит четырёх популярных сценариев: ГС в Telegram, в WhatsApp, через диктофон с последующей расшифровкой, через @vtekst_ai_bot.

Если коротко

WhatsApp — end-to-end шифрование. Голосовые читают только вы и собеседник, серверы Meta видят только метаданные. Но на ваших устройствах файл лежит в кэше неопределённо долго.
Telegram — end-to-end только в «секретных чатах». Обычные чаты и группы — шифрование клиент-сервер, но серверы Telegram теоретически могут читать.
Сторонние сервисы расшифровки — часто загружают аудио на свои серверы (Otter.ai, Rev, Trint), хранят месяцами, могут использовать для обучения моделей.
@vtekst_ai_bot — удаляет аудио сразу после расшифровки, текст и саммари автоматически удаляются в течение суток. Не использует ваши данные для обучения.
Главный вывод: «нигде не хранится» — это сильное обещание. Проверять можно, читая privacy policy и спрашивая у разработчика. Для критичных данных — не использовать публичные облачные сервисы вообще.

Сначала — что вас вообще беспокоит?

Privacy — это не «всё или ничего». Это про модель угроз. Кому вы не хотите давать доступ к вашим голосовым?

Уровень угрозы	От кого защищаемся	Что нужно
Бытовой	Случайный человек, увидевший экран; коллеги, которым переслали скриншот	Любой нормальный мессенджер с паролем на телефон
Корпоративный	Конкуренты, утечки через сторонние сервисы, NDA-нарушения	End-to-end шифрование, контроль над тем, куда уходит файл
Юридический	Стороны процесса, недобросовестные коллеги, требование суда о выдаче переписки	Журнал доступа, ограничение хранения, лучше — локальная обработка
Государственный	Спецслужбы, госорганы с запросом к операторам и сервисам	End-to-end + децентрализация (Signal, локальный Whisper). Облачные сервисы не спасают

Большинству пользователей достаточно «корпоративного» уровня — то есть «не хочу, чтобы моё аудио попало в руки конкурента или утекло из-за взлома сервиса». Дальше — разбираем, насколько разные инструменты с этим справляются.

WhatsApp: end-to-end по умолчанию

WhatsApp с 2016 года использует протокол Signal — тот же, что в Signal Messenger. Голосовые сообщения шифруются end-to-end: ключи генерируются на устройстве, сервер Meta видит только зашифрованный пакет.

Что это значит на практике:

Meta не может прочитать ваше голосовое — ни на серверах, ни «по запросу». У них нет ключей.
Сотрудник Meta — тоже не может. На серверах лежит «гавкающий шум» с точки зрения данных.
Метаданные (кто кому когда отправил, сколько секунд) Meta видит и может выдать по запросу. Содержимое — нет.
Backup в iCloud / Google Drive — зависит от настройки. Если включён E2E backup — Apple/Google тоже не видят. Если не включён — могут (хотя WhatsApp с 2021 предлагает включить шифрованный бэкап).

Где WhatsApp проигрывает:

Файл голосового лежит в кэше WhatsApp на вашем устройстве и на устройстве собеседника — неопределённо долго. Если кто-то получает доступ к разблокированному телефону — читает всё.
Голосовые из групп — тоже E2E, но в каждой группе ключи у всех участников. Чем больше группа — тем выше риск утечки через одного из участников.
Meta всё-таки видит, кто кому отправляет ГС, как часто — это data для рекламной модели.

Telegram: «секретные» и обычные чаты

Telegram использует две схемы:

Обычные чаты и группы — шифрование клиент-сервер (MTProto 2.0). Сервер видит содержимое в расшифрованном виде. Telegram заявляет, что данные хранятся в распределённой инфраструктуре с разными юрисдикциями, и для расшифровки требуются ключи из нескольких юрисдикций — получить их одновременно сложно. Но технически файл существует на сервере в виде, который при наличии ключей читается.
Секретные чаты — end-to-end. Только между двумя устройствами. Не синхронизируются между девайсами, нельзя сделать форвард, нельзя сделать скриншот в Android (но можно в iOS). В группах секретных чатов нет.

Что это значит для голосовых:

В большинстве случаев вы используете обычный чат или группу — ваше ГС теоретически доступно Telegram-серверам.
Telegram не продаёт данные третьим лицам и не использует для рекламы — это часть продуктового позиционирования. Но это обещание, не криптография.
В РФ Telegram не состоит в реестре ОРИ (после возвращения в 2020 без блокировок), но ситуация может меняться. На апрель 2026 года mass-data запросы РФ-госорганов к Telegram не выполняются (по публичным заявлениям Дурова).
Если ваше дело реально критично (журналистика, госбезопасность, корпоративные секреты) — используйте Signal или секретные чаты Telegram, не обычные.

Облачные сервисы расшифровки: что они делают с аудио

Otter.ai, Rev, Trint, Sonix, Descript — популярные международные сервисы. Все они работают по похожей схеме:

Вы загружаете аудио на их сервер (через web или приложение).
Сервер обрабатывает через свою ML-модель.
Возвращает текст. Аудио и текст хранятся в вашем аккаунте.
Доступ — по логину/паролю или OAuth.

Что важно знать:

Otter.ai — по privacy policy 2025 года: аудио и транскрипты хранятся пока вы их не удалите. На бесплатном тарифе данные могут использоваться для улучшения моделей (с возможностью отказаться в настройках). Серверы — США.
Rev — человеческая транскрипция (живые операторы читают ваше аудио). Серверы — США. Требуется NDA с каждым оператором, но это не криптографическая гарантия.
Trint — enterprise-фокус, есть SOC 2 Type II сертификация. Хранение в EU/UK по желанию. Дороже, но для серьёзного B2B — вариант.
Sonix, Descript — используют ML, не людей. Хранят пока вы не удалите. Есть платные планы с «не тренируем на ваших данных».

Главный риск облачных сервисов — не то, что они «продают данные» (это редко), а то, что:

Аудио лежит на их инфраструктуре до тех пор, пока вы его не удалите. Вы это часто забываете.
В случае взлома сервиса (а это случается — см. утечки 2023–2025) ваши записи попадают наружу.
Серверы в США попадают под Cloud Act: требование от властей США выдать данные, даже если вы не американец. Российскому юристу или корпоративу это — риск.

Локальная запись + локальная расшифровка

Если ваш сценарий критичен — записывайте на диктофон без интернета, расшифровывайте на своём устройстве:

Voice Memos на iPhone 15 Pro+ с iOS 18 — транскрипция оффлайн, аудио и текст никуда не уходят (если вы не включили iCloud sync для Voice Memos).
Pixel Recorder на Pixel — то же самое: оффлайн, локально, не уходит в Google.
Whisper на своём ноутбуке — скачали модель (open-source), запустили через whisper.cpp или mlx-whisper, обработали файл локально. 100% контроль, ничего не уходит. Минусы — нужен ноутбук с нормальным GPU, скорость в разы ниже облачной.

Это золотой стандарт privacy. Но рабочая нагрузка такова, что 99% повседневных задач он покрывает с трудом: на часовое интервью средний MacBook потратит 5–10 минут, не каждый готов ждать.

@vtekst_ai_bot: что именно происходит с вашим аудио

Прямые факты — что происходит с вашим аудио и текстом:

Что бот делает с вашими данными

Аудио — удаляется сразу после обработки. Время жизни на серверах — десятки секунд, не дольше.
Транскрипт и саммари — автоматически удаляются в течение суток. После этого ни текста, ни саммари в базе нет.
Инфраструктура — серверы в РФ. Аудио и текст не передаются третьим сервисам для обучения моделей.
Чего у бота нет — поиска по архиву, экспорта в Notion, веб-кабинета с историей. Хранилища, в котором это можно было бы делать, не существует.
Что хранится постоянно — только метаданные для биллинга: длительность ГС, время обработки, идентификатор чата. Содержимого нет.

Что это значит на практике:

Через 24 часа после расшифровки вашего ГС в нашей базе нет ни текста, ни аудио, ни саммари.
Если кто-то взломает наш сервер сегодня — в буфере будут только последние 24 часа транскриптов. Не «вся ваша история за год».
Если приходит запрос «выдайте все ГС пользователя X» — у нас просто нет, что выдавать.

Это не значит «без минусов»: данные всё-таки проходят через сервер при обработке. Если ваш сценарий «государственная тайна» — используйте локальный Whisper на своём ноутбуке. Для всего остального (бизнес, юридическая работа, личные ГС) — наш подход к приватности сравним или строже большинства облачных конкурентов.

Чек-лист — на что смотреть в любом сервисе расшифровки

Используете другой сервис — проверьте по списку:

Сколько хранится аудио — ищите в privacy policy фразу «retention». Хорошо — до часов или до удаления. Плохо — «indefinite» или «for service improvement».
Используется ли для обучения моделей — ищите «training», «model improvement». Хорошо — явный opt-out или «we do not train». Плохо — «we may use your data to improve our models».
Где физически серверы — US, EU, RF, другое. Влияет на то, чьи законы применимы (GDPR, Cloud Act, ФЗ-152).
Есть ли удаление по запросу — должен быть явный механизм «delete all my data». GDPR требует, но только для EU-резидентов.
Кто читает аудио — только ML, или также живые транскрайберы (Rev, GoTranscript). Живые — это +50 человек NDA с разной мотивацией.
Сертификации — SOC 2, ISO 27001, GDPR-compliance. Это не гарантия, но показатель серьёзности.
Что в Terms of Service — ищете пункты «we may share with», «affiliated companies», «law enforcement requests». Это — реальная политика, не маркетинговый посыл.

Хотите проверить, как мы работаем с вашими данными?

Полная документация — в политике конфиденциальности: что хранится, как долго, какие меры защиты применяются.

Попробовать @vtekst_ai_bot

Практические правила для разных сценариев

✓ Что делать в жизни

Бытовое ГС другу: любой мессенджер, любой бот — privacy не критична.
Рабочее ГС с коллегой: Telegram + @vtekst_ai_bot — баланс удобства и разумной защиты.
Юридическая консультация / клиент-адвокат: запись на диктофон оффлайн + локальная транскрипция (Whisper на своём ноутбуке) или iPhone Voice Memos с выключенным iCloud sync.
Корпоративная встреча с NDA: Trint Enterprise (SOC 2, EU storage) или локальная транскрипция.
Личное (терапия, медицинский вопрос): WhatsApp с E2E backup, или Signal — и не пересылайте никуда. Если нужна расшифровка — только локальная.
Журналистский источник: Signal, разовое устройство, локальный Whisper. Никаких облачных сервисов в принципе.

Частые вопросы

А как насчёт ChatGPT или Claude?

Если вы загружаете аудио в ChatGPT Plus или Claude через интерфейс — ваше аудио уходит на серверы Anthropic / OpenAI, по их политике используется или нет для обучения (зависит от тарифа и настроек). Серверы — США. Российскому юристу или корпоративу — это риск Cloud Act и санкционных ограничений.

Telegram-бот безопаснее, чем веб-сервис?

Сам по себе — нет. Бот — это просто другой интерфейс к тому же сервису. Что важно — что внутри (как обращается с файлом, где хранит, как удаляет). Для @vtekst_ai_bot это описано выше; для других ботов — спрашивайте у разработчиков.

А нельзя ли просто всё шифровать на стороне клиента?

Можно, но тогда сервер не сможет расшифровать аудио для Whisper — шифрование защищает от перехвата по дороге, не от «сервиса, которому вы это аудио и собирались дать обработать». Это фундаментальное ограничение любой ML-расшифровки в облаке.

Что с ФЗ-152 (персональные данные) для российского пользователя?

Если ваше ГС содержит ПД третьих лиц (упоминаете имя клиента, диагноз, паспортные данные), и вы пересылаете в сервис расшифровки — формально вы становитесь оператором ПД, а сервис — обработчиком. По ФЗ-152 нужен договор с обработчиком и согласие субъекта ПД. На практике это редко выполняется, но в корпоративном контексте может стать вопросом.

В чём опасность «обучения на ваших данных»?

Не в том, что Алексей из OpenAI прочитает ваше ГС. А в том, что фрагменты вашего текста могут стать частью весов модели и при определённых промптах «всплывать» у других пользователей. Это редкий, но документированный риск (см. исследования по membership inference attacks). Поэтому в business-critical сценариях используют сервисы с явным no-train flag.

Если я удалю чат с ботом — расшифровки удалятся?

На вашей стороне — да, в Telegram. На нашей — текст уже занулён cron'ом через 24 часа, метаданные обезличиваются (привязка к chat_id остаётся, но без содержимого).

Privacy без компромиссов

@vtekst_ai_bot — расшифровка с удалением аудио после обработки и удалением текста через 24 часа. Российская инфраструктура, прозрачные правила, проверяемые гарантии.