Куда деваются ваши голосовые: privacy-аудит мессенджеров и сервисов расшифровки

Что происходит с аудио, когда вы отправляете голосовое в Telegram, WhatsApp, или загружаете в сервис расшифровки. Где хранится, кто читает, можно ли удалить. Privacy-аудит для тех, кто работает с чувствительными данными.

Куда деваются ваши голосовые сообщения — privacy-аудит

Когда вы нажимаете «отправить» на голосовом сообщении — файл уходит куда-то. Куда именно, на какие сервера, кто имеет к нему доступ, как долго он там лежит — большинство пользователей не задумывается. Для бытовых разговоров это и не важно. Но если речь о юридической консультации, медицинском вопросе, корпоративной стратегии или просто личном — стоит знать. В этой статье — privacy-аудит четырёх популярных сценариев: ГС в Telegram, в WhatsApp, через диктофон с последующей расшифровкой, через @vtekst_ai_bot.

Сначала — что вас вообще беспокоит?

Privacy — это не «всё или ничего». Это про модель угроз. Кому вы не хотите давать доступ к вашим голосовым?

Уровень угрозыОт кого защищаемсяЧто нужно
Бытовой Случайный человек, увидевший экран; коллеги, которым переслали скриншот Любой нормальный мессенджер с паролем на телефон
Корпоративный Конкуренты, утечки через сторонние сервисы, NDA-нарушения End-to-end шифрование, контроль над тем, куда уходит файл
Юридический Стороны процесса, недобросовестные коллеги, требование суда о выдаче переписки Журнал доступа, ограничение хранения, лучше — локальная обработка
Государственный Спецслужбы, госорганы с запросом к операторам и сервисам End-to-end + децентрализация (Signal, локальный Whisper). Облачные сервисы не спасают

Большинству пользователей достаточно «корпоративного» уровня — то есть «не хочу, чтобы моё аудио попало в руки конкурента или утекло из-за взлома сервиса». Дальше — разбираем, насколько разные инструменты с этим справляются.

WhatsApp: end-to-end по умолчанию

WhatsApp с 2016 года использует протокол Signal — тот же, что в Signal Messenger. Голосовые сообщения шифруются end-to-end: ключи генерируются на устройстве, сервер Meta видит только зашифрованный пакет.

Что это значит на практике:

  • Meta не может прочитать ваше голосовое — ни на серверах, ни «по запросу». У них нет ключей.
  • Сотрудник Meta — тоже не может. На серверах лежит «гавкающий шум» с точки зрения данных.
  • Метаданные (кто кому когда отправил, сколько секунд) Meta видит и может выдать по запросу. Содержимое — нет.
  • Backup в iCloud / Google Drive — зависит от настройки. Если включён E2E backup — Apple/Google тоже не видят. Если не включён — могут (хотя WhatsApp с 2021 предлагает включить шифрованный бэкап).

Где WhatsApp проигрывает:

  • Файл голосового лежит в кэше WhatsApp на вашем устройстве и на устройстве собеседника — неопределённо долго. Если кто-то получает доступ к разблокированному телефону — читает всё.
  • Голосовые из групп — тоже E2E, но в каждой группе ключи у всех участников. Чем больше группа — тем выше риск утечки через одного из участников.
  • Meta всё-таки видит, кто кому отправляет ГС, как часто — это data для рекламной модели.

Telegram: «секретные» и обычные чаты

Telegram использует две схемы:

  • Обычные чаты и группы — шифрование клиент-сервер (MTProto 2.0). Сервер видит содержимое в расшифрованном виде. Telegram заявляет, что данные хранятся в распределённой инфраструктуре с разными юрисдикциями, и для расшифровки требуются ключи из нескольких юрисдикций — получить их одновременно сложно. Но технически файл существует на сервере в виде, который при наличии ключей читается.
  • Секретные чаты — end-to-end. Только между двумя устройствами. Не синхронизируются между девайсами, нельзя сделать форвард, нельзя сделать скриншот в Android (но можно в iOS). В группах секретных чатов нет.

Что это значит для голосовых:

  • В большинстве случаев вы используете обычный чат или группу — ваше ГС теоретически доступно Telegram-серверам.
  • Telegram не продаёт данные третьим лицам и не использует для рекламы — это часть продуктового позиционирования. Но это обещание, не криптография.
  • В РФ Telegram не состоит в реестре ОРИ (после возвращения в 2020 без блокировок), но ситуация может меняться. На апрель 2026 года mass-data запросы РФ-госорганов к Telegram не выполняются (по публичным заявлениям Дурова).
  • Если ваше дело реально критично (журналистика, госбезопасность, корпоративные секреты) — используйте Signal или секретные чаты Telegram, не обычные.

Облачные сервисы расшифровки: что они делают с аудио

Otter.ai, Rev, Trint, Sonix, Descript — популярные международные сервисы. Все они работают по похожей схеме:

  1. Вы загружаете аудио на их сервер (через web или приложение).
  2. Сервер обрабатывает через свою ML-модель.
  3. Возвращает текст. Аудио и текст хранятся в вашем аккаунте.
  4. Доступ — по логину/паролю или OAuth.

Что важно знать:

  • Otter.ai — по privacy policy 2025 года: аудио и транскрипты хранятся пока вы их не удалите. На бесплатном тарифе данные могут использоваться для улучшения моделей (с возможностью отказаться в настройках). Серверы — США.
  • Rev — человеческая транскрипция (живые операторы читают ваше аудио). Серверы — США. Требуется NDA с каждым оператором, но это не криптографическая гарантия.
  • Trint — enterprise-фокус, есть SOC 2 Type II сертификация. Хранение в EU/UK по желанию. Дороже, но для серьёзного B2B — вариант.
  • Sonix, Descript — используют ML, не людей. Хранят пока вы не удалите. Есть платные планы с «не тренируем на ваших данных».

Главный риск облачных сервисов — не то, что они «продают данные» (это редко), а то, что:

  • Аудио лежит на их инфраструктуре до тех пор, пока вы его не удалите. Вы это часто забываете.
  • В случае взлома сервиса (а это случается — см. утечки 2023–2025) ваши записи попадают наружу.
  • Серверы в США попадают под Cloud Act: требование от властей США выдать данные, даже если вы не американец. Российскому юристу или корпоративу это — риск.

Локальная запись + локальная расшифровка

Если ваш сценарий критичен — записывайте на диктофон без интернета, расшифровывайте на своём устройстве:

  • Voice Memos на iPhone 15 Pro+ с iOS 18 — транскрипция оффлайн, аудио и текст никуда не уходят (если вы не включили iCloud sync для Voice Memos).
  • Pixel Recorder на Pixel — то же самое: оффлайн, локально, не уходит в Google.
  • Whisper на своём ноутбуке — скачали модель (open-source), запустили через whisper.cpp или mlx-whisper, обработали файл локально. 100% контроль, ничего не уходит. Минусы — нужен ноутбук с нормальным GPU, скорость в разы ниже облачной.

Это золотой стандарт privacy. Но рабочая нагрузка такова, что 99% повседневных задач он покрывает с трудом: на часовое интервью средний MacBook потратит 5–10 минут, не каждый готов ждать.

@vtekst_ai_bot: что именно происходит с вашим аудио

Прямые факты — что происходит с вашим аудио и текстом:

Что это значит на практике:

  • Через 24 часа после расшифровки вашего ГС в нашей базе нет ни текста, ни аудио, ни саммари.
  • Если кто-то взломает наш сервер сегодня — в буфере будут только последние 24 часа транскриптов. Не «вся ваша история за год».
  • Если приходит запрос «выдайте все ГС пользователя X» — у нас просто нет, что выдавать.

Это не значит «без минусов»: данные всё-таки проходят через сервер при обработке. Если ваш сценарий «государственная тайна» — используйте локальный Whisper на своём ноутбуке. Для всего остального (бизнес, юридическая работа, личные ГС) — наш подход к приватности сравним или строже большинства облачных конкурентов.

Чек-лист — на что смотреть в любом сервисе расшифровки

Используете другой сервис — проверьте по списку:

  1. Сколько хранится аудио — ищите в privacy policy фразу «retention». Хорошо — до часов или до удаления. Плохо — «indefinite» или «for service improvement».
  2. Используется ли для обучения моделей — ищите «training», «model improvement». Хорошо — явный opt-out или «we do not train». Плохо — «we may use your data to improve our models».
  3. Где физически серверы — US, EU, RF, другое. Влияет на то, чьи законы применимы (GDPR, Cloud Act, ФЗ-152).
  4. Есть ли удаление по запросу — должен быть явный механизм «delete all my data». GDPR требует, но только для EU-резидентов.
  5. Кто читает аудио — только ML, или также живые транскрайберы (Rev, GoTranscript). Живые — это +50 человек NDA с разной мотивацией.
  6. Сертификации — SOC 2, ISO 27001, GDPR-compliance. Это не гарантия, но показатель серьёзности.
  7. Что в Terms of Service — ищете пункты «we may share with», «affiliated companies», «law enforcement requests». Это — реальная политика, не маркетинговый посыл.
Хотите проверить, как мы работаем с вашими данными?

Полная документация — в политике конфиденциальности: что хранится, как долго, какие меры защиты применяются.

Попробовать @vtekst_ai_bot

Практические правила для разных сценариев

Частые вопросы

А как насчёт ChatGPT или Claude?

Если вы загружаете аудио в ChatGPT Plus или Claude через интерфейс — ваше аудио уходит на серверы Anthropic / OpenAI, по их политике используется или нет для обучения (зависит от тарифа и настроек). Серверы — США. Российскому юристу или корпоративу — это риск Cloud Act и санкционных ограничений.

Telegram-бот безопаснее, чем веб-сервис?

Сам по себе — нет. Бот — это просто другой интерфейс к тому же сервису. Что важно — что внутри (как обращается с файлом, где хранит, как удаляет). Для @vtekst_ai_bot это описано выше; для других ботов — спрашивайте у разработчиков.

А нельзя ли просто всё шифровать на стороне клиента?

Можно, но тогда сервер не сможет расшифровать аудио для Whisper — шифрование защищает от перехвата по дороге, не от «сервиса, которому вы это аудио и собирались дать обработать». Это фундаментальное ограничение любой ML-расшифровки в облаке.

Что с ФЗ-152 (персональные данные) для российского пользователя?

Если ваше ГС содержит ПД третьих лиц (упоминаете имя клиента, диагноз, паспортные данные), и вы пересылаете в сервис расшифровки — формально вы становитесь оператором ПД, а сервис — обработчиком. По ФЗ-152 нужен договор с обработчиком и согласие субъекта ПД. На практике это редко выполняется, но в корпоративном контексте может стать вопросом.

В чём опасность «обучения на ваших данных»?

Не в том, что Алексей из OpenAI прочитает ваше ГС. А в том, что фрагменты вашего текста могут стать частью весов модели и при определённых промптах «всплывать» у других пользователей. Это редкий, но документированный риск (см. исследования по membership inference attacks). Поэтому в business-critical сценариях используют сервисы с явным no-train flag.

Если я удалю чат с ботом — расшифровки удалятся?

На вашей стороне — да, в Telegram. На нашей — текст уже занулён cron'ом через 24 часа, метаданные обезличиваются (привязка к chat_id остаётся, но без содержимого).

Читать дальше

Юристам
Голосовые в юридической работе: расшифровка как доказательство
Этика
Психологам и коучам: фиксация сессий этически
Сравнение
iPhone vs Android: где удобнее расшифровка

Privacy без компромиссов

@vtekst_ai_bot — расшифровка с удалением аудио после обработки и удалением текста через 24 часа. Российская инфраструктура, прозрачные правила, проверяемые гарантии.

Попробовать @vtekst_ai_bot