Куда деваются ваши голосовые: privacy-аудит мессенджеров и сервисов расшифровки
Что происходит с аудио, когда вы отправляете голосовое в Telegram, WhatsApp, или загружаете в сервис расшифровки. Где хранится, кто читает, можно ли удалить. Privacy-аудит для тех, кто работает с чувствительными данными.
Когда вы нажимаете «отправить» на голосовом сообщении — файл уходит куда-то. Куда именно, на какие сервера, кто имеет к нему доступ, как долго он там лежит — большинство пользователей не задумывается. Для бытовых разговоров это и не важно. Но если речь о юридической консультации, медицинском вопросе, корпоративной стратегии или просто личном — стоит знать. В этой статье — privacy-аудит четырёх популярных сценариев: ГС в Telegram, в WhatsApp, через диктофон с последующей расшифровкой, через @vtekst_ai_bot.
Сначала — что вас вообще беспокоит?
Privacy — это не «всё или ничего». Это про модель угроз. Кому вы не хотите давать доступ к вашим голосовым?
| Уровень угрозы | От кого защищаемся | Что нужно |
|---|---|---|
| Бытовой | Случайный человек, увидевший экран; коллеги, которым переслали скриншот | Любой нормальный мессенджер с паролем на телефон |
| Корпоративный | Конкуренты, утечки через сторонние сервисы, NDA-нарушения | End-to-end шифрование, контроль над тем, куда уходит файл |
| Юридический | Стороны процесса, недобросовестные коллеги, требование суда о выдаче переписки | Журнал доступа, ограничение хранения, лучше — локальная обработка |
| Государственный | Спецслужбы, госорганы с запросом к операторам и сервисам | End-to-end + децентрализация (Signal, локальный Whisper). Облачные сервисы не спасают |
Большинству пользователей достаточно «корпоративного» уровня — то есть «не хочу, чтобы моё аудио попало в руки конкурента или утекло из-за взлома сервиса». Дальше — разбираем, насколько разные инструменты с этим справляются.
WhatsApp: end-to-end по умолчанию
WhatsApp с 2016 года использует протокол Signal — тот же, что в Signal Messenger. Голосовые сообщения шифруются end-to-end: ключи генерируются на устройстве, сервер Meta видит только зашифрованный пакет.
Что это значит на практике:
- Meta не может прочитать ваше голосовое — ни на серверах, ни «по запросу». У них нет ключей.
- Сотрудник Meta — тоже не может. На серверах лежит «гавкающий шум» с точки зрения данных.
- Метаданные (кто кому когда отправил, сколько секунд) Meta видит и может выдать по запросу. Содержимое — нет.
- Backup в iCloud / Google Drive — зависит от настройки. Если включён E2E backup — Apple/Google тоже не видят. Если не включён — могут (хотя WhatsApp с 2021 предлагает включить шифрованный бэкап).
Где WhatsApp проигрывает:
- Файл голосового лежит в кэше WhatsApp на вашем устройстве и на устройстве собеседника — неопределённо долго. Если кто-то получает доступ к разблокированному телефону — читает всё.
- Голосовые из групп — тоже E2E, но в каждой группе ключи у всех участников. Чем больше группа — тем выше риск утечки через одного из участников.
- Meta всё-таки видит, кто кому отправляет ГС, как часто — это data для рекламной модели.
Telegram: «секретные» и обычные чаты
Telegram использует две схемы:
- Обычные чаты и группы — шифрование клиент-сервер (MTProto 2.0). Сервер видит содержимое в расшифрованном виде. Telegram заявляет, что данные хранятся в распределённой инфраструктуре с разными юрисдикциями, и для расшифровки требуются ключи из нескольких юрисдикций — получить их одновременно сложно. Но технически файл существует на сервере в виде, который при наличии ключей читается.
- Секретные чаты — end-to-end. Только между двумя устройствами. Не синхронизируются между девайсами, нельзя сделать форвард, нельзя сделать скриншот в Android (но можно в iOS). В группах секретных чатов нет.
Что это значит для голосовых:
- В большинстве случаев вы используете обычный чат или группу — ваше ГС теоретически доступно Telegram-серверам.
- Telegram не продаёт данные третьим лицам и не использует для рекламы — это часть продуктового позиционирования. Но это обещание, не криптография.
- В РФ Telegram не состоит в реестре ОРИ (после возвращения в 2020 без блокировок), но ситуация может меняться. На апрель 2026 года mass-data запросы РФ-госорганов к Telegram не выполняются (по публичным заявлениям Дурова).
- Если ваше дело реально критично (журналистика, госбезопасность, корпоративные секреты) — используйте Signal или секретные чаты Telegram, не обычные.
Облачные сервисы расшифровки: что они делают с аудио
Otter.ai, Rev, Trint, Sonix, Descript — популярные международные сервисы. Все они работают по похожей схеме:
- Вы загружаете аудио на их сервер (через web или приложение).
- Сервер обрабатывает через свою ML-модель.
- Возвращает текст. Аудио и текст хранятся в вашем аккаунте.
- Доступ — по логину/паролю или OAuth.
Что важно знать:
- Otter.ai — по privacy policy 2025 года: аудио и транскрипты хранятся пока вы их не удалите. На бесплатном тарифе данные могут использоваться для улучшения моделей (с возможностью отказаться в настройках). Серверы — США.
- Rev — человеческая транскрипция (живые операторы читают ваше аудио). Серверы — США. Требуется NDA с каждым оператором, но это не криптографическая гарантия.
- Trint — enterprise-фокус, есть SOC 2 Type II сертификация. Хранение в EU/UK по желанию. Дороже, но для серьёзного B2B — вариант.
- Sonix, Descript — используют ML, не людей. Хранят пока вы не удалите. Есть платные планы с «не тренируем на ваших данных».
Главный риск облачных сервисов — не то, что они «продают данные» (это редко), а то, что:
- Аудио лежит на их инфраструктуре до тех пор, пока вы его не удалите. Вы это часто забываете.
- В случае взлома сервиса (а это случается — см. утечки 2023–2025) ваши записи попадают наружу.
- Серверы в США попадают под Cloud Act: требование от властей США выдать данные, даже если вы не американец. Российскому юристу или корпоративу это — риск.
Локальная запись + локальная расшифровка
Если ваш сценарий критичен — записывайте на диктофон без интернета, расшифровывайте на своём устройстве:
- Voice Memos на iPhone 15 Pro+ с iOS 18 — транскрипция оффлайн, аудио и текст никуда не уходят (если вы не включили iCloud sync для Voice Memos).
- Pixel Recorder на Pixel — то же самое: оффлайн, локально, не уходит в Google.
- Whisper на своём ноутбуке — скачали модель (open-source), запустили через whisper.cpp или mlx-whisper, обработали файл локально. 100% контроль, ничего не уходит. Минусы — нужен ноутбук с нормальным GPU, скорость в разы ниже облачной.
Это золотой стандарт privacy. Но рабочая нагрузка такова, что 99% повседневных задач он покрывает с трудом: на часовое интервью средний MacBook потратит 5–10 минут, не каждый готов ждать.
@vtekst_ai_bot: что именно происходит с вашим аудио
Прямые факты — что происходит с вашим аудио и текстом:
Что это значит на практике:
- Через 24 часа после расшифровки вашего ГС в нашей базе нет ни текста, ни аудио, ни саммари.
- Если кто-то взломает наш сервер сегодня — в буфере будут только последние 24 часа транскриптов. Не «вся ваша история за год».
- Если приходит запрос «выдайте все ГС пользователя X» — у нас просто нет, что выдавать.
Это не значит «без минусов»: данные всё-таки проходят через сервер при обработке. Если ваш сценарий «государственная тайна» — используйте локальный Whisper на своём ноутбуке. Для всего остального (бизнес, юридическая работа, личные ГС) — наш подход к приватности сравним или строже большинства облачных конкурентов.
Чек-лист — на что смотреть в любом сервисе расшифровки
Используете другой сервис — проверьте по списку:
- Сколько хранится аудио — ищите в privacy policy фразу «retention». Хорошо — до часов или до удаления. Плохо — «indefinite» или «for service improvement».
- Используется ли для обучения моделей — ищите «training», «model improvement». Хорошо — явный opt-out или «we do not train». Плохо — «we may use your data to improve our models».
- Где физически серверы — US, EU, RF, другое. Влияет на то, чьи законы применимы (GDPR, Cloud Act, ФЗ-152).
- Есть ли удаление по запросу — должен быть явный механизм «delete all my data». GDPR требует, но только для EU-резидентов.
- Кто читает аудио — только ML, или также живые транскрайберы (Rev, GoTranscript). Живые — это +50 человек NDA с разной мотивацией.
- Сертификации — SOC 2, ISO 27001, GDPR-compliance. Это не гарантия, но показатель серьёзности.
- Что в Terms of Service — ищете пункты «we may share with», «affiliated companies», «law enforcement requests». Это — реальная политика, не маркетинговый посыл.
Полная документация — в политике конфиденциальности: что хранится, как долго, какие меры защиты применяются.
Попробовать @vtekst_ai_botПрактические правила для разных сценариев
Частые вопросы
А как насчёт ChatGPT или Claude?
Если вы загружаете аудио в ChatGPT Plus или Claude через интерфейс — ваше аудио уходит на серверы Anthropic / OpenAI, по их политике используется или нет для обучения (зависит от тарифа и настроек). Серверы — США. Российскому юристу или корпоративу — это риск Cloud Act и санкционных ограничений.
Telegram-бот безопаснее, чем веб-сервис?
Сам по себе — нет. Бот — это просто другой интерфейс к тому же сервису. Что важно — что внутри (как обращается с файлом, где хранит, как удаляет). Для @vtekst_ai_bot это описано выше; для других ботов — спрашивайте у разработчиков.
А нельзя ли просто всё шифровать на стороне клиента?
Можно, но тогда сервер не сможет расшифровать аудио для Whisper — шифрование защищает от перехвата по дороге, не от «сервиса, которому вы это аудио и собирались дать обработать». Это фундаментальное ограничение любой ML-расшифровки в облаке.
Что с ФЗ-152 (персональные данные) для российского пользователя?
Если ваше ГС содержит ПД третьих лиц (упоминаете имя клиента, диагноз, паспортные данные), и вы пересылаете в сервис расшифровки — формально вы становитесь оператором ПД, а сервис — обработчиком. По ФЗ-152 нужен договор с обработчиком и согласие субъекта ПД. На практике это редко выполняется, но в корпоративном контексте может стать вопросом.
В чём опасность «обучения на ваших данных»?
Не в том, что Алексей из OpenAI прочитает ваше ГС. А в том, что фрагменты вашего текста могут стать частью весов модели и при определённых промптах «всплывать» у других пользователей. Это редкий, но документированный риск (см. исследования по membership inference attacks). Поэтому в business-critical сценариях используют сервисы с явным no-train flag.
Если я удалю чат с ботом — расшифровки удалятся?
На вашей стороне — да, в Telegram. На нашей — текст уже занулён cron'ом через 24 часа, метаданные обезличиваются (привязка к chat_id остаётся, но без содержимого).
Privacy без компромиссов
@vtekst_ai_bot — расшифровка с удалением аудио после обработки и удалением текста через 24 часа. Российская инфраструктура, прозрачные правила, проверяемые гарантии.
Попробовать @vtekst_ai_bot