dastapov: (Default)
Dmitry Astapov ([personal profile] dastapov) wrote2012-05-18 08:25 pm
Entry tags:

Еще раз про запись всех разговоров

В комментариях к соседней записи опять стала муссироваться тема записи всех звонков без разбора, и мне захотелось сделать короткое резюме.

Для начала текущее положение вещей

Все известные мне законы (я в курсе про Россию-Украину, Евросоюз, UK, страны Балтии) обязывают операторов делать ровно две вещи:

* Хранить (много лет) и предоставлять метаданные о разговорах (кто кому когда звонил)
* По решению суда/прокуратуры записывать разговоры конкретного абонента или предоставлять техническую возможность вести такую запись с момента поступления к ним такого предписания. Список тех, кого слушают, "не резиновый" - нельзя взять и, грубо говоря, запихнуть туда все номера всех абонентов.

Записи разговоров и тексты СМС операторы сохранять не обязаны.

А если все же обяжут?

Если вдруг эти требования ужесточатся, оператору будет:
(1) Достаточно легко начать хранить тексты СМС. Так как SMS-центров мало, они расположены централизовано, SMS мелкий - возможно даже меньше, чем объем метаданных о том, кто кому и как его послал)
(2) Не очень легко начать хранить записи всех разговоров. Так как объемы солидные, коммутаторов много, они могут быть территориально разнесены, потребуется их апгрейд, плюс возможно понадобится пост-процессинг - в процессе разговоров звонки могут "кочевать" по узлам сети, и каждый отдельно взятый коммутатор может "слышать" только часть разговора. Плюс, если вдуматься, у оператора существующая базовая сеть рассчитана на определенную нагрузку. Если начать, грубо говоря, передавать тот же объем данных дважды (пусть и без жестких realtime-требований), то потребуется либо доп. каналы связи (чтобы сразу передавать куда-то в центр и там обрабатывать), либо процессорные мощности и каналы связи (жмем в mp3, а уже потом передаем), или какие-то другие инженерные решения. Естественно, это все решаемые проблемы. Все, что я хочу сказать - задача не сводится к "поставили винт побольше, и всего делов", как это многим кажется на первый взгляд.

А вдруг оператор сам ...?

А вдруг оператор сам хранит эти данные для каких-то своих нужд, и это делается для всех абонентов без разбора?

(3) Это справедливо в отношении метаданных - по ним производится биллинг, то есть определяется объем потребленных услуг и выставляются счета.
(4) Это может быть справедливо для СМС: они могут попадать в какие-то логи на SMS-центре, быть частью бэкапов, и т.п.
* Хранить записи всех разговоров оператору никакой необходимости нет
(5) При этом я вполне допускаю, что в процессе разбирательств с какой-то проблемой оператор вполне может выборочно сохранять как СМС-ы, так и звонки - но, скорее всего, критерием выборки будет не "для вот этих абонентов", а "для вот этого оборудования".

А вдруг все-таки оператор это делает?

Пофантазируем. Может ли все-таки получится, что оператор сохраняет все записи всех звонков? Может, он из этого извлекает какую-то выгоду? Честно говоря, как я ни старался, я не смог придумать подходящего сценария кроме "группа сотрудников вступила в сговор и продает данные криминальным элементам".

Ок, насколько это реально? Проблема в том, что сначала надо эти звонки где-то сохранять. Сделать это "на вот этом сервере вот тут в закутке" - не выйдет, не те объемы (если сохранять всё). Купить для этого отдельно железо - не выйдет, по понятным причинам. Да и потом, технически проще "торговать налево" чем-то, что имеет альтернативное легитимное применение - помогать спаммерам рассылать SMS, занижать суммы счетов, торговать распечатками метаданных или кодами пополнений баланса. И то, для этого, по моим прикидкам, потребуется соучастие не двух, и не пяти и даже не десяти человек в самых разных подразделениях, и подобная затея имеет очень большие шансы на провал даже при том, что можно попытаться сделать хорошую мину при плохой игре ("да мы тут просто ... это ... тестируем ...."). А большой склад записей звонков - это чистый криминал, никаких альтернативных объяснений ему быть не может, и любой безопасник с радостью съест всех замешанных без соли и перца.

А вот моего друга кума говорила, что ей показывали распечатки или записи звонков за 2006 год ...

У меня есть два гораздо более простых (по сравнению с "оператор пишет все") объяснения этому факту. Куму прослушивали в рамках оперативных мероприятий (см. выше), или же ее собеседника прослушивали точно таким же образом.

Для удобства восприятия информация сведена в табличку

Метаданные о звонке (кто, кому, когда, как долго, в какой соте, ...)Тексты СМСЗапись разговоров
Обязывает ли закон операторов хранить и предоставлять эти данные для всех абонентов?ДаНетНет
Если оператора обяжут, легко ли ему будет хранить эти данные в полном объеме?--Да(1)Нет(2)
Обязывает ли закон осуществлять выборочную запись этих данных (по предписанию прокуратуры, ...)--ДаДа
Хранит ли оператор такие данные для всех абонентов независимо от требований закона?Да(3)Возможно(4)Нет
Хранит ли оператор такие данные выборочно?--Возможно(5)Возможно(5)



[identity profile] auto194419.livejournal.com 2012-05-18 08:22 pm (UTC)(link)
"слушать всё" (но не записывать) можно для организации таргетированного спама SMS"ами :)

[identity profile] http://users.livejournal.com/_adept_/ 2012-05-18 08:24 pm (UTC)(link)
Я ни разу не специалист, но разве не проще тупо спамить нетаргетировано? :)

[identity profile] balmerdx.livejournal.com 2012-05-18 08:26 pm (UTC)(link)
Дороговато выходит.

[identity profile] dfaw.livejournal.com 2012-05-18 08:40 pm (UTC)(link)
SMS разве не сохраняются по умолчанию вместе с метаданными?

[identity profile] http://users.livejournal.com/_adept_/ 2012-05-18 09:33 pm (UTC)(link)
Нет, вовсе нет.

[identity profile] dfaw.livejournal.com 2012-05-18 09:35 pm (UTC)(link)
Тогда правильно будет сказать не у всех операторов.
wizzard: (Default)

[personal profile] wizzard 2012-05-18 09:37 pm (UTC)(link)
AMR-WB 12.65 kbps- 5.5 мбайт в час.

20м абонентов по полчаса в сутки = 60 тб/сутки.

Учитывая, что реалтайм не нужен, и особые требования к надежности - тоже, можно хранить на каждой соте или каком-то роутинг-узле rolling log, скажем, на 5-10 тб обьемом, длительностью суммарно по всем таким узлам выйдет где-то от нескольких суток до месяца.

Стоимость, по сравнению с остальными узлами - минимальна - можно даже эти данные никуда не передавать, пока люди в погонах или кто-то еще не попросят ("записи за вчерашний день"), а для них - гонять запрос параллельно на всех узлах.

Так что, по-моему, вполне реально. Но в нынешних реалиях намного проще и беспалевнее троянить смартфоны, чем отдельные товарищи (вроде CarrierIQ) успешно и занимаются.

[identity profile] http://users.livejournal.com/_adept_/ 2012-05-18 09:40 pm (UTC)(link)
Не у всех операторов сохраняются, или не у всех операторов по умолчанию, или ...?

[identity profile] http://users.livejournal.com/_adept_/ 2012-05-18 09:43 pm (UTC)(link)
А мотивация-то в чем? Кто внутри оператора инициирует такой проект, почему его не пошлет его начальник, и какой от этого будет профит? Как этот проект CEO будет представлять совету директоров или другим каким инвесторам?

[identity profile] dfaw.livejournal.com 2012-05-18 09:43 pm (UTC)(link)
У некоторых операторов SMS сохраняются по умолчанию.

[identity profile] http://users.livejournal.com/_adept_/ 2012-05-18 09:47 pm (UTC)(link)
Мне иногда кажется, что в нынешних реалиях проще сказать "Пришли записи своих разговоров за прошлую неделю и получи бесплатную корову в Farmville", и все, только успевай разгребать :)
wizzard: (Default)

[personal profile] wizzard 2012-05-18 09:52 pm (UTC)(link)
Это да :)
wizzard: (Default)

[personal profile] wizzard 2012-05-18 09:54 pm (UTC)(link)
Для того, чтобы аргументированно ответить на этот вопрос, надо поработать либо у оператора, либо у потенциальных заказчиков такого проекта. У меня такого опыта пока нету

Но даже если дописать к бюджету нолик, то это все равно вкладывается в суммы, выделяемые украинским спецслужбам. Штатам, соответственно, можно приписать три нолика к выделенным деньгам и один нолик к количеству абонентов :)

[identity profile] dtr.myid.net (from livejournal.com) 2012-05-19 12:05 am (UTC)(link)
зависит от реализации смс центра.
Допустим смс центр "Беркут" хранит тексты смс в БД и постоянно с этой БД работает. это накладывает серьезные ограничения по производительности + тугая масштабируемость. Зато после ребута всей платформы недоставленные смс снова попытаются доставиться. Несмотря на то, что смс само по себе со всеми данными запросто укладывается в пару-тройку сотен байт - разумных объемов дисковый массив сможет хранить дни, но никак не месяцы истории смсок. Собственно на моей работе от этого смс центра отказались.
Сейчас смс центр Acision - смс хранит только в оперативной памяти и принявшая нода занимается доставкой, то есть практически никакой связи между нодами. Это очень хорошо масштабируется, но текст смс с центра не получить, т.к. он умирает в ram сразу после доставки смс. Дистовый массив используется только для сохранения cdr.

[identity profile] dezelent.livejournal.com 2012-05-19 01:31 am (UTC)(link)
вот честно, 3.5 года занималась непосредственным обслуживанием ммс&sms&ussd платформ и сопутствующих сервисов. Вот так просто, взять и начать писать смс, это первое - куда их писать, второе - надо заказывать вендору новые фичи смсц, с тем, что бы он начал писать эти самые смс, нужно что бы вендор это написал, внедрил, и оно прошло тесты и ушло в продакшн, а еще надо прикрыть чем-то попу на новый год, когда нагрузка в течении 5 минут взлетает в 10 и более раз. И это очень не малые деньги, время и силы нескольких десятков специалистов на разных уровнях. Операторы, так просто, при текущей ситуации вкладывать бабло(крупное) не будут. Оно им не надо. Единственный вариант - лобби со стороны вендоров(но по той же украине, насколько я понимаю, их как минимум два у Life один, у mts&ks другой), и этим вендорам заниматься такой фигней так же я думаю не очень надо...
мне все еще интересно, ради кого были придумки с белыми списками IMEI , которые, так и не вошли в продакшн на украине, но при этом операторы насколько я понимаю, выложили по несколько миллионов вечнозеленых енотов.

[identity profile] dezelent.livejournal.com 2012-05-19 01:32 am (UTC)(link)
такие проекты, валят только сверху, и никак иначе. это вам не придумка с оплатой деливери репортов за ммс.

[identity profile] dezelent.livejournal.com 2012-05-19 01:35 am (UTC)(link)
а зачем ребутить смсц? Это ж не винда..
ну вот и у нас хранились лишь недоставленные, а как доставлялись или срок жизни истекал, так им сразу секирбашка демон и делал.
а хранить все.. так никаких винтов не напасешься..

[identity profile] dezelent.livejournal.com 2012-05-19 01:36 am (UTC)(link)
а кто должен писать разговоры, какая из существующих платформ на пути звонка это умеет делать? ну так, что бы массово.

[identity profile] dezelent.livejournal.com 2012-05-19 01:38 am (UTC)(link)
ну и главное, если кто-то обязывает хранить нечто подобное, то они приписывают сколько лет хранить, а как только появляется нечто, что надо сто процентов хранить - то тут уже появляется такая штука как степень надежности хранения, а она дофига стоит, если это для органов. те же cdr.. очень дорого оно все..

[identity profile] dezelent.livejournal.com 2012-05-19 01:40 am (UTC)(link)
"gsm в amr-wb перегнать налету не сильно-то большие процессорные мощности нужны. "
а если на новый год? :)

[identity profile] dezelent.livejournal.com 2012-05-19 01:42 am (UTC)(link)
" я вчера такие туфли купила - бомба!"
ну и так далее...
"машенька, ты не поверишь, он настоящий террорист, попросил выкуп вчера, стриптиз!"

[identity profile] pif.livejournal.com 2012-05-19 03:09 am (UTC)(link)
Классики называли это экспроприацией экспроприаторов :)
Обычно используется один из следующих способов:
1. Что-нибудь коммерчески провальное судорожно "перепиливается" в "общественно-полезное" (например - "чтобы мобильники меньше воровали") и законодательно навязывается под одобрительные крики благодарного населения.
2. Можно пропустить стадию "перепиливания", просто обязать делать что-нибудь заведомо неисполнимое, мотивируя например "защитой прав потребителей" и "штрафовать" за злостное неисполнение.

[identity profile] kray-zemli.livejournal.com 2012-05-19 05:58 am (UTC)(link)
А как же запись разговора по ключевым словам? Вы же не скажете, что это городская легенда? Подвыпитый телефонист как-то мне рассказывал о "секретной" комнате ещё аналогового узла связи, набитого магнитофонами от пола до потолка. Правда, там речь шла о ведомственной АТС НПО "Вектор".

[identity profile] volodymir-k.livejournal.com 2012-05-19 07:49 am (UTC)(link)
Таргетированно раз в 10-100 эффективнее.

[identity profile] jonni.livejournal.com 2012-05-19 08:13 am (UTC)(link)
По-моему частота употребления слов "бомба" и "теракт" в разговорах двух домохозяек сильно выше, чем в разговоре ждвух террористов.

;)

Page 1 of 4