![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Забавно наблюдать, как люди стартуют с посылки "Кровавый Режим удаленно включает телефон и СЛУШАЕТ", а когда им начинают задавать вопросы, это превращается в "Ну, может и не включает удаленно, но уж точно внедряет в телефон ЧТО-ТО, чтобы он сам потом включался и передавал".
Когда начинаешь интересоваться, как же это может работать, и зачем это нужно, происходит следующее волшебное превращение: "Ну, может он и не передает все подряд, но телефонные разговоры-то точно записывает куда-то на флешку, а потом при удобном случае по интернету сливает куда надо".
В результате мы говорим про запись разговоров, которую Кровавому Режиму в 100 раз проще вести через СОРМ (и не зависить от того, поменяет субъект свой телефонный аппарат на что-то другое или нет, например). Но теория заговора производителей телефонов и спецслужб гораздо интереснее и привлекательнее. Это же прямо как фильм про Бонда - брутальный агент Кровавого Режима знает 100500 способов удаленного внедрения в firmware любого телефона закладки, которая будет заниматся зверским шпионажем.
Когда начинаешь интересоваться, как же это может работать, и зачем это нужно, происходит следующее волшебное превращение: "Ну, может он и не передает все подряд, но телефонные разговоры-то точно записывает куда-то на флешку, а потом при удобном случае по интернету сливает куда надо".
В результате мы говорим про запись разговоров, которую Кровавому Режиму в 100 раз проще вести через СОРМ (и не зависить от того, поменяет субъект свой телефонный аппарат на что-то другое или нет, например). Но теория заговора производителей телефонов и спецслужб гораздо интереснее и привлекательнее. Это же прямо как фильм про Бонда - брутальный агент Кровавого Режима знает 100500 способов удаленного внедрения в firmware любого телефона закладки, которая будет заниматся зверским шпионажем.
(no subject)
Date: 2012-07-04 06:01 pm (UTC)"Химию подготовил? Завтра в 6, до занятий, подходи к универу" — а это вообще звучит не как страдания студента, а как жуткий террористический заговор.
(no subject)
Date: 2012-07-04 06:05 pm (UTC)(no subject)
Date: 2012-07-04 06:07 pm (UTC)(no subject)
Date: 2012-07-04 06:35 pm (UTC)1> На основе некоей выборки (например, пара десятков террористов,
1> уже вычисленных ранее путём агентурной работы) составляем взвешенное
1> множество слов, часто употребляемых в разговоре террористами и редко
1> -- обычными гражданами. Разрабатываем систему штрафов и определяем
1> для каждого абонента порог
2> Главный вопрос тут вообще не в человеческих ресурсах, а в выборке.
2> Ибо всё это зиждется на предположении, что вообще есть такая выборка
2> ключевых слов, по частоте употребления которых можно найти
2> потенциальных террористов. В этом я сильно не уверен.
Само собой, что, если мы будем искать разговоры по одному отдельному слову, то мы поймаем огромное число ложных срабатываний. Но, если смотреть на историю, то, может быть, и поймается что-нибудь.
И, само собой, это не проект готового решения, которое можно завтра проинтегрировать и уже послезавтра пачками ловить Рулонов Обоевых. Это тема для длительного исследования. Мне просто кажется, что подобное исследование уже на текущем уровне развития алгоритмов распознавания речи может иметь смысл.
Кроме того, учитывая сам факт того, что вы читаете данный журнал и понимаете, о чём тут идёт речь, можно сделать вывод о том, что те переговоры, которые вы периодически ведёте по телефону, отличаются от переговоров, которые ведёт большинство населения. Т. е. да, кроме террористов, мы сразу же поймаем ещё и уйму гиков, леперов, двачеров и прочая и прочая, но насколько велик будет процент ложных срабатываний -- наобум сказать сложно, и мой уважаемый собеседник -- ни в коем случае не показатель, по которому можно судить.
(no subject)
Date: 2012-07-04 07:07 pm (UTC)> развития алгоритмов распознавания речи может иметь смысл.
Возможно. Но боюсь, что оно будет уж слишком междисциплинарным — а значит, чтобы получить от него практическую пользу, слишком много ресурсов придётся затратить просто для его организации. Тут и распознавание речи, и весьма специфическая психология (чтобы иметь хоть что-то для начала обучения системы; «люди, склонные скрывать настоящий смысл фраз и говорить эвфемизмами, обычно говорят так»), тут и практическая информация от спецслужб («а C-4 в Бангладеже и Северной Индии сейчас называют глиной» — опять же, для «засева» алгоритмов самообучения), и алгоритмы data mining-а... Ибо пока, если думать об этом только на уровне технологий (наподобие взвешенных множеств, Байеса и т.п.) это не выглядит вообще хоть как-то способным отфильтровать одного террориста от двухсот тысяч каунтерстрайкеров и пейнтболльщиков.
> Кроме того, учитывая сам факт того, что вы читаете данный журнал и
> понимаете, о чём тут идёт речь, можно сделать вывод о том, что те
> переговоры, которые вы периодически ведёте по телефону, отличаются
> от переговоров, которые ведёт большинство населения.
Типа, «вызываю огонь на себя» — поддели, спасибо :)
(no subject)
Date: 2012-07-08 09:35 pm (UTC)А для среднего оператора 20-30 миллионов разговоров в час - вовсе не проблема.
При таком "качестве" отбора мы каждый час будем иметь 20 тысяч разговоров, которые надо кому-то прослушать, и отметить. Это ну совсем никак нереально.