http://ximaera.livejournal.com/ ([identity profile] ximaera.livejournal.com) wrote in [personal profile] dastapov 2012-07-04 06:35 pm (UTC)

Ну так я же и пишу:

1> На основе некоей выборки (например, пара десятков террористов,
1> уже вычисленных ранее путём агентурной работы) составляем взвешенное
1> множество
слов, часто употребляемых в разговоре террористами и редко
1> -- обычными гражданами. Разрабатываем систему штрафов и определяем
1> для каждого абонента порог

2> Главный вопрос тут вообще не в человеческих ресурсах, а в выборке.
2> Ибо всё это зиждется на предположении, что вообще есть такая выборка
2> ключевых слов, по частоте употребления которых можно найти
2> потенциальных террористов. В этом я сильно не уверен.

Само собой, что, если мы будем искать разговоры по одному отдельному слову, то мы поймаем огромное число ложных срабатываний. Но, если смотреть на историю, то, может быть, и поймается что-нибудь.

И, само собой, это не проект готового решения, которое можно завтра проинтегрировать и уже послезавтра пачками ловить Рулонов Обоевых. Это тема для длительного исследования. Мне просто кажется, что подобное исследование уже на текущем уровне развития алгоритмов распознавания речи может иметь смысл.

Кроме того, учитывая сам факт того, что вы читаете данный журнал и понимаете, о чём тут идёт речь, можно сделать вывод о том, что те переговоры, которые вы периодически ведёте по телефону, отличаются от переговоров, которые ведёт большинство населения. Т. е. да, кроме террористов, мы сразу же поймаем ещё и уйму гиков, леперов, двачеров и прочая и прочая, но насколько велик будет процент ложных срабатываний -- наобум сказать сложно, и мой уважаемый собеседник -- ни в коем случае не показатель, по которому можно судить.

Post a comment in response:

If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting