no subject

Весь текст не влез в комментарий, вот завершение мысли:

Проблемы в использовании современных систем поиска по голосу для "тотальной слежки" две:
1. Ресурсоёмкость. Наша технология, например, работает в 2 раза быстрее реального времени на 1 ядре. Испанцы хвастают, что будто у них в 6 раз быстрее. В любом случае обрабатывать все потоки звука подряд вычислительных ресурсов не напасёшься.
2. Высокий уровень ошибки. Даже более конкретно - большое количество ложных срабатываний. Голос является "поведенческим" биометрическим признаком. В отличие от отпечатков пальцев, радужной оболочки или даже лица, голос имеет огромную внутридикторскую вариативность, потому что он является не столько физиологической характеристикой, сколько навыком. Плюс серьёзные потери качества в микрофонах, усилителях и кодеках. Есть шанс "узнать" не человека, а его мобильник - настолько он может искажать характеристики сигнала. Лучшие образцы алгоритмов дают в идеальных лабораторных условиях 5% EER (equal error rate - равный уровень ошибки, при котором вероятность пропустить цель равна вероятности захватить чужого). Это обозначает, что если искать среди 100 образцов, рассчитывая пропустить цель не более чем в 5% случаев, мы будем получать список из 5 "подозреваемых". При поиске по 100000 образцов мы получим 5000 "подозреваемых". И что вы с ними будете делать? "Выкручиваем" порог принятия решения на 0.01%, пропускаем цель больше, чем в половине случаев, и всё равно получаем 50 "подозреваемых" из любого поиска.

Так что такие технологии могут использоваться только очень "адресно". Они действительно помогают одному оператору прослушивать не 2, а 10 каналов, но всё равно и компьютеров нужно много, и людей для обработки результатов - порядочно. Не надо думать, что кому-то в спецслужбах больше не на что потратить свои ресурсы, кроме как прослушивать кого попало вроде конспирологов-любителей. Им вполне достаточно организованной преступности, которую нужно прослушивать и обрабатывать.

Сейчас есть только 1 сценарий, ради которого роботы будут нас прослушивать на самом деле в массовом порядке в ближайшее время. В наших разговорах будут искать ключевые слова, чтобы потом вместо гудков воспроизводить контекстную рекламу по темам, на которые мы говорили. Точно так же, как gmail читает наши письма. Но это совсем другой сценарий, даже и не знаю, заинтересуются ли им конспирологи? :)

(46 comments)

no subject

Post a comment in response: