Ложь, большая ложь, и статистика
2006-09-19 11:08 amНавеяно вот этим комментарием.
Базовые станции сети GSM умеют регистрировать кол-во необслуженных исходящих вызовов. Правда, это не означает, что человек не смог позвонить. Почти наверняка его вызов был обслужен соседней, менее загруженной сотой. И только если все шесть сот из хранимого в телефоне "списка соседей" не смогли обслужить вызов, то человек получает сообшение "network busy".
Но если не задумываться о том, как работает сеть GSM, можно прийти к неправильным выводам ...
В один прекрасный день некто собирает суммарную статистику по общему кол-ву "необслуженных" звонков в сети оператора К. И приходит в ужас. И идет к руководству: так мол и так, на каждых три обслуженых вызова у нас один необслуженный. Надо расширять сеть, увеличивать мощности - иначе будем продолжать терять деньги. Руководство проникается и поручает планирующим подразделениям увеличить планы по развитию сетей вдвое. Планирующие подразделения отвечают, что в этом нет нужды - утилизация ресурсов сети не превышает 80%, запас ого-го еще какой.
Да вот же! - говорит им руководство - вот же все посчитано. Недополученная прибыль в ужасающих размерах.
Пока руководство успокоили - извели столько электронов на email-ы, что хватило бы новый windows написать.
Ладно, - говорит руководство - раз вы такие умные, то посчитайте, сколько из этих якобы-необслуженных звонков было действительно необслужено.
И снова закрутилась email-овая круговерть....
Мораль: сапоги должен тачать сапожник.
Базовые станции сети GSM умеют регистрировать кол-во необслуженных исходящих вызовов. Правда, это не означает, что человек не смог позвонить. Почти наверняка его вызов был обслужен соседней, менее загруженной сотой. И только если все шесть сот из хранимого в телефоне "списка соседей" не смогли обслужить вызов, то человек получает сообшение "network busy".
Но если не задумываться о том, как работает сеть GSM, можно прийти к неправильным выводам ...
В один прекрасный день некто собирает суммарную статистику по общему кол-ву "необслуженных" звонков в сети оператора К. И приходит в ужас. И идет к руководству: так мол и так, на каждых три обслуженых вызова у нас один необслуженный. Надо расширять сеть, увеличивать мощности - иначе будем продолжать терять деньги. Руководство проникается и поручает планирующим подразделениям увеличить планы по развитию сетей вдвое. Планирующие подразделения отвечают, что в этом нет нужды - утилизация ресурсов сети не превышает 80%, запас ого-го еще какой.
Да вот же! - говорит им руководство - вот же все посчитано. Недополученная прибыль в ужасающих размерах.
Пока руководство успокоили - извели столько электронов на email-ы, что хватило бы новый windows написать.
Ладно, - говорит руководство - раз вы такие умные, то посчитайте, сколько из этих якобы-необслуженных звонков было действительно необслужено.
И снова закрутилась email-овая круговерть....
Мораль: сапоги должен тачать сапожник.
(no subject)
Date: 2006-09-19 08:25 am (UTC)Вроде бы, ещё шесть во втором диапазоне (если они есть)?
(no subject)
Date: 2006-09-19 08:39 am (UTC)(no subject)
Date: 2006-09-19 08:48 am (UTC)(no subject)
Date: 2006-09-19 10:45 am (UTC)Вся литература по dual-band сетям, которая у меня есть, говорит о том, что neighbor list, в рамках которого происходят cell handover-ы, состоит из шести позиций.
(no subject)
Date: 2006-09-23 04:07 am (UTC)Можно вокруг формулок каких-нибудь наплести для солидности.
(no subject)
Date: 2006-09-23 10:10 am (UTC)Оценка могла бы быть при наличии разреза по географическому расположению и времени отказов. А статистика, как я понимаю, только на количество.
(no subject)
Date: 2006-09-24 09:24 am (UTC)достаточно списка вызовов с тайм-стампом и кодом успешности.
если в пределах К секунд все вызовы с номера А на номер Б были обломаны по причине перегруза сети -- то вот тебе и жопа.
вот может конечно сота не умеет такую детальную информацию хранить или отдовать...
(no subject)
Date: 2006-09-24 10:41 am (UTC)А так да. Но, как я понял, хранится только количество :)
(no subject)
Date: 2006-09-24 01:58 pm (UTC)Тебя могут:
1)в будущем попросить обосновать оценку перед кем-то, кто разобрался глубже
2)спросить, что надо сделать, чтобы оценка уменьшилась-увеличилась
3)поставить оценку в критерий качества кому-то, кто разберется и надерет тебе зад
....
(no subject)
Date: 2006-09-24 02:01 pm (UTC)По данным с одной соты то, что ты предлагаешь, сделать невозможно.
(no subject)
Date: 2006-09-24 02:12 pm (UTC)кстати, со всех коммутаторов и не надо. по каждому коммутатору отдельно все обрабатывать можно -- я не думаю что возможна ситуация с перебором сот от разных сетей для совершения звонка, а одну сеть обслуживает сейчас вроде как только один коммутатор.
дорого? а чего дорогого-то? оборудование менять надо? потому как обработка тупая, простая и тривиальная.
(no subject)
Date: 2006-09-24 03:00 pm (UTC)После таких громких заявлений как-то даже пропадает желание комментировать по сути cказаного.
Увы, реальная ситуация далека от обрисованого в твоем посте сферического коня в вакууме.
(no subject)
Date: 2006-09-24 03:06 pm (UTC)(no subject)
Date: 2006-09-24 08:04 pm (UTC)Сеть современного оператора - это от нескольких _десятков_ коммутаторов. Каждый из которых обслуживает с десяток или больше контроллеров базовых, а каждый из них - несколько (десятков) базовых. Чтобы узнать, смог ли абонент А дозвониться абоненту В в период времени с t1 по t2 надо таки собрать все данные со всех контроллеров всех коммутаторов. И как-то их сопоставить (по времени и по номерам телефонов). И проанализировать. Желательно - объективно, а не субъективно.
А современный коммутатор обслуживает от 1 млн до 3 млн _успешных_ попыток вызова в час. Считаем, умножаем, и получается, что "мерять среднюю температуру по больнице" (траффик в эрлангах и в kBhca (или как там они?)) не в пример легче, а результат - примерно такой же.
(no subject)
Date: 2006-09-24 08:11 pm (UTC)(no subject)
Date: 2006-09-24 08:35 pm (UTC)мы похоже разное под сетью понимаем. для меня сеть мегафона в спб и сеть мегафона в москве -- разные сети. или сеть мегафона в спб обслуживает несколько десятков коммутаторов?
так я же объясняю -- это очень просто. сортируем лог по ключу основному (A, B) и дополнительному (время попытки), оставшееся поле -- код статуса (успешно, отказ нашей сети, отказ удаленной/транзитной сети, занят, не отвечает и прочее). Если в пределах дельты Т (секунда? две? три? сколько по стандарту межет занять перебор сот? но не очень долго, что бы не перепутать с повторным нажатием на кнопку) только отказы нашей сети -- можно защитывать неудавшуюся попытку. На такую обработку 3 миллионов записей вряд ли уйдет больше одной минуты. Результат может примерно и такой, но в данном случае он выдает точный ответ на заданный вопрос. Другой вопрос, что может это и нафиг никому не сдалось...
(no subject)
Date: 2006-09-25 05:20 am (UTC)Чтобы не путать тебя, будем пользоваться твоей терминологией и работать в рамках предложеной тобой модели.
Вспомним еще раз задачу - оценить кол-во звонков, которые абонент не сумел совершить из-за "проблем с покрытием".
Надо отдельно рассматривать статус "есть радиосвязь/нет радиосвязи/.." и статус времени коммутации (кому звонили, дозвонились ли, ...). Первым статусом заведует контроллер базовых, вторым - коммутатор.
Сразу заметим, что нам абсолютно не интересно, дозвонился ли куда-то абонент А. Может, он просто так пальцами в кнопки тыкал ... Т.е. любой статус времени коммутации говорит о том, что связь у абонента А была. Это первая "ненужность" в твоем подходе. Но для того, чтобы это узнать, надо все равно скоррелировать данные с коммутаторов (всех) с данными с контроллеров базовых (всех).
Почему? Потому, что 6 "соседних" сот могут принадлежать 6 разным контроллерам, и, теоретически, 6 разным коммутаторам. Если же мы скажем, что "таких - 5% от общего числа, давайте пренебрегать", то у нас начинается измерение микрометром для последующего отрубания топором, и с таким же успехом можно что-то мерять в пределах одной соты.
Далее, про "в пределах дельта Т у нас только отказы". Получается, что собрав данные со все сети, нам надо проехать по ним "скользящим окном" и для каждого звонившего абонента посмотреть, чем завершились его попытки. Для этого надо уметь правильно определить, когда они начались, и когда они закончились.
Получается, нам нужна инфраструктура, необходимую для сбора и обработки нескольких десятков гигабайт инфы в час (для ~10 млн абонентов). И хранения получившихся результатов. И ...
Короче, оно того не стоит :)
(no subject)
Date: 2006-09-25 05:21 am (UTC)(no subject)
Date: 2006-09-25 06:22 am (UTC)да? видно они это как-то втихую сделали
точнее есть ли хоть какая-то радиосвязь. абонент в бункере никому не виден и даже попытаться позвонить не может
да, нас интересует только то, что его попытку мы передали за пределы сети. или определили что на такой номер звонить нельзя/невозможно
ну правильно, а без этого статуса у нас не будет разницы с изначальным подходом. если за дельту Т у нас есть такая комутация -- все неудачные попытки игнорируются. без этого статуса их не проигнорироовать
не всех, а только одной сети. не думаю, что есть необходимость корелировать между союой данные от мегафон-спб и мегафон-мск, по техническим причинам (или телефон во время перебора сот может роуминг поменять? не верю)
очень сложно, да? сколько времени по стандарту может занимать перебор базовых станций? это и есть дельта Т. начало -- в момент первой попытки, окончание -- либо через делта Т либо в момент какого-либо отличного от "базовая отказала" статуса.
о нет. за час хорошо если гигабайт получится (11 знаков номер телефона, два раза, статус два знака, три разделителя - итого 25 байт, 0.025 килобайта, при 10 млн вызовов будет 0.3гб логов).
хранить надо еще более компактую выжимку
(no subject)
Date: 2006-09-25 06:34 am (UTC)(no subject)
Date: 2006-09-25 08:47 am (UTC)Потому как ты решаешь сферическую проблему в сферической модели, имеющей с GSM мало точек пересечения. Здравый смысл может быть и говорит, что "должно работать", но на практике - не будет, а даже если и напрячься и довести до ума - то смысла идти таким путем нет.
(no subject)
Date: 2006-10-12 01:06 pm (UTC)(no subject)
Date: 2006-10-12 04:32 pm (UTC)