среда, 6 февраля 2013 г.

распределение пуассона функции

Вероятность того, что между апдейтами будет это число дней

Теперь можно построить функцию вероятности P(t), где t – измеряется в днях.

Далее я работаю только с массивом D[i], т.к. именно в нем вся полезная информация (будем считать, что Яндекс работает одинаково зимой и летом). Первое, что можно сделать – это найти среднее значение D[i]. Оно получилось равным 3.7 дней. Затем, имея среднее, можно вычислить дисперсию – среднее отклонение от среднего. Дисперсия получилась равной 2.57 дней.

Таким образом, я получил массив, в котором записаны промежутки в днях между апдейтами. Тут, конечно, есть неточности, из-за того, что я не стал учитывать то, что в некоторых месяцах 31 день, 2008 год – был високосным, благо, данных много и ошибка будет маленькая.

Первое что я сделал, это данные в формате 23.03.2009 перевел в формат одного числа. Делалось это по формуле 365*год + 30*месяц + день, все это я записываю в массив A[i]. Далее я создаю другой массив D[i], такой, что

Написать эту заметку меня побудила сео блогера Webpavilion в которой он анализирует собранную им статистику апдейтов Яндекса. Он предоставил у себя текстовые файлы с датами апдейтов выдачи и ТИЦ, чем я и воспользовался. Я решил провести статистическое исследование этих данных и сравнить их с известным из статистики пуассоновским распределением случайной величины.

> > Играет ли Яндекс в кости?

Харьков, мысли, фото, новости, музыка и все все все // Безыдейный блог мутного направления // Транспортные фанаты

Комментариев нет:

Отправить комментарий