Вероятность того, что между апдейтами будет это число дней
Теперь можно построить функцию вероятности P(t), где t – измеряется в днях.
Далее я работаю только с массивом D[i], т.к. именно в нем вся полезная информация (будем считать, что Яндекс работает одинаково зимой и летом). Первое, что можно сделать – это найти среднее значение D[i]. Оно получилось равным 3.7 дней. Затем, имея среднее, можно вычислить дисперсию – среднее отклонение от среднего. Дисперсия получилась равной 2.57 дней.
Таким образом, я получил массив, в котором записаны промежутки в днях между апдейтами. Тут, конечно, есть неточности, из-за того, что я не стал учитывать то, что в некоторых месяцах 31 день, 2008 год – был високосным, благо, данных много и ошибка будет маленькая.
Первое что я сделал, это данные в формате 23.03.2009 перевел в формат одного числа. Делалось это по формуле 365*год + 30*месяц + день, все это я записываю в массив A[i]. Далее я создаю другой массив D[i], такой, что
Написать эту заметку меня побудила сео блогера Webpavilion в которой он анализирует собранную им статистику апдейтов Яндекса. Он предоставил у себя текстовые файлы с датами апдейтов выдачи и ТИЦ, чем я и воспользовался. Я решил провести статистическое исследование этих данных и сравнить их с известным из статистики пуассоновским распределением случайной величины.
> > Играет ли Яндекс в кости?
Харьков, мысли, фото, новости, музыка и все все все // Безыдейный блог мутного направления // Транспортные фанаты
Комментариев нет:
Отправить комментарий