Анализ посещаемости сайта
в период зимней сессии 2008/09 года.


В этой статье я хочу поделиться теми результатами, которые были получены из анализа статистики посещений сайта в Интернет, который проводился с технической и временной точек зрения. Технический аспект позволяет определить требования к  сайту, как Интернет-ресурсу с учетом его группы пользователей. Временной аспект, а именно семестр, сессия и каникулы - позволяет  определить загрузку сайта, регулярность и интенсивность работы студентов по тем или иным дисциплинам. Анализ выполнен на базе осеннего семестра 2008 года и сессии января 2009 года.

В этом семестре я вел три потока студентов совершено различных специальностей:
Ø поток студентов-экономистов 2 курса - предмет ”Информатика” (~100 человек),
Ø поток информационщиков 3 курса -  ”Представление знаний в ИС” (~25 человек),
Ø поток информационщиков 4 курса -  ”Информационные сети” (~25 человек).

Таким образом,общее количество обучаемых студентов было около 150 человек и все они ориентировалис на работу с моим сайтом. Это было связано с принятой мною в этом семестре методикой, когда все лекции читались на базе презентаций, что позволяло не только наглядно представить информацию, но и увеличить ее объем в каждой из лекций. Данный подход не позволял студентам вести достаточно полные тетрадные конспекты, но при этом полные конспекты и презентации по каждой лекции им были доступны через Интернет. Они могли их просматривать или копировать  на свой компьютер и использовать их при подготовке к экзаменам.

Анализ статистики посещений сайта начнем с момента окончания сессии и всех дополнительных пересдач, то есть с недели каникул. Так как сайт общедоступен в Интернете, то это означает, что его пользователями могут быть не только студенты ЛТА, но и любые пользователи Интернет. Эта статистика нам необходима, чтобы определить фоновую группу пользователей сайта.


География по странам и городам (с 01.02.2009 по 07.02.2009)


Россия  – 21,
Казахстан  – 1,
Узбекистан – 1,
Германия   – 1,
США           - 1
Санкт-Петербург – 11,
Москва                – 3,
Владивосток        – 2,
Мурманск            – 1,
Новосибирск        - 1,
Смоленск             - 1,
Краснодар           – 1,
Другие                 - 3

Изприведенных графиков видно, что за первую неделю февраля суммарная группа пользователей из Санкт-Петербурга составила всего 11 человек, то есть менее, чем по 2 человека в день. Но если проанализировать данные за предыдущий месяц, а это был январь 2009 года, то есть сессия, то мы получим совершенно другие данные.


География по странам (с 05.01.2009 по 30.01.2009)


Страна Посетители Хиты Загрузки Хиты/посет. Загрузки/посет.
Россия 251 95,1% 479 95,6% 568 96,1% 1,91 2,26
Германия 3 1,1% 3 0,6% 3 0,5% 1,00 1,00
Украина 2 0,8% 8 1,6% 9 1,5% 4,00 4,50
Европа (не опред.) 2 0,8% 4 0,8% 4 0,7% 2,00 2,00
Другие 6 2,2% 7 1,4% 7 1,2% 1,20 1,20
ВСЕГО В ОТЧЕТЕ: 264 100,0% 501 100,0% 591 100,0%    
В группу другие входят: Беларусь, Франция, Киргизия, Латвия, Норвегия, Швеция.


География по городам (с 05.01.2009 по 30.01.2009)


Город Посетители Хиты Загрузки Хиты/посет. Загрузки/посет.
Санкт-Петербург 201 80,1% 399 83,3% 473 83,3% 1,99 2,35
Москва 13 5,2% 16 3,3% 18 3,2% 1,23 1,38
Иркутск 4 1,6% 4 0,8% 4 0,7% 1,00 1,00
Воронеж 3 1,2% 3 0,6% 3 0,5% 1,00 1,00
Ростов-на-Дону 2 0,8% 6 1,3% 13 2,3% 3,00 6,50
Красноярск 2 0,8% 3 0,6% 3 0,5% 1,50 1,50
Новосибирск 2 0,8% 2 0,4% 2 0,4% 1,00 1,00
Волгоград 2 0,8% 2 0,4% 2 0,4% 1,00 1,00
Краснодар 2 0,8% 20 4,2% 26 4,6% 10,00 13,00
Гатчина 2 0,8% 2 0,4% 2 0,4% 1,00 1,00
Саратов 2 0,8% 3 0,6% 3 0,5% 1,50 1,50
Казань 2 0,8% 3 0,6% 3 0,5% 1,50 1,50
Псков 2 0,8% 2 0,4% 2 0,4% 1,00 1,00
Уфа 2 0,8% 2 0,4% 2 0,4% 1,00 1,00
Другие 10 4% 12 2,5% 12 2,1%
ВСЕГО В ОТЧЕТЕ: 251 100,0% 479 100,0% 568 100,0%    
из них на странице: 251 100,0% 479 100,0% 568 100,0%    
В группу другие входят: Новочеркасск, Екатеринбург, Шелково, Хабаровск, Ставрополь, Белгород, Вологда, Томск, Киров, Пенза.

Из этих таблиц уже видно, что количество пользователей из Санкт-Петербурга существенно возросло и за 25 дней января составило 201 человек. Появляется надежда, что среди этой группы есть кто-то из тех 150 человек, которые пришли на сайт, чтобы почитать лекции или хотя бы узнать, когда и где они сдают экзамен и скачать вопросы к экзамену.

Преподавателю,потратившему столько сил и времени на разработку сайта и материалов для него было бы приятно узнать и осознать то, что он используется его студентами и помогает им при подготовке к экзаменам. Но чтобы можно было бы ответить на этот вопрос, давайте проанализируем распределение посетителей сайта по отдельным датам января 2009 года



Посетители сайта (с 05.01.2009 по 30.01.2009)


На первый взгляд, трудно получить из этого графика какую-либо информацию. Но если принять во внимание тот факт, что экзамен по ”Информатике” - 09.01.2009 (~100 человек),  ”Информационные сети” - 13.01.2009 (~25 человек) и ”Представление знаний в ИС” - 17.01.09 (~25 человек), то график сразу оживает и может дать много полезной информации. Характерными являются также пики графика в районе 23.01.09 и 26.01.09 – дней первой и второй пересдач. Понятен и спад после 30.01.09, когда начались каникулы.

Таким образом, не вызывает сомнения, что январская аудитория посетителей сайта в основной своей массе представляет именно студентов ЛТА, обучающихся у автора сайта. А если это так, то попробуем проанализировать этот график. Настораживает тот факт, что  09.01.2009 сдают экзамен ~100 человек, а в дни до этой даты число посетителей много меньше. Радует то, что 13.01.2009 сдают экзамен ~25 человек, а в период с 9 до 13 января посетителей сайта не менее 12 человек. Если теперь совместить эти данные с оценками за экзамен, то корреляция явная. Второй поток сдал экзамен без двоек с преобладанием оценок 4 и5, а первый имел 25% двоек, несколько 4 и 5, а в основном 3. Статистика сайта позволяет также отслеживать не только пользователей, но и интенсивность их работы.



Посетители сайта и хиты (с 05.01.2009 по 30.01.2009)


Любой преподаватель знает, что во многом результат обучения зависит от систематичности занятий. Приведенный ниже график иллюстрирует количество посетителей сайта в период сессии, которые до ее начала уже знакомились с  материалами сайта (старые) или только первый раз зашли на этот сайт (новые).

Поток №1 показал на экзамене довольно средний уровень знаний. Но у этого же потока наблюдается и наиболее большая группа новых пользователей в период с 5 по 8 января. То есть большая часть студентов интенсивную подготовку к экзамену начали уже во время сессии.

Показательным является и резкое увеличение новых пользователей после 17.01.09 – дня окончания сессии. Это те двоечники и неявившиеся, которым предстоят повторные пересдачи.



Старые и новые посетители сайта (с 05.01.2009 по 30.01.2009)


Важным для анализа посетителей сайта за заданный период является не только то – новый он посетитель или старый, а насколько интенсивно пользуется он методической информацией, представленной ему для подготовки к экзамену. При анализе статистики сайта эту информацию можно получить из отчета по частоте посещений.



Частота посещений сайта посетителями (с 05.01.2009 по 30.01.2009)


  1-2 сессий в месяц 9 4,7%
  2-4 сессий в месяц 23 11,9%
  1-2 сессий в неделю 32 16,6%
  2-4 сессий в неделю 86 44,6%
  4-5 сессий в неделю 21 10,9%
  5-7 сессий в неделю 10 5,2%
  более 7 сессий в неделю 11 5,7%

Статистика сайта ”Лояльность аудитории” позволяет получить распределение посетителей сайта по числу сессий за время его знакомства с сайтом. Из приведенной ниже таблицы видно, что почти половина студентов заходила на сайт, чтобы одноразово скачать ту или иную лекцию или список вопросов к экзамену.

Вместе с тем существует и большая доля посетителей, которые имели более длительное знакомство с материалами сайта. И, как это ни странно, эти количества посетителей очень близко совпадают с распределением положительных оценок за экзамен во всех трёх потоках.



Лояльность аудитории (с 05.01.2009 по 30.01.2009)


Число сессий за время знакомства с сайтом Посетители
1 сессия 187 49,2%
2 сессии 46 12,1%
3-5 сессий 59 15,5%
6-10 сессий 55 14,5%
11-20 сессий 21 5,5%
21-50 сессий 12 3,2%
ВСЕГО В ОТЧЕТЕ: 380 100,0%

Отчет "Время знакомства с ресурсом" используется для определения среднего времени, в течение которого пользователи задерживаются на сайте. Эта информация показывает, сколь долго пользователь изучает тему, чтобы принять решение. В зависимости от этой информации, можно планировать эффект от работы сайта, как время задержки в принятии решения.



Время знакомства с ресурсом (с 05.01.2009 по 30.01.2009)


Время знакомства Посетители
менее суток 25 6,6%
1-2 дня 211 55,5%
2-4 дня 20 5,3%
4-7 дней 16 4,2%
1-2 недели 16 4,2%
2-3 недели 17 4,5%
3-4 недели 20 5,3%
4-8 недель 33 8,7%
8-14 недель 18 4,7%
более 14-и недель 4 1,1%
ВСЕГО В ОТЧЕТЕ: 380 100,0%

Если считать удовлетворительным, хотя бы месячное или более изучение курса, то видно, что порядка 50 посетителей составляли ядро сайта, а 18 посетителей, знакомых с ресурсом более месяца, очень сильно совпадает с количеством отличных оценок на экзаменах в период сессии.  

Статистика ”Возвраты на сайт” позволяет наряду с рядом полезной информации ответить и на такой вопрос, а зачем студенту в период сессии, когда у него на подготовку к экзамену по 3-4 дня, возвращаться на сайт через 7 и более дней. Ответ может быть только один – он либо не дошел до экзамена, либо получил два и его ждет пересдача. И, как показали результаты сессии, статистика сайта близка к числу пересдач в дополнительную сессию.



Возвраты на  сайт (с 05.01.2009 по 30.01.2009)


Повторные посещения Сессии
возврат менее чем через 1 час 30 10,5%
возврат через 1-3 часа 53 18,5%
возврат через 3-8 часов 37 12,9%
возврат через 8-24 часа 55 19,2%
возврат через 1-3 дня 45 15,7%
возврат через 3-7 дней 23 8,0%
возврат через 7-30 дней 35 12,2%
возврат более чем через 30 дней 9 3,1%

Также на основании данной таблице можно выделить две группы студентов с различным подходом в подготовке к экзамену. Одна из этих групп очень интенсивно использует  информационный ресурс в течение короткого интервала времени. Другая группа периодически и регулярно использует информационный ресурс в течение всех дней, выделенных на подготовку к экзамену.

Из этих данных можно предположить, что первая группа выкачивает данные к себе на локальный компьютер и оперирует с ними в автономном режиме. Другая группа предпочитает работать с методической информацией непосредственно через Интернет.

Подводя итог количественному и временному анализу по посещаемости сайта студентами во время экзаменационной сессии, можно отметить некоторые обобщенные параметры, которые обычно представляются в карточке посещаемости сайта.



Карточка посещаемости сайта (с 05.01.2009 по 30.01.2009)


Посещаемость   Активность посетителей
Посетителей 280   Сессий на посетителя 1,96
Хостов 299   Хитов на посетителя 3,12
Сессий 549   Загрузок на посетителя 3,63
Хитов 873   Посетителей на хост 0,94
Загрузок 1017      
 
Объем аудитории   Характеристики сессии
Ядро аудитории 55   Максимальное время сессии (мин) 557,23
Недельная активная аудитория 7   Среднее время сессии (мин) 10,33
  Максимальная длина сессии (хитов) 40
Посетителей на сайте одновременно   Средняя длина сессии (хитов) 1,59
Максимум 3  
В среднем 1   


Минимальные и максимальные показатели посещаемости сайта


  по часам по дням по неделям
Посетители-MIN 30.01.2009 21:00 - 21:59 0 31.01.2009 3 26.01.2009 - 01.02.2009 37
Хиты - MIN 05.01.2009 0:00 - 0:59 1 31.01.2009 3 26.01.2009 - 01.02.2009 85
Посетители- MAX 12.01.2009 16:00 - 16:59 10 12.01.2009 36& 05.01.2009 - 11.01.2009 103
Хиты- MAX 26.01.2009 22:00 - 22:59 24 08.01.2009 107 05.01.2009 - 11.01.2009 298

Здесь мы уже подходим к техническому аспекту анализа, который позволяет определить требования к  сайту, как Интернет-ресурсу с учетом группы его пользователей. Как следует из приведенных выше таблиц, требование к серверу, на котором размещен сайт минимальны, так как пиковая нагрузка на него не превосходит трех одновременных подключений.

Какие же требования должны быть к программному обеспечению, структуре и дизайну сайта? На этот вопрос также дает ответ анализ статистики сайта, позволяющий определять технические характеристики, подключаемых клиентов исследуемой группы посетителей.    



Браузеры и операционные системы посетителей (с 05.01.2009 по 30.01.2009)


Операционная система Посетители   Браузеры Посетители
Windows XP 298 77,0% Microsoft Internet Explorer 7.0 102 26,4%
Windows Vista 74 19,1% FireFox 3.x 92 23,8%
n/a 4 1,0% Microsoft Internet Explorer 6.0 54 14,0%
Linux i686 2 0,5% Opera 9.2x 24 6,2%
Windows CE 2 0,5% FireFox 2.x 8 2,1%
      Safari 3.x 4 1,0%
ВСЕГО В ОТЧЕТЕ: 387 100,0% ВСЕГО В ОТЧЕТЕ: 387 100,0%
из них на странице: 384 99,0%   из них на странице: 373 96,6%



Дисплеи посетителей (с 05.01.2009 по 30.01.2009)


Разрешение Глубина цвета Посетители
1280x1024 32bpp 203 52,9%
1024x768 32bpp 96 25,0%
1024x768 16bpp 19 4,9%
1152x864 32bpp 19 4,9%
1440x900 32bpp 16 4,2%
1680x1050 32bpp 11 2,9%
800x600 32bpp 11 2,9%
176x220 16bpp 2 0,5%
234x282 32bpp 2 0,5%
234x320 32bpp 1 0,3%
ВСЕГО В ОТЧЕТЕ:   384 1003%



Java, Java-Script и Cookie посетителей (с 05.01.2009 по 30.01.2009)


JavaScript Java Cookie Посетители
1.3 вкл вкл 280 72,4%
1.3 выкл вкл 104 26,9%
Не определено выкл выкл 3 0,8%


Из анализа этих таблиц следует, что посетители сайта наряду с Windows XP широко используют Windows Vista. Однако начинают находить применение и Linux и Windows CE, что говорит о группе посетителей, которые используют для доступу к сайту КПК, коммуникаторы или телефоны. Это видно и из характеристик дисплеев, где наряду с форматом 800х600, появились форматы 234x320,234x282 и 176x220. Это требует новых подходов к организации дизайна сайта. С точки зрения использования на сайте процедур и функций Java-Script никаких сложностей у посетителей возникать не должно, так как практически у всех пользователей имеется поддержка Java-Script версии 1.3.



Хосты  наиболее активных посетителей (с 05.01.2009 по 30.01.2009)


IP-адрес (хост) Хиты
85.249.146.17 (17-146-249-85-dial-up.master.ru) 76 9,6%
92.100.80.229 (ppp92-100-80-229.pppoe.avangarddsl.ru) 26 3,3%
217.147.0.13 18 2,5%
84.52.73.191 (191.73.co-location.westcall.net) 18 2,5%
92.101.58.253 (ppp92-101-58-253.pppoe.avangarddsl.ru) 18 2,5%
87.249.59.162 (162.as-59.nienschanz.ru) 17 2,25%
92.255.81.74 16 2,0%
91.196.252.1 (c1n252.polustrovo.net) 15 1,9%
93.100.141.25 13 1,6%
195.189.80.36 12 1,5%
92.101.52.175 (ppp92-101-52-175.pppoe.avangarddsl.ru) 12 1,5%
92.100.73.129 (ppp92-100-73-129.pppoe.avangarddsl.ru) 12 1,5%
195.64.140.18 (ip195-64-140-18.users.dmnet.ru) 12 1,5%
85.249.146.129 (129-146-249-85-dial-up.master.ru) 11 1,4%
77.241.45.99 10 1,3%
ВСЕГО В ОТЧЕТЕ: 793 100,0%
из них на странице: 288 563,2%



Пример анализа подключения с ряда хостов (с 05.01.2009 по 30.01.2009)


Дата          – хост  217.147.0.13 Хиты
06.01.2009 2 0,3%
08.01.2009 18 2,3%
Дата          – 84.52.73.191 (191.73.co-location.westcall.net) Хиты
08.01.2009 16 2,0%
09.01.2009 2 0,3%
Дата         – хост  92.101.58.253 (ppp92-101-58-253.pppoe.avangarddsl.ru) Хиты
18.01.2009 18 2,3%
Дата        – 87.249.59.162 (162.as-59.nienschanz.ru) Хиты
20.01.2009 3 0,4%
21.01.2009 9 1,1%
22.01.2009 5 0,6%

Анализ хостов посетителей сайта показывает, что большинство из них подключаются  через ADSL соединения или непосредственно к провайдерам домашних сетей, то есть имеют высокоскоростной доступ к Интернет. В этих условиях у посетителей не должно возникать никаких сложностей по доступу к сайту, даже при загрузке flash-роликов.