Изменения

Перейти к: навигация, поиск

R:Google Analytics/Примеры

7599 байтов добавлено, 17:10, 17 мая 2014
м
Анализ суточной активности посетителей по дням недели
Конвертируем названия дней недели в ранжированный фактор для соблюдения порядка дней недели при построении графиков.
{{r-code|code=<nowiki>>ga.data$dayOfWeekName <- factor(ga.data$dayOfWeekName, ordered = TRUE,+ levels = c("Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday", "Sunday"))</nowiki>}}
Приведём первые несколько строк таблицы для наглядной демонстрации структуры полученных данных:
В качестве визуализации воспользуемся плиточным графиком, который окрашивает зоны на пересечении часов и дней недели в зависимости от значения переменной <code>pageviews</code>. Пример кода для построения графика:
{{r-code|code=<nowiki>> qplot(data = ga.data, x = dayOfWeekName, y = hour, fill = pageviews, xlab = "days of week") +
+ geom_tile(colour = "white") + scale_fill_gradient(low = "steelblue", high = "red", space = "Lab") +
+ theme_bw() + theme(axis.ticks = element_blank())</nowiki>}}
Стоит также отметить, что в качестве показателей активности посетителей можно такж использовать количество сеансов пользователей, среднее количество просмотром на одного посетителя и т. д.
== Анализ соотношения источников трафика ==
Проанализируем соотношение основных источников трафика сайта: прямой (direct), переходы с других сайтов (referral) и поисковый (organic). Для получения нужных данных нам понадобится показатель количество посещений (<code>ga:sessions</code>) и и измерение источники трафика <code>ga:medium</code><ref>Измерение <code>ga:source</code> даёт более подробную информацию об источниках трафика, в том числе и об источниках переходов, т.е. веб-сайтах, с которых приходят посетители. В данном случае нашей целью является проанализировать только соотношение источников трафика.</ref>.
+ metrics = "ga:sessions", dimensions = "ga:medium", sort = "-ga:sessions")</nowiki>}}
В данный таблице прямой трафик отображается как «(none)». ИсправлИсправляем:
{{r-code|code=<nowiki>> ga.data[ga.data$medium == "(none)", "medium"] <- "direct"</nowiki>}}
[[Файл:Ga-trafic-sources.svg|600px|центр]]
Теперь рассмотрим источники трафика более детально. Для этого сделаем выборку по измерению <code>ga:sourceMedium</code>, который сочетает в себе измерения измерениям <code>ga:medium</code> и <code>ga:source</code>. В качестве основного показателя оставим количество посещений (<code>gaпоказателей активности посетителей возьмём следующие показатели:sessions</code>). Наиболее интересными для нас являются источники, имеющие наибольшее количество посещений, поэтому воспользуемся сортировкой по убываю. Код для получения данных приведён ниже.
* количество посещений (<code>ga:sessions</code>);* процент новых посещений (<code>ga:percentNewSessions</code>);* средняя продолжительность посещения (<code>ga:avgSessionDuration</code>);* количество просмотров страниц (<code>ga:pageviews</code>);* среднее количество просмотров страниц на одно посещение (<code>ga:pageviewsPerSession</code>);* [http://ru.wikipedia.org/wiki/Показатель_отказов процент отказов] (<code>ga:bounceRate</code>). Наиболее интересными для нас являются источники, имеющие наибольшее количество посещений, поэтому воспользуемся сортировкой по убыванию по показателю <code>ga:sessions</code>, а также ограничим количество источников теми, с которых было более 100 посещений. Код для получения данных приведён ниже. {{r-code|code=<nowiki>> ga.data <- ga$getData(id, start.date = ga$getFirstDate(id)"2014-03-24", end.date = Sys.Date() "2014- 104-23",+ metrics = "ga:sessions,ga:percentNewSessions,ga:avgSessionDuration,ga:pageviews,ga:pageviewsPerSession,ga:bounceRate", + dimensions = "ga:medium,ga:source", sort = "ga:medium,-ga:sessions", filters = "ga:sessions>100")</nowiki>}}
Полученная в результате запроса таблица данных:
{{r-code|code=<nowiki>> head(ga.data, n = 10) medium source sessionspercentNewSessions avgSessionDuration pageviews pageviewsPerSession bounceRate1 organic (none) yandex (direct) 8600011182 48.92 205.34 28823 2.578 63.422 organic google yandex 7184172949 43.72 146.23 170021 2.331 69.303 organic google (none) (direct) 61130 45.60 183.29 13189143721 2.351 65.154 organic go.mail.ru 69525884 49.68 160.77 16012 2.721 66.425 organic rambler 683 53.29 134.36 1635 2.394 68.966 organic bing 379 47.23 185.23 1158 3.055 62.537 organic ask 115 46.09 181.53 313 2.722 60.008 referral vk.com 31942732 26.79 212.63 7722 2.827 57.916 9 referral ru.wikipedia.org 30522598 54.16 148.96 6640 2.556 62.367 organic 10 referral psychologos.ru 578 70.24 62.54 863 1.493 84.4311 referral rambler e.mail.ru 835338 31.07 242.53 1102 3.260 54.738 12 referral psychologos nigma.ru 696265 30.94 198.44 881 3.325 71.709 organic 13 referral ru.m.wikipedia.org 143 60.84 bing 101.99 282 1.972 43668.5310 14 referral e rutracker.mailorg 143 60.14 79.49 200 1.399 85.3115 referral brainmod.ru 387105 41.90 127.41 199 1.895 71.43</nowiki>}}
Поскольку данная таблица включает только 20 позиций, то расчёт процентного соотношения для этой выборки будет некорректным. Если есть неободимость сравнение процентного соотношения, то необходимо сделать полную выборку данныхСравнивая данные показатели у разных истоников трафика мжно выявить наиболее ценные из них.
Отобразим только поисковый трафик:
{{r-code|code=<nowiki>> head(subset(ga.data[ga.data$, medium == "organic"), n = 10]) medium source sessionspercentNewSessions avgSessionDuration pageviews pageviewsPerSession bounceRate1 2 organic yandex 8600072949 43.72 146.2 170021 2.331 69.303 organic google 7184161130 45.60 183.3 143721 2.351 65.154 organic go.mail.ru 69525884 49.68 160.8 16012 2.721 66.427 5 organic rambler 8359 organic bing 683 53.29 134.4 43614 organic ask 1635 2.394 13568.9621 6 organic yahoo 7841 organic conduit 2049 organic avg 17110 organic search-results 4126 organic babylon bing 379 47.23 185.2 1158 3.055 62.53197 7 organic live 1ask 115 46.09 181.5 313 2.722 60.00</nowiki>}}
Только Отобразим только трафик переходов:
{{r-code|code=<nowiki>> head(subset(ga.data[ga.data$, medium == "referral", ]), n = 10) medium source sessionspercentNewSessions avgSessionDuration pageviews pageviewsPerSession bounceRate5 8 referral vk.com 31942732 26.79 212.63 7722 2.827 57.916 9 referral ru.wikipedia.org 30522598 54.16 148.96 6640 2.556 62.368 10 referral psychologos.ru 696578 70.24 62.54 863 1.493 84.4310 11 referral e.mail.ru 387338 31.07 242.53 1102 3.260 54.7311 12 referral nigma.ru 33712 referral 265 30.94 198.44 881 3.325 rutracker71.org 1727013 referral ru.m.wikipedia.org 17015 referral brainmod143 60.ru 84 101.99 282 1.972 12168.5316 14 referral yandex rutracker.ru org 104143 60.14 79.49 200 1.399 85.3117 15 referral lookatmebrainmod.ru 101105 41.90 127.41 199 1.895 71.43</nowiki>}}
Визуализируем эту таблицу с помощью столбиковой диаграммы:
{{r-code|code=<nowiki>> qplot(data = head(subset(ga.data[ga.data$, medium == "organic", ])), x = reorder(source, sessions), y = sessions,
+ geom = "bar", stat = "identity", xlab = "") + coord_flip() + theme_bw()</nowiki>}}
[[Файл:Ga-searches.svg|600px|центр]]
{{r-code|code=<nowiki>> qplot(data = head(subset(ga.data[ga.data$, medium == "referral", ])), x = reorder(source, sessions), y = sessions,
+ geom = "bar", stat = "identity", xlab = "") + coord_flip() + theme_bw()</nowiki>}}
[[Файл:Ga-referrals.svg|600px|центр]]
 
<code>reorder(source, sessions)</code> используется для сортировки столбцов в диаграмме в зависимости от значения столбца «sessions».
 
Для более детального анализа сайтов, с которых приходят посетители, а также целевые страницы, можно сделать следующую выборку данных:
 
{{r-code|code=<nowiki>> ga.data <- ga$getData(id, start.date = "2014-03-24", end.date = "2014-04-23",
+ metrics = "ga:sessions", dimensions = "ga:medium,ga:source,ga:referralPath,ga:pageTitle",
+ sort = "-ga:sessions", filters = "ga:medium==referral", batch = TRUE, walk = TRUE)</nowiki>}}
 
В каждом заголовке страницы присутствует также название сайта<ref>Это поведение зависит от настроек «движка» сайта.</ref>, для удобства представления данных убираем его:
 
{{r-code|code=ga.data$pageTitle <- gsub(" — Psylab.info", "", ga.data$pageTitle)}}
 
Выведем список наиболее посещаемых страниц нашего сайта посетителям, которые приходят с сайта Википедии:
 
{{r-code|code=<nowiki>> head(ga.data[grep("wikipedia", ga.data$source), -1:-3], n = 10)
pageTitle sessions
2 Методика чернильных пятен Роршаха 430
3 Прогрессивные матрицы Равена 286
4 Методика многофакторного исследования личности Кэттелла 270
5 Опросник «Уровень субъективного контроля» 245
6 Категория:Тесты интеллекта 184
12 Шкала депрессии Бека 78
13 Тест структуры интеллекта Амтхауэра 76
15 Методика многофакторного исследования личности Кэттелла 54
17 Тест фрустрационных реакций Розенцвейга 52
19 Миннесотский многоаспектный личностный опросник 51</nowiki>}}
 
== География посещений ==
 
Информация о географии посещений можно получить с помощью измерений из группы «Geo Network». Для начала получим данных о количестве посещений по странам.
 
{{r-code|code=<nowiki>> ga.data <- ga$getData(ids = id, start.date = Sys.Date() - 31, end.date = Sys.Date() - 1,
+ metrics = "ga:sessions", dimensions = "ga:country",
+ sort = "-ga:sessions", filters = "ga:country!=(not set)")</nowiki>}}
 
Полученные данные представляют собой следующую таблицу:
 
{{r-code|code=<nowiki>> head(ga.data, n = 10)
country sessions
1 Russia 115167
2 Ukraine 25166
3 Belarus 8361
4 Kazakhstan 4252
5 Netherlands 1565
6 Moldova 980
7 United States 681
8 Armenia 515
9 Latvia 463
10 Kyrgyzstan 392</nowiki>}}
 
Рассмотрим более подробно география посещений по городам РФ:
 
{{r-code|code=<nowiki>> ga.data <- ga$getData(ids = id, start.date = "2014-03-24", end.date = "2014-04-23",
+ metrics = "ga:sessions", dimensions = "ga:country,ga:city",
+ sort = "-ga:sessions", filters = "ga:country==Russia;ga:city!=(not set)")</nowiki>}}
 
Полученные результаты:
 
{{r-code|code=<nowiki>> head(ga.data, n = 10)
country city sessions
1 Russia Moscow 18760
2 Russia Saint Petersburg 14660
3 Russia Novosibirsk 4359
4 Russia Yekaterinburg 3972
5 Russia Samara 3916
6 Russia Kazan 2071
7 Russia Rostov-on-Don 1875
8 Russia Krasnodar 1816
9 Russia Perm 1753
10 Russia Krasnoyarsk 1715</nowiki>}}
== Примечания ==

Навигация