Изменения

Перейти к: навигация, поиск

R:Google Analytics

3932 байта добавлено, 08:27, 6 августа 2014
м
Общее описание
== Общее описание ==
На данный момент, несмотря на все многообразие, в официальном репозитории CRAN нет пакетов для работы с API Google Analytics. Однако на сторонних ресурсах, тем не менее, можно обнаружить три рабочих решения: [https://code.google.com/p/r-google-analytics/ <code>RGoogleAnalytics</code>], [http://skardhamar.github.io/rga/ <code>rga</code>] и , [https://github.com/jdeboer/ganalytics <code>ganalytics</code>] и [https://bitbucket.org/unikum/rga RGA]. <ref>Пакеты <code>rga</code> и , <code>ganalytics</code> и <code>RGA</code> в ближайшее время могут появиться и в CRAN, работы в этом направлении уже ведутся.</ref>
Сравнительная таблица пактов для работы с GA APIGoogle Analytics:
{| class="wikitable sortable" width="800px"
! width="20%" | [https://github.com/skardhamar/rga rga]
! width="20%" | [https://github.com/jdeboer/ganalytics ganalytics]
! width="20%" | [https://bitbucket.org/unikum/rga RGA]
|-
! colspan=4 5 | Общая информация
|-
| Размещение
| style="text-align:center" | [https://github.com/skardhamar/rga GitHub]
| style="text-align:center" | [https://github.com/jdeboer/ganalytics GitHub]
| style="text-align:center" | [https://bitbucket.org/unikum/rga Bitbucket]
|-
| Дата публикации
| style="text-align:center" | 27.11.2012
| style="text-align:center" | 25.05.2013
| style="text-align:center" | 3.06.2014
|-
| Дата последней стабильной версии
| style="text-align:center" | 9.09.2013<ref>В апреле 2014 были внесены значительные изменения в код проекта, но после их внесения стабильного выпуска пока нет.</ref>
| style="text-align:center" | 251.0506.2014<ref>Дата последней правки на данный момент, т.к. релизы данного пакета отсутствуют.</ref>| style="text-align:center" | 244.0508.2014<ref>Дата последней правки на данный момент, т.к. релизы данного пакета отсутствуют.</ref>| style="text-align:center" | 5.08.2014<ref>Дата последней правки на данный момент, т.к. релизы данного пакета отсутствуют.</ref>
|-
| Лицензия
| style="text-align:center" | Apache 2.0
| style="text-align:center" | GPLGPL2
| style="text-align:center" | MIT
| style="text-align:center" | GPL2
|-
| Зависимости
| style="text-align:center" | <code>RCurl</code>, <code>rjson</code>, <code>lubridate</code>
| style="text-align:center" | <code>RCurl</code>, <code>jsonlitehttr</code>, <code>lubridatejsonlite</code>, <code>httrlubridate</code>| style="text-align:center" | <code>httr</code>, <code>plyr</code>, <code>stringr</code>, <code>jsonlite</code>, <code>httpuv</code>| style="text-align:center" | <code>RCurl</code>, <code>httr</code>, <code>jsonlite</code>
|-
! colspan=4 5 | Авторизация
|-
| Авторизация по логину и паролю
| style="text-align:center" | +
| style="text-align:center" | -
| style="text-align:center" | -
| style="text-align:center" | -
|-
| Авторизация [https://developers.google.com/accounts/docs/OAuth2 OAuth2]<ref>Авторизация по Client ID и Client secret, полученным в [https://console.developers.google.com API Console].</ref>
| style="text-align:center" | +
| style="text-align:center" | +
| style="text-align:center" | +
| style="text-align:center" | +
|-
! colspan=4 5 | Доступ к API
|-
| Доступ к [https://developers.google.com/analytics/devguides/reporting/core/v3/ API базовых отчётов]
| style="text-align:center" | +
| style="text-align:center" | +
| style="text-align:center" | +
| style="text-align:center" | +
| style="text-align:center" | -
| style="text-align:center" | +
|-
| Доступ к [https://developers.google.com/analytics/devguides/config/mgmt/v3/ API конфигурации]<ref>Информация по аккаунтам, профилям, представлениям, сегментам и целям.</ref>
| style="text-align:center" | +
| style="text-align:center" | -
| style="text-align:center" | +
|-
| Пакетная обработка запросов<ref>Pagination - получение данных, превышающих ограничения Google (1000 на один запрос) путем организации нескольких запросов.</ref>
| style="text-align:center" | +
| style="text-align:center" | +
| style="text-align:center" | +
В плане простоты использования, в свою очередь. лидирует пакет <code>rga</code>. В отличие от <code>ganalytics</code>, пакет <code>rga</code> позволяет указывать метрики, измерения, узкие сегменты и фильтры в виде аргументов сразу, в одной функции, что упрощает понимание структуры запроса и сегмента, и позволяет обрабатывать множество однотипных сегментов (например, страниц сайта) в цикле или <code>[a-z]pply</code>-функциях. Также <code>ganalytics</code> не имеет внутренних инструментов получения ID профилей, а их получение из web-интерфейса Google Analytics с последующей вставкой в запросы <code>ganalytics</code> трудоемко и, самое главное, неинтуитивно. <code>RGoogleAnalytics</code>, несмотря на достаточно подробную документацию и достаточный для полноценной работы функционал, обладает несколько непрозрачной и неочевидной структурой запросов к GA API.
== Пакет <code>rga</code> Получение ключей для доступа к API Google Analytics ==
=== Установка необходимых пакетов ===Прежде чем приступить к работе с пакетами, предназначенными для работы с Google Analytics API, необходимо создать новое приложение в [https://console.developers.google.com Google Developers Console] и получить '''Client ID''' (идентификатор клиента) и '''Client secret''' (секретный ключ клиента) для доступа к API Google Analytics. Не смотря на то, что некоторые пакеты, например <code>rga</code>, предоставляют ключи доступа, сгенерированные автором пакета, мы всё же рекомендуем получить собственные ключи, т.к. сторонние ключи могут быть в любой момент отозваны автором.
Устанавливаем и подключаем пакет {{r-package|devtools}}, для доступа к [https://github.com/ github] (требуется только в первый раз, для установки пакета {{r-package|rga}})Пошаговая инструкция приведена ниже:
{{r-code|code=<nowiki>> install.packages# Создание нового проекта ("devtools"можно пропустить, если проект уже создан):> library#* Откройте страницу https://console.developers.google.com/project;#* В левой верхней части страницы нажмите на красную кнопку с надписью '''Create Project''';#* Во всплывающем окне в поле '''PROJECT NAME''' введите название проекта;#* Подтвердите создание проекта, нажав на кнопку '''Create'''.# Активация доступа к API Google Analytics:#* Выберите проект в списке проектов на странице https://console.developers.google.com/project;#* На боковой панели слева выберите пункт '''APIs & auth''';#* на вкладке '''APIs''' активируйте '''Analytics API''', нажав на кнопку с надписью `OFF` (devtoolsубедитесь, что вместо надписи `OFF` появилось `ON`)<.# Создание нового приложения:#* В боковой панели слева выберите пункт '''APIs & auth''', подпункт '''Credentials''';#* В левой части страницы нажмите на кнопку с надписью '''Create new Client ID''';#* Во всплывающем окне выберите пункт '''Installed application''' в списке '''APPLICATION TYPE''' и пункт '''Other''' в списке '''INSTALLED APPLICATION TYPE'''.#* Подтвердите создание приложения, нажав на кнопку с надписью '''Create Client ID'''.# Получение Client ID и Client secret:#* Выберите проект в списке проектов на странице https:/nowiki>}}/console.developers.google.com/project;#* В боковой панели слева выберите пункт '''APIs & auth''', подпункт '''Credentials''';#* В таблице с названием '''Client ID for native application''' скопируйте значения полей '''Client ID''' и '''Client secret'''.
Устанавливаем пакет <code>rga</code>:Теперь вы в любой момент можете вернуться на страницу '''Credentials''' и узнать '''Client ID''' и '''Client secret'''.
{{r-code|code== Пакет <nowikicode>> install_github("rga", "skardhamar")</nowikicode>}}==
=== Организация доступа к API Установка пакета ===
Загрузка Исходный код пакета доступа к GA (требуется только в начале работы при запуске новой R<code>rga</code> располагается на [https://github.com github], поэтому установить его можно с помощью функции <code>install_github</code> из пакета {{r-сессии)package|devtools}}:
{{r-code|code=<nowiki>> librarydevtools::install_github("rga", "skardhamar")</nowiki>}}
Запрет верификации SSL-соединения (требуется только для ОС Windows, чтобы избежать ошибок при аутентификации):=== Авторизация ===
{{r-Перед началом работы необходимо загрузить пакет <code|>rga</code=<nowiki>> options(RCurlOptions = list(capath = system.file("CurlSSL", "cacert.pem", package = "RCurl"требуется только в начале работы при запуске новой R-сессии), ssl.verifypeer = FALSE))</nowiki>}}:
Для создания тоекна доступа потребуется переход в браузер, подтверждение доступа и копирование ключа в консоль. Опционально команда создает отдельный файл, который потом можно использовать для аутентификации без перехода в браузер{{r-code|code=<refnowiki>Аргумент <code>where</code> с указанием пути и имени файла.library(rga)</refnowiki>.}}
{{r-Для предоставления доступа к данным Google Analytics API из пакета <code|>rga</code=> неободимо пройти процедуру авторизации. Для этого используется функция <nowiki>code> rga.open(instance = "ga", where = "ga.rga")</nowikicode>}}, которая принимает следующие аргументы:
Видим, что в директории проекта появился файл * <code>ga.rgainstance</code>- имя переменной, которая будет содержать информацию о доступе к APi Google Analytics;* <refcode>Можно указать любой удобный where</code> - путь и /или имя файла, который будет использоваться для кэширования информации;* <code>client.id</refcode>. Теперь при повторном использовании этой команды будет осуществляться проверка наличия файла - ID клиента;* <code>gaclient.rgasecret</code> в рабочей директории и, если такой файл будет найден, то данные для аутентификации будут взяты из данного файла- секретный ключ.
Второй вариант Для получения токена доступа потребуется переход в браузер, подтверждение доступа и копирование код доступа в консоль. Опционально команда создает отдельный файл, который потом можно использовать для аутентификации без перехода в браузер<ref>Аргумент <code>where</code> с созданием собственного клиента API указанием пути и ключей доступа:имени файла.</ref>.
# Необходимо создать проект на странице https://console.developers.google.com/project;# На вкладке APIs & auth на вкладке APIs надо активировать Analytics API, нажав на кнопку, где написано <{{r-code|code>OFF=</codenowiki>>rga.# Во вкладке APIs & auth перейти во вкладку Credentialsopen(instance = "ga", где выбрать Create new Client ID;# При создании Client ID выбрать APPLICATION TYPE: Installed application, INSTALLED APPLICATION TYPE: other, и нажать create;# В результате будет Client ID where = и Client secret = ;# На вкладке Consent screen необходимо выбрать рабочий email и дать название приложению (Product name"ga.rga"), сохранить;</nowiki>}}
Получаем токен доступа (откроется браузерВидим, где надо будет выбрать свой почтовый аккаунт что в директории проекта появился файл <code>ga.rga</code><ref>Можно указать любой удобный путь и подтвердить вход имя файла.</ref>. Теперь при повторном использовании этой команды будет осуществляться проверка наличия файла <code>ga.rga</code> в APIрабочей директории и, тогда выдадут код, который надо если такой файл будет вставить в консоль):найден, то данные для аутентификации будут взяты из данного файла.
{{r-code|code=<nowiki>> rga.open(instance = "ga", client.id = "", client.secret = "", where = "ga.rga")</nowiki>}}Второй вариант аутентификации с использованием собственных ключей доступа:
Пояснения по значениям аргументов:{{r-code|code=<nowiki>> rga.open(instance = "ga", client.id = "XXXXXX", client.secret = "XXXXXXX", where = "ga.rga")</nowiki>}}
* <code>clientПосле выполнения данной команды будет открыт интернет браузер со страницей запроса подтверждения разрешения на доступ к данным Google Analytics.id</code> необходимо вставить сюда Client ID;* <code>clientНеобходимо авторизоваться под своей учётной записью Google и подтвердить разрешение на доступ к данным Google Analytics.secret</code> необходимо вставить сюда Client secretОтметим, что пакет `RGA` запрашивает доступ '''только для чтения''' данных.
После успешной аутентификации информацию о установленном подключении можно получить с помощью команды <code>ga$status()</code> или более подробную информацию <code>ga$show()</code>.
=== Получение данных ===
Пакет <code>rga</code> позволяет получить доступ к различной информацииразличным API Google Analytics. Поскольку объекты, формируемые пакетом <code>rga</code>, относятся к классу <code>refClass</code>, что не является широко распространённой системой в данный момент, то ниже мы проведём небольшой обзор доступных функций и методов.
Получить общую информацию о классе <code>rga</code> можно с помощью функции <code>getRefClass()</code>:
Пояснения по значениям аргументов для метода <code>getData</code>:
* <code>ids</code> - номер ID профиля, из которого нужно выгрузить данные;* <code>start.date</code> - символьная строка, которая задаёт стартовое время в формате <code>YYYY-MM-DD</code><ref>Получить начальную дату сбора статистики в GA можно с помощью команды <code> ga$getFirstDate(id)</code>.</ref>. Допускаются также значения "today", "yesterday", "ndaysAgo", где <code>n</code> - это количество дней;* <code>end.date</code> - символьная строка, которая задаёт конечное время в формате <code>YYYY-MM-DD</code><ref>В данном случае используется функция <code>Sys.Date()</code>, которая выводит текущую дату.</ref>. Допускаются также значения "today", "yesterday", "ndaysAgo", где <code>n</code> - это количество дней;
* <code>date.format</code> - символьная строка, которая задаёт формат даты, который используется для преобразования дат, полученных в результате запроса (по умолчанию <code>%Y-%m-%d</code>);
* <code>metrics</code> - символьная строка, которая определяет показатели (столбцы), которые будут входить в таблицу с данными (по умолчанию <code>"ga:visits"</code>)<ref>Можно использовать не больше 10 метрик одновременно.</ref>;
* <code>walk = TRUE</code> - позволяет получить исходные, а не агрегированные данные.
Аргументы <code>ids</code>, <code>start.date</code>, <code>end.date</code> и <code>metrics</code> являются обязательными для запроса к GA Google Analytics API. Прм этом функция <code>getData()</code> требует только <code>id</code> профиля, т.к. остальные аргументы имеют значения по умолчанию. Все аргументы метода <code>getData</code>, а также значения по умолчанию , можно посмотреть с помощью команды <code>args(ga$getData)</code>.
Детальную информацию можно найти на соответствующих страницах справочного руководства по GA API:
* по сегментам: https://developers.google.com/analytics/devguides/reporting/core/v3/segments
Получить доступ к API GA Google Analytics можно также с помощью веб-сервисов Google по следующей ссылке: https://developers.google.com/apis-explorer/?hl=ru#p/analytics/v3/. Для получения данных необходимо авторизоваться и задать требуемые параметры для запроса к API.
Пример сбора данных по выбранным метрикам и измерениям приведён ниже.
{{r-code|code=<nowiki>> ga.data <- ga$getData(ids = id,
{{r-code|code=<nowiki>> str(ga.data)
'data.frame': 34 obs. of 4 variables:
$ date : Date, format: "2014-03-19" "2014-03-20" "2014-03-21" "2014-03-22" ...
$ pageviews: num 9032 11914 10494 7173 8561 ...

Навигация