среда, 20 марта 2013 г.

Как работает Google Analytics

В этом посте я опишу основные принципы работы системы Google Analytics.

Итак, представьте, что вы впервые установили код Analytics на свой сайт. В аккаунт начали поступать данные о просмотрах страниц, посещениях, пользователях - это означает, что код GA начал работать и передавать статистику посещаемости сайта в аккаунт GA и его профиль (профили).

Но как именно работает Analytics? Ниже представляю подробный ответ на этот вопрос.
 

Посетитель приходит на сайт (1)


Для того, чтобы код Analytics начал работать – первое, что должно произойти, – на сайт с установленным кодом должен зайти посетитель. В момент открытия первой страницы в рамках посещения код GA сработает и начнет отслеживание сессии.  Этот сценарий работает как для обычных сайтов для персональных компьютеров, так и для сайтов для смартфонов, wap-устройств и мобильных приложений.

Обрабатывается код Analytics (2)

Выполняется первое взаимодействие в сессии, то есть, грузится первая страница (для большинства случаев) и код ГА обрабатывается. 

Код GA выполняет две операции.

С одной стороны, код GA грузит файлы cookies в браузер пользователя – в папку временных файлов браузера. Куки (cookies) - небольшие текстовые файлы - они помогают GA определить рамки сессии при переходах одного пользователя между просмотрами страниц. Также они позволяют GA "запомнить" посетителя при повторных посещениях сайта впоследствии. При этом стоит отметить важный момент – куки уникальны для каждого браузера и посылают данные для домена вашего сайта из данного браузера. Поэтому другие скрипты, работающие для других доменов, никогда не смогут изменить данные посещаемости данным браузером (пользователем) вашего домена. Таким образом, информация по вашему домену в браузере посетителя становится вашей собственной информацией и не может быть передана другому сервису.

С другой стороны, код Analytics отсылает на сервера Google Analytics так называемые хиты или utm-вызовы. На любое отслеживаемое взаимодействие посетителя с сайтом - загрузку страницы, событие или нажатие по кнопке сайта – эти хиты посылаются на сервера GA и объединяются в группу последовательных хитов, которые в совокупности потом складываются в сессию/посещение.
Стандартный хит (utm-вызов) может выглядеть вот так:
  


Данные попадают на сервер (3) и обрабатываются на нем (4)







 



Следующий этап - это получение данных о посещаемости сайта сервером и их обработка. Совокупность хитов, полученных от кода GA, в результате обработки превращается в сессию и далее возвращается в виде отчетности в интерфейс аккаунта GA.

Данные передаются в интерфейс аккаунта Google Analytics (5)



Для стандартного аккаунта Google Analytics задержка передачи данных в интерфейс может достигать 24 часов. То есть система Google Analytics - не онлайновая. Если вы хотите увидеть в профиле данные за полный день, то, скорее всего, это можно будет сделать лишь на следующий день. Иногда - очень редко - случаются и более длительные задержки.

Для аккаунта Google Analytics Premium задержка данных в интерфейсе составляет 4 часа максимум.

Существует еще один способ получения данных GA - это автоматизированная выгрузка отчетов через Google Analytics API.

3 комментария:

  1. Станислав, а вы вот упомянули о задержке передачи данных в Google Analytics.
    А я бы хотел узнать, есть ли задержка данных между реальным временем посещения пользователя и данными об времени его посещении в интерфейсе Google Analytics? (К примеру: я зашел на сайт vidyev.ru в 21.10, а в GA отобразится 21.40 и того задержка составит 30 минут)
    Мне от разных людей приходилось слышать разные ответы, поэтому хочу спросить напрямую у сотрудников Google :)

    ОтветитьУдалить
  2. Приветствую!
    Антон, я не могу добавить что-то более подробное, чем описание вот здесь: https://support.google.com/analytics/answer/1638635?hl=ru
    На своем опыте - я видел свое посещение в Real Time отчете в течение одной минуты где-то. Опять же, это мои личные ощущения.
    Есть еще один момент: пользователь считается активным, если от него пришел хит в течение последних 5 минут. Поэтому, если бездействие более 5 минут - должен исчезнуть из Real-time. 30 минут - это таймаут, после которого закрывается посещение - но это уже для стандартных отчетов.
    Отчет будет дальше развиваться. Одно из обновлений будет, если еще не ввели, - к real time данным будут применяться фильтры профиля налету. Наверное, стоит написать отдельный пост про этот отчет.

    ОтветитьУдалить
    Ответы
    1. Спасибо за ответ, Станислав.
      Да пост ждем, интересно было бы узнать и об этом фильтре.

      Удалить