Спам трафик: как исключить referral spam в Google Analytics

Реферальный спам: что это?

Реферальный спам — фальшивые запросы к сайту; обращения происходят от спам-ботов или программ, которые не взаимодействуют с сайтом. В Google Analitics они выглядят как посещения с 100% отказом и отсутствием действий на сайте.

Реферальный спам не сказывается на поисковые позиции. Поисковики на сегодняшний день научились распознавать спам-запросы и не обращают на них внимания. Однако в общей метрики они мешают получить достоверные отчёты, поэтому их лучше исключать из попадания в данные. 

Различают в зависимости от поведения и источника трафика призрачный спам и краулеры.

Рассмотрим их отличия, ведь исходя из них нужно выбирать меры борьбы против них.

Призрачный спам (Ghost spam) назван так из-за того, что трафик никогда не доходит до сайта. Он приходит из Measurement Protocol (отправляет необработанные данные на Google Analytics) путем генерации кодов отслеживания. Поскольку взаимодействия с сайтом не происходит, такой спам не получится исключить благодаря .htaccess. Сделать это можно только через фильтры гугл аналитики. 

Краулеры (Crawler Referrer Spam) же взаимодействуют со страницами сайта через правила в robots.txt, оставляя после себя данные в отчётах об просмотрах.

Однако, есть важное примечание:

Спам-боты не страшны сайтам, которые заботятся о своей безопасности. Это значит, что если ваш сайт имеет уязвимости, размещается у ненадежного провайдера и построен на базе CMS — ваш сайт больше подвержен подобным атакам.

Зачем спамить в Google Analytics?

Целью подобного реферального спама является обратное взаимодействие владельцев сайтов с источниками спама.

  • Таким образом спамеры монетизируют переходы, собирают email-и для массовых рассылок и создания фейковых учёток.
  • Спам в комментариях.
  • Накрутка платных просмотров и кликов.

Как определить реферальный спам в отчетах GA?

В Google Analytics в разделе Отчеты- Источники трафика → Весь трафик → Переходы. Расширьте параметр “Дополнительный параметр” → “Имя хоста”» и отсортируйте по имени хоста.

На что нужно обращать внимание при поиске спам-запросов:

  • Подозрительный домен и имя хоста (рандомные символы либо примечание «not set»).
  • Показатель отказов и новые сеансы со значениями 100 и 0%.
  • Дублирование значений в дополнительных параметрах.

Спам-списки в Google Analytics — можно преждевременно исключить большую часть известных спам-роботов. Установите фильтрацию по общедоступным спискам спамеров в сети.

Как исключить referral spam: фильтры Google Analytics

Исключить спам можно с помощью инструментов Google Analytics, настроив соответствующую фильтрацию.

Не стоит использовать фильтрацию к основному представлению GA, в таком случае есть риск лишить себя части нужных данных. Под фильтр выбирайте дополнительные представления.  

Представление — точка доступа к отчетам с данными об ресурсе. Когда добавляется новый ресурс гугл аналитика автоматически создает основное представление для сайта. Вы можете (и мы рекомендуем) создавать дополнительные представления для фильтраций и это будет единственно правильным решением, так как у основного представления будет собираться полная статистика со всеми данными. 

Подробная информация об фильтрации и представлениях собрана в справке Google Analytics. 

Для борьбы с призраками нужно настроить фильтрацию по реальным именам хостов. 

Поскольку трафик не проходит через сайт, соответственно и имя хоста будет отличиться. 

Чтобы это сделать нужно зайти в Отчеты GA — Аудитория — Технологии — Сеть — Основной параметр “Имя хоста”.

Перед вами будет список всех хостов, оставляем только релевантные.

Для этого переходим в Администратор — Выбираем нужное представление — ФильтрыДобавить фильтрСоздать новый фильтр Тип фильтра «Пользовательский» — выбираем «Включить» — Поле фильтра «Имя хоста» — Шаблон фильтра пишем соответствующее вашему сайту регулярное выражение по типу (например, www\.hostpro\.ua|dev\.hostpro\.ua|billing\.hostpro\.ua) Нажимаем «Сохранить«.

Недостатком такого метода есть то, что можно учесть на все необходимые хосты, тем самым исказив данные. 

Выводы:

Реферальный спам не несет особого вреда кроме помех в отчётах. Стоит ли заморачиваться с фильтрацией от спам-трафика нужно определять по вашему конкретному проекту. Так если эти запросы не слишком влияют на вашу статистику и подобные явления не свойственны вашему сайту, то можно просто игнорировать спам-ботов.

Чтобы обезопасить себя от спама, достаточно время от времени дополнять BlackList. Проверять аналитику, проверять и очищать подозрительные источники. Введите эти действия в привычку и реферальный спам не будет для вас проблемой.