Спам трафик: как исключить referral spam в Google Analytics

Реферальный спам: что это?
Реферальный спам — фальшивые запросы к сайту; обращения происходят от спам-ботов или программ, которые не взаимодействуют с сайтом. В Google Analitics они выглядят как посещения с 100% отказом и отсутствием действий на сайте.
Реферальный спам не сказывается на поисковые позиции. Поисковики на сегодняшний день научились распознавать спам-запросы и не обращают на них внимания. Однако в общей метрики они мешают получить достоверные отчёты, поэтому их лучше исключать из попадания в данные.
Различают в зависимости от поведения и источника трафика призрачный спам и краулеры.
Рассмотрим их отличия, ведь исходя из них нужно выбирать меры борьбы против них.
Призрачный спам (Ghost spam) назван так из-за того, что трафик никогда не доходит до сайта. Он приходит из Measurement Protocol (отправляет необработанные данные на Google Analytics) путем генерации кодов отслеживания. Поскольку взаимодействия с сайтом не происходит, такой спам не получится исключить благодаря .htaccess. Сделать это можно только через фильтры гугл аналитики.
Краулеры (Crawler Referrer Spam) же взаимодействуют со страницами сайта через правила в robots.txt, оставляя после себя данные в отчётах об просмотрах.
Однако, есть важное примечание:
Спам-боты не страшны сайтам, которые заботятся о своей безопасности. Это значит, что если ваш сайт имеет уязвимости, размещается у ненадежного провайдера и построен на базе CMS — ваш сайт больше подвержен подобным атакам.
Зачем спамить в Google Analytics?
Целью подобного реферального спама является обратное взаимодействие владельцев сайтов с источниками спама.
- Таким образом спамеры монетизируют переходы, собирают email-и для массовых рассылок и создания фейковых учёток.
- Спам в комментариях.
- Накрутка платных просмотров и кликов.
Как определить реферальный спам в отчетах GA?
В Google Analytics в разделе Отчеты- Источники трафика → Весь трафик → Переходы. Расширьте параметр “Дополнительный параметр” → “Имя хоста”» и отсортируйте по имени хоста.
На что нужно обращать внимание при поиске спам-запросов:
- Подозрительный домен и имя хоста (рандомные символы либо примечание «not set»).
- Показатель отказов и новые сеансы со значениями 100 и 0%.
- Дублирование значений в дополнительных параметрах.
Спам-списки в Google Analytics — можно преждевременно исключить большую часть известных спам-роботов. Установите фильтрацию по общедоступным спискам спамеров в сети.
Как исключить referral spam: фильтры Google Analytics
Исключить спам можно с помощью инструментов Google Analytics, настроив соответствующую фильтрацию.
Не стоит использовать фильтрацию к основному представлению GA, в таком случае есть риск лишить себя части нужных данных. Под фильтр выбирайте дополнительные представления.
Представление — точка доступа к отчетам с данными об ресурсе. Когда добавляется новый ресурс гугл аналитика автоматически создает основное представление для сайта. Вы можете (и мы рекомендуем) создавать дополнительные представления для фильтраций и это будет единственно правильным решением, так как у основного представления будет собираться полная статистика со всеми данными.
Подробная информация об фильтрации и представлениях собрана в справке Google Analytics.
Для борьбы с призраками нужно настроить фильтрацию по реальным именам хостов.
Поскольку трафик не проходит через сайт, соответственно и имя хоста будет отличиться.
Чтобы это сделать нужно зайти в Отчеты GA — Аудитория — Технологии — Сеть — Основной параметр “Имя хоста”.
Перед вами будет список всех хостов, оставляем только релевантные.
Для этого переходим в Администратор — Выбираем нужное представление — Фильтры — Добавить фильтр — Создать новый фильтр — Тип фильтра «Пользовательский» — выбираем «Включить» — Поле фильтра «Имя хоста» — Шаблон фильтра пишем соответствующее вашему сайту регулярное выражение по типу (например, www\.hostpro\.ua|dev\.hostpro\.ua|billing\.hostpro\.ua) Нажимаем «Сохранить«.
Недостатком такого метода есть то, что можно учесть не все необходимые хосты, тем самым исказив данные.
Выводы:
Реферальный спам не несет особого вреда кроме помех в отчётах. Стоит ли заморачиваться с фильтрацией от спам-трафика нужно определять по вашему конкретному проекту. Так если эти запросы не слишком влияют на вашу статистику и подобные явления не свойственны вашему сайту, то можно просто игнорировать спам-ботов.
Чтобы обезопасить себя от спама, достаточно время от времени дополнять BlackList. Проверять аналитику, проверять и очищать подозрительные источники. Введите эти действия в привычку и реферальный спам не будет для вас проблемой.
Возможно, вас заинтересует
Для того чтобы ваш сайт был в топе в поисковой выдаче, он должен соответствовать...
10 ноября 2020 Google анонсировал, что в мае 2021-го будет запущен новый сигнал ранжирования...
Вы думаете, что настроить передачу данных из Google Sheets в Telegram – это сложно?...