Спам трафик: как исключить referral spam в Google Analytics
Реферальный спам: что это?
Реферальный спам — фальшивые запросы к сайту; обращения происходят от спам-ботов или программ, которые не взаимодействуют с сайтом. В Google Analytics они выглядят как посещения с 100% отказом и отсутствием действий на сайте.
Реферальный спам не сказывается на поисковые позиции. Поисковики на сегодняшний день научились распознавать спам-запросы и не обращают на них внимания. Однако в общей метрики они мешают получить достоверные отчёты, поэтому их лучше исключать из попадания в данные.
Различают в зависимости от поведения и источника трафика призрачный спам и краулеры.
Рассмотрим их отличия, ведь исходя из них нужно выбирать меры борьбы против них.
Призрачный спам (Ghost spam) назван так из-за того, что трафик никогда не доходит до сайта. Он приходит из Measurement Protocol (отправляет необработанные данные на Google Analytics) путем генерации кодов отслеживания. Поскольку взаимодействия с сайтом не происходит, такой спам не получится исключить благодаря .htaccess. Сделать это можно только через фильтры гугл аналитики.
Краулеры (Crawler Referrer Spam) же взаимодействуют со страницами сайта через правила в robots.txt, оставляя после себя данные в отчётах об просмотрах.
Однако, есть важное примечание:
Спам-боты не страшны сайтам, которые заботятся о своей безопасности. Это значит, что если ваш сайт имеет уязвимости, размещается у ненадежного провайдера и построен на базе CMS — ваш сайт больше подвержен подобным атакам.
Зачем спамить в Google Analytics?
Целью подобного реферального спама является обратное взаимодействие владельцев сайтов с источниками спама.
- Таким образом спамеры монетизируют переходы, собирают email-и для массовых рассылок и создания фейковых учёток.
- Спам в комментариях.
- Накрутка платных просмотров и кликов.
Как определить реферальный спам в отчетах GA?
В Google Analytics в разделе Отчеты- Источники трафика → Весь трафик → Переходы. Расширьте параметр “Дополнительный параметр” → “Имя хоста”» и отсортируйте по имени хоста.
На что нужно обращать внимание при поиске спам-запросов:
- Подозрительный домен и имя хоста (рандомные символы либо примечание «not set»).
- Показатель отказов и новые сеансы со значениями 100 и 0%.
- Дублирование значений в дополнительных параметрах.
Спам-списки в Google Analytics — можно преждевременно исключить большую часть известных спам-роботов. Установите фильтрацию по общедоступным спискам спамеров в сети.
Как исключить referral spam: фильтры Google Analytics
Исключить спам можно с помощью инструментов Google Analytics, настроив соответствующую фильтрацию.
Не стоит использовать фильтрацию к основному представлению GA, в таком случае есть риск лишить себя части нужных данных. Под фильтр выбирайте дополнительные представления.
Представление — точка доступа к отчетам с данными об ресурсе. Когда добавляется новый ресурс гугл аналитика автоматически создает основное представление для сайта. Вы можете (и мы рекомендуем) создавать дополнительные представления для фильтраций и это будет единственно правильным решением, так как у основного представления будет собираться полная статистика со всеми данными.
Подробная информация об фильтрации и представлениях собрана в справке Google Analytics.
Для борьбы с призраками нужно настроить фильтрацию по реальным именам хостов.
Поскольку трафик не проходит через сайт, соответственно и имя хоста будет отличиться.
Чтобы это сделать нужно зайти в Отчеты GA — Аудитория — Технологии — Сеть — Основной параметр “Имя хоста”.
Перед вами будет список всех хостов, оставляем только релевантные.
Для этого переходим в Администратор — Выбираем нужное представление — Фильтры — Добавить фильтр — Создать новый фильтр — Тип фильтра «Пользовательский» — выбираем «Включить» — Поле фильтра «Имя хоста» — Шаблон фильтра пишем соответствующее вашему сайту регулярное выражение по типу (например, www\.hostpro\.ua|dev\.hostpro\.ua|billing\.hostpro\.ua) Нажимаем «Сохранить«.
Недостатком такого метода есть то, что можно учесть не все необходимые хосты, тем самым исказив данные.
Выводы
Реферальный спам не несет особого вреда кроме помех в отчётах. Стоит ли заморачиваться с фильтрацией от спам-трафика нужно определять по вашему конкретному проекту. Так если эти запросы не слишком влияют на вашу статистику и подобные явления не свойственны вашему сайту, то можно просто игнорировать спам-ботов.
Чтобы обезопасить себя от спама, достаточно время от времени дополнять BlackList. Проверять аналитику, проверять и очищать подозрительные источники. Введите эти действия в привычку и реферальный спам не будет для вас проблемой.
Возможно, вас заинтересует
Представьте библиотеку, в которой хранятся миллионы книг. Чтобы знать, где искать нужный вам экземпляр,...
Если вы хотите знать, сколько посетителей заходит на ваш сайт, откуда они пришли, как...
Нерабочие, или как их еще называют битые ссылки на вашем сайте уменьшают доверие со...
Наш телеграм
с важными анонсами, розыгрышами и мемами
Присоединиться