Спам трафік: як виключити referral spam в Google Analytics

Реферальний спам: що це?

Реферальний спам – фальшиві запити до сайту; звернення відбуваються від різних спамерських пошукових роботів або програм, які не взаємодіють з сайтом. В Google Analitics вони виглядають як відвідування з 100% відмовою і відсутністю дій на сайті.

Реферальний спам не позначається на пошукові позиції. Пошуковики сьогодні навчилися розпізнавати спам-запити та не звертають на них уваги. Однак в загальній метриці вони заважають отримати правдиві звіти, тому їх краще виключати з даних.

Розрізняють в залежності від поведінки й джерела трафіку примарний спам і краулери.

Розглянемо їх відмінності, оскільки, виходячи з них, потрібно вибирати заходи боротьби проти них.

Примарний спам (Ghost spam) названий так через те, що трафік ніколи не доходить до сайту. Він приходить з Measurement Protocol (відправляє необроблені дані на Google Analytics) шляхом генерації кодів відстеження. Оскільки взаємодії із сайтом не відбувається, такий спам не вийде виключити завдяки .htaccess. Зробити це можна тільки через фільтри гугл аналітики.

Краулери (Crawler Referrer Spam) ж взаємодіють зі сторінками сайту через правила в robots.txt, залишаючи після себе дані в звітах про перегляди.

Однак, є важливе зауваження:

Спам-боти не страшні сайтам, які піклуються про свою безпеку. Це означає, що якщо ваш сайт має вразливості, розміщується у ненадійного провайдера і побудований на базі CMS – ваш сайт більше вразливий до подібних атак.

Навіщо спамити в Google Analytics?

  • Метою подібного реферального спаму є зворотна взаємодія власників сайтів з джерелами спаму.
  • Таким чином спамери монетизують переходи, збирають email-и для масових розсилок і створення фейкових облікових записів.
  • Спам в коментарях.
  • Накрутка платних переглядів і кліків.

Як визначити реферальний спам в звітах GA?

У Google Analytics в розділі Звіти- Джерела трафіку → Весь трафік → Переходи. Розширте параметр “Додатковий параметр” → “Ім’я хосту” »і відсортуйте за ім’ям хосту.

На що потрібно звертати увагу при пошуку спам-запитів:

  • Підозрілий домен та ім’я хосту (рандомні символи або примітка «not set»).
  • Показник відмов і нові сеанси зі значеннями 100 і 0%.
  • Дублювання значень в додаткових параметрах

Спам-списки в Google Analytics – можна передчасно виключити більшу частину відомих спам-роботів. Встановіть фільтрацію по загальнодоступному списку спамерів в мережі.

Як виключити referral spam: фільтри Google Analytics

Виключити спам можна за допомогою інструментів Google Analytics, налаштувавши відповідну фільтрацію.

Не варто використовувати фільтрацію до основного подання GA, в такому випадку є ризик позбавити себе частини потрібних даних. Під фільтр вибирайте додаткові уявлення.

Подання – точка доступу до звітів з даними про ресурс. Коли додається новий ресурс гугл аналітика автоматично створює основне представлення для сайту. Ви можете (і ми рекомендуємо) створювати додаткові представлення для фільтрації та це буде єдино правильним рішенням, тому що в основного представлення буде збиратися повна статистика з усіма даними.

Детальна інформація про фільтрацію і представлення зібрана в довідці Google Analytics.

Для боротьби з примарами потрібно налаштувати фільтрацію за реальними іменами хостів.

Оскільки трафік не проходить через сайт, відповідно і ім’я хосту буде відзначитися.

Щоб це зробити потрібно зайти в Звіти GA АудиторіяТехнологіїМережа – Основний параметр “Ім’я хосту“.

Перед вами буде список всіх хостів, залишаємо тільки релевантні.

Для цього переходимо в Адміністратор – Вибираємо потрібне представлення – ФільтриДодати фільтр Створити новий фільтр – Тип фільтра “Для користувача” – вибираємо “Включити” – Поле фільтру “Ім’я хосту” – Шаблон фільтру пишемо відповідний до вашого сайту регулярний вираз (наприклад, www\.hostpro\.ua|dev\.hostpro\.ua|billing\.hostpro\.ua) Натискаємо “Зберегти“.

Недоліком такого методу є те, що можна врахувати на всі необхідні хости, тим самим спотворивши дані.

Висновки:

Реферальний спам не несе особливої шкоди крім перешкод в звітах. Чи варто морочитися з фільтрацією від спам-трафіку потрібно визначати за вашим конкретним проектом. Так якщо ці запити не надто впливають на вашу статистику і подібні явища не властиві вашому сайту, то можна просто ігнорувати спам-ботів.

Щоб убезпечити себе від спаму, досить час від часу доповнювати BlackList. Перевіряти аналітику, перевіряти і очищати підозрілі джерела. Введіть ці дії в звичку і реферальний спам не буде для вас проблемою.