Supprimer les référents spam de vos statistiques web

Vous avez peut-être remarqué que depuis déjà quelques temps certains sites dits « Spam Referrer » envahissent les statistiques de visites de vos site web comme par exemple darodar.com, hulfingtonpost.com, blackhatworth.com, ilovevitaly.co, ou encore simple-share-buttons.com…

Tout d’abord, qu’est-ce qu’un site « Referrer » dans vos statistiques ?

Un site Refferer (référant) est tout simplement un site source de visite qui apparaît normalement dans vos statistiques.

Qu’est-ce qu’un « Referrer Spam », « Référant Pourriel », « Ghost Referrer » ou encore « Bad robots » ?

Il ne s’agit pas de vraies visites. L’objectif de ces sites est uniquement de vous inciter à les visiter.

Il en existe deux sortes :

  • Les Robots qui scannent les sites web afin d’être indexés par les moteurs de recherche
  • Les Référent Fantôme qui simulent des visites afin d’apparaître dans vos statistiques.

Plusieurs manières assez simples de les identifier :

  • Vérifier leur nom de domaine. Bien souvent, il est assez proche de site connus. Par exemple le nom de domaine theguardlan.com est très proche de theguardian.com,
  • Le nombre important de visites qu’ils génèrent dans vos stats,
  • Le taux de rebond de 100% malgré un grand nombre de visites…

Il existe un bon nombre de méthodes pour bloquer ces sites, en voici quelques unes :

Solution 1 : Les Filtres de Google Analytics prédéfinis

Rendez-vous tout d’abord dans le compte Google Analytics correspondant à votre site

  • « Admin »
  • « Vue »
  • « Paramètres de la vue »

filtre-analytics-1.2

Vous trouverez ensuite en bas de la page l’option a cocher

  • « Exclure tout les appels provenant des robots connus »

Cette solution vous permettra d’éliminer certaines visites polluantes. Cela fonctionnera au moins pour les robots (bad robots) qui sont déjà connus et répertoriés chez google. Malheureusement, cela ne fonctionnera pas, pour le moment, pour ceux qui sont les plus agressifs actuellement.

Solution 2 : le fichier .htaccess

Le fichier .htaccess est un fichier généralement situé à la racine de votre site (sur un serveur web Apache) et sert notamment à réécrire les URLs.

Ce ficher peut également être très utile dans ce genre de cas afin d’empêcher l’accès de ces « bad robots ».

# Block Referrer Spam
order allow,deny
allow from all
deny from adresse-ip
deny from ledomaine.com

Autre méthode :
pour 1 site référent :

RewriteEngine on
RewriteCond %{HTTP_REFERER} ledomaine\.com [NC]
RewriteRule .* - [F] 

pour plusieurs sites référents :

RewriteEngine on
RewriteCond %{HTTP_REFERER} ledomaine\.com [NC,OR]
RewriteCond %{HTTP_REFERER} deuxiemedomaine\.com [NC,OR]
RewriteCond %{HTTP_REFERER} troisiemedomaine\.com [NC]
RewriteRule .* - [F] 

Solution 3 : Créer des Filtres Personnalisés dans Google Analytics

filtre-analytics-2filtre-analytics-2.2

Il est possible de faire disparaître ces visites de vos statistiques en les filtrant.

Rendez vous pour cela dans la partie « Filtres » de l’Administration de votre compte Google Analytics, choisissez un titre pour ce filtre comme par exemple « Exclure les sites Referrer Spam » et entrez la ou les URL(s) dans la partie Règle de filtrage (en les séparant par | chaque domaine) puis validez.

Afin d’exclure toutes les extensions possibles d’un domaine (et non juste le .com par exmple), il suffit simplement d’écrire \. à la fin du domaine concerné (à la place du .com).

Voici donc un exemple de règle de filtre : simple-share-buttons.com|blackhatworth\.|ilovevitaly\.|darodar …

Solution 4 : Créer des Segments dans Google Analytics

Une autre méthode de filtre consiste à créer des Segments, soit depuis l’administration de votre compte, soit directement dans le tableau de vos statistiques. Cela vous permettra de masquer les visites dont vous aurez défini les source, sur un simple clic.

Voici un exemple de configuration de Segment par source voir même par pays (même s’il est peu envisageable de filtrer un pays tout entier), que vous pourrez configurer et adapter en fonction des référents qui vous polluent : https://www.google.com/analytics/web/template?uid=4mhFZ92XTiKQ5dZlWzGhKA

filtre-analytics-3filtre-analytics-3.2

Depuis l’Admin de votre compte ou directement depuis votre tableau de visites

  • Cliquez sur « Créer un Segment » et attribuer un nom tel que « Bad bots » ou « Filtre Referrer Spam » par exemple.
  • Condition
  • Ajouter un Filtre
  • Session
  • Exclure

Exemples :

  • Support / Source : simple-share-buttons.com / referral
  • Source : darodar.com

segmentIl ne vous restera ensuite plus qu’à Enregistrer et Appliquer ce(s) filtre(s).

Vous verrez alors apparaître une nouvelle courbe qui correspond aux sites référents que vous aurez sélectionné.

filtre-analytics-4
filtre-analytics-4.2

Conclusion

Il faut savoir que certaines de ces techniques de spam sont nouvelles et aussi qu’elles évoluent.

Chaque méthode est valable et a des avantages et des inconvénients. En résumant :

  • L’inconvénient des méthodes de Filtres de statistiques est qu’elles n’empêcheront pas, pour le cas des robots, de consommer de la bande passante sur votre hébergement.
  • L’avantage des Segment est qu’en enrichissant vos listes au fur et à mesure, vous pourrez observer la progression de ces visites pourriel sur votre site (méthode la plus simple et efficace) et ainsi, si cela devient vraiment trop envahissant (ou agressif), passer à une méthode de blocage par htaccess.
  • Le gros avantage des blocages via le fichier htaccess est que cela bloque toute les visites source que l’on a défini, qu’elles proviennent d’un robot, d’un site réel ou d’une source fantôme (attention toutefois à ne pas bloquer vos visiteurs réels).