Questions récurrentes avec Google Analytics - Session 2 - Echantillonnage | Publications

Quand parle-t-on d’échantillonnage avec GA?

Notions d’échantillonnage dans le web analytics

Ne concernant que peu de sites il y a quelques années, l’échantillonnage en impacte aujourd’hui un bien plus grand nombre, influencant le travail analytique de nombreux praticiens au quotidien. En effet, avec la digitalisation croissante, la multiplication des points de contact et le développement de techniques complexes de mesure, le nombre d’interactions digitales a explosé ces dernières années. Votre site web génère tellement de données que votre outil web analytics est obligé de n’en traiter qu’une partie et se voit obligé d’extrapoler l’information s’il veut produire des rapports en un temps raisonnable. C’est ce qu’on appelle justement l’échantillonnage.

Qu’est ce qu’un hit?

En web analytics, l’échantillonnage est étroitement lié à la notion de hit. Un hit est une interaction qui produit des données qui vont être envoyées a votre outil web analytics. Techniquement, chaque fois que votre code se charge sur une page, une information est envoyée à un serveur de collecte des données. Une fois stockée, cette information est ensuite envoyée à votre outil d’analyse. Dans Google Analytics, les types de hits les plus communs sont :

  • Page vue
  • Evènements
  • Transactions
  • Interactions sociales

Comment fonctionne l’échantillonnage dans Google Analytics?

Google analytics fixe une limite à 10 millions de hits par mois et par propriété. Il est important de savoir que chaque vue associée à une propriété créera un ensemble de tables de données non échantillonnées et pré-aggrégées qui seront ensuite traitées quotidiennement. Concrètement, cela signifie que les rapports standards tels que “audience”,”tout le trafic” ou “contenu du site” resteront non-échantillonnés.

Cependant, très souvent, ces rapports standards ne sont pas suffisants pour les utilisateurs de Google Analytics. Par exemple, vous pourriez avoir besoin de segmenter certaines données pour isoler les utilisateurs qui génèrent la majorité des revenus. Dans ce cas précis, il faut faire une requête ad-hoc à Google Analytics. Les actions les plus communes menant à un échantillonnage sont les suivantes :

  • Ajouter une dimension secondaire
  • Appliquer un filtre
  • Appliquer un segment spécifique
  • Créer un rapport personnalisé

Prenons un exemple concret.

Dans l’aperçu ci-dessous, j’ai pris le rapport des trois derniers mois pour l’ensemble du trafic d’un client Semetis. Comme vous pouvez constater, les données ne sont pas échantillonnées et le rapport est basé sur 100% des sessions.

sampling1

Dans le second aperçu, j’ai appliqué un segment au même rapport afin d'isoler le trafic mobile. Le rapport est maintenant basé sur 14% des sessions et est échantilloné.

sampling2

L’échantillonnage n’est pas mauvais en soit si vous pouvez toujours faire confiance à un nombre substantiel de vos observations (70 à 90%). Par contre, en dessous de 10%, l’interprètation peut être dangereuse et menée à des conclusions erronnées.

Existe-t-il une solution?

Solution 1: Adapter votre période de temps

Lorsque vous faites des analyses sur une longue période de temps (plus d’un an), divisez votre analyse en période plus courtes (par exemple mois par mois). Vous pouvez ensuite utiliser excel ou une feuille de calcul Google pour aggréger vos données.

Solution 2: Travailler avec l’API de Google Analytics

Une autre solution consiste à utiliser l’API de GA quand vous pouvez configurer précisement la date et la période de temps que vous souhaitez (par exemple chaque jour) et retravailler ensuite les données avec une feuille de calcul. Gardez à l’esprit que les requêtes vers l’API sont limitées à 50.000 hits par jour and 10.000 lignes par requête.

Solution 3: Passez à Google Analytics Premium

Si vous utilisez constamment des données échantillonnées, pensez à utiliser Google Analytics Premium. L’un des avantages de cette version est la possibilité de traiter jusqu’à 20 milliards de hits et de pouvoir exporter jusqu’à 3.000.000 de lignes par requête. La bonne nouvelle est que Semetis est revendeur officiel de Google Analytics Premium. N’hésitez pas à nous contacter.

Auteur: Stéphane Juricic

 

 

 

Tags:

Prenez Contact

Semetis | 44 Rue des Palais, 1030 Bruxelles - Belgique

+32 (0)2 211 34 50

welcome@semetis.com

Connectez-vous