Interpréter ses statistiques
Principes de fonctionnement
Dès qu'un visiteur accède à votre site, un programme sur le serveur enregistre un certain nombre d'informations dans ce qu'on appelle un "fichier log".
Y figurent le plus souvent :
- l'adresse IP du visiteur.
- la date de la visite.
- le fichier téléchargé (page html, image,etc.).
- le code d'erreur (comme le fameux "404" pour une page non trouvée, ou "200" si tout s'est bien passé).
- la taille du fichier envoyé.
- l'URL de la page de provenance, ou "referer".
- le navigateur et le système d'exploitation du visiteur.
Une ligne (il s'agit d'un fichier texte) pourra ressembler à ceci :
213.41.85.243 - [25/Apr/2002:17:12:25 +0100] "GET /_icono/icono_homep/h_logo_tet.gif HTTP/1.1" 200 1791 http://www.ifrance.com/ "Mozilla/4.0 (compatible; MSIE 6.0; Windows 98)"
Ces données brutes doivent évidemment être traitées par un programme pour les rendre exploitables. Les informations statistiques comprennent :
- le nombre de hits, c'est-à-dire de requêtes à chaque fichier.
- le nombre de visites, de pages vues au cours d'une session.
- le nombre de visiteurs ; on connaît également leur provenance, leur configuration et leur origine géographique (selon leur adresse IP).
- les pages vues, c'est-à-dire chargées en totalité.
Le nombre de visiteurs uniques et de pages vues par visite peut également être calculé.
L'analyse des données
Ces données sont généralement anlysées sur le serveur de votre hébergeur, qui vous les fournit.
Vous pouvez en tirer de nombreux enseignements :
- un nombre de visite très bas doit vous inciter à revoir votre référencement.
- un nombre peu important de pages vues peut-être le signe d'un manque d'ergonomie ou de contenu.
- le "referer" vous permet de savoir de quelle façon on accède à votre site, et d'en tirer des conséquences sur son contenu ou son référencement, d'envisager d'augmenter les échanges de liens, etc.
- les erreurs "404" vous disent quelles pages demandées ont disparu (ou ne sont pas à leur place).
- la configuration matérielle et logicielle de vos visiteurs permet de savoir si votre site est adapté aux principales configurations.
Les outils
L'analyse de fichiers logs permet donc d'obtenir facilement les chiffres essentiels sur la fréquentation de votre site.
Mais dès qu'un site commence à générer un certain trafic, ce type de statistiques devient moins fiable, du fait des phénomènes de cache : les pages les plus visitées peuvent être stockées sur des serveurs proxy (le visiteur charge une page sans passer par le serveur d'hébergement, donc sans être comptabilisé dans les log. Il peut également recharger une page qui se trouve dans le cache de son disque dur, avec les mêmes conséquences).
Il existe d'autres outils de statistiques, appelés marqueurs, qui contournent cet inconvénient. Un code est inséré sur chaque page, qui appelle une image (elle peut être invisible quand le service est payant) située sur un serveur distant qui enregistre et traite les informations de log. Elles sont souvent plus complètes que celles générées par le serveur d'hébergement.
Ces services peuvent par exemple analyser :
- le parcours des visiteurs.
- les pages d'entrée et de sortie de votre site.
- des ratios tels que le nombre de visites sur une seule page et de pages vues par visite.
- les visites de plus d'une page.
- la durée des visites.
- la résolution d'écran des visiteurs, etc.