Il existes trois types de mesure de l’audiences d’un site internet : Une mesure orientée utilisateur (via des panels de mesure d’audience), une mesure orientée site (via le serveur du site internet) et une mesure orientée publicité (via le serveur publicitaire). Le choix de l’une on l’autre des mesures depend de la finalités : comparer avec ses concurrents ? voir le volume de publicité delivré ?

1. User centric :
Il s’agit de la mesure d’audience qualifiée de “côté utilisateurs”. Elle repose sur la constitution d’échantillons représentatifs, selon la méthode des sondages. Cette mesure permet de dénombrer et de qualifier les internautes ainsi que de décrire leur comportement. Surtout, elle permet de comparer les audiences des sites. A l’instar de la mesure de l’audience TV, elle peut se faire de plusieurs façons:
- Par enquête auprès d’un échantillon d’individus représentatifs de l’ensemble de la population du pays, pour dégager des grandes masses et définir la population globale des internautes (enquête de “calage”). Ces enquêtes sont declaratives peuvent être menées par le biais de questionnaires envoyés par e-mail aux membres des panels. Etant declaratives, les resultats sont approximatifs. En effet, le recours nécessaire à la mémoire des internautes peut manquer de fiabilité.
- Par le suivi des navigations d’un échantillon d’internautes (panel) représentatif de l’univers étudié et dont les structures sont données par l’enquête de calage. La pratique courante fait référence au mois écoulé. Sur Internet, deux opérateurs de panels coexistent : Nielsen NetRatings et NetValue. Ils disposent chacun de leur propre panel représentatif de la population des internautes à domicile. Sur le plan technique, l’ordinateur de chaque panéliste est équipé d’un logiciel capteur qui enregistre toutes les actions entreprises et les sites visités. Les données sont ensuite envoyées automatiquement et régulièrement au centre de traitement des données du prestataire.
Ces mesures ont des limites :
- Pour les sites à audience faible et moyenne la taille des panels n’est pas suffisante pour en mesurer l’audience. Un site dont l’audience est de 10 000 visiteurs par jour n’entrera pas dans un panel, ils sont plutot destines aux grands portails et aux réseaux de sites.
- Ces methods ne prennent pas en compte les internautes se connectant des pays étrangers (y compris des autres pays francophones).
- La représentativité des panels n’est pas toujours évidente
- La non prise en compte, ou l’insuffisance des mesures des connections via le lieu de travail et les universités.
2. Site Centric
La mesure de la fréquentation est une mesure faite depuis le site (depuis son serveur, la marchine qui héberge le site). On parle en de mesure “côté site”. C’est une mesure qui repose sur le comptage des connexions au site web (le nombre de requètes). Elle permet d’appréhender des volumes de trafic, exprimés en nombre de visites ou en nombre de pages vues. Il existe deux techniques :
- L’analyse directe des fichiers “logs” sur le serveur du site web : Chaque site enregistre les appels de fichiers opérés par chaque visiteur dans les fichiers ou “journaux de logs”. Les principales données pour chaque visite sont l’adresse IP du visiteur, les fichiers appelés et les horaires. Il faut ensuite passer par un outil spécifique pour exploiter ces données brutes. Le journal de log est un fichier présent sur le serveur d’hébergement qui garde la trace de toute les requêtes adressées à ce serveur.
- Le recours à un outil de mesure qui implique de marquer les pages dont on veut mesurer l’audience avec des codes (image, applet Java, cookie). Lorsqu’un visiteur charge une page ainsi encodée, un signal est envoyé sur les serveurs du prestataire de mesure d’audience qui peut ainsi comptabiliser et traiter les données relatives à cette visite. Parmis les different outils de mesures statistiques, un seul est certifié OJD : Xiti
Les limites de la mesure de la frequentation :
En l’absence de code identifiant explicitement les internautes (par le biais de mots de passe, par exemple), cette mesure ne sait reconnaître les individus. D’autre part, pour limiter le volume de données circulant sur le réseau, les FAI (fournisseurs d’accès Internet) ou les gestionnaires des grands sites installent des serveurs “proxy” qui stockent les pages les plus demandées par les utilisateurs. Le problème, c’est que l’appel à une page stockée sur le proxy ne se fait plus sur le serveur du site. Par conséquent, elle n’est pas comptabilisée dans les fichiers logs. D’où ce paradoxe typiquement “Internet” : plus une page est appelée, plus son audience est sous-estimée. Ce phénomène de cache n’est pas négligeable: il engendre une perte dans la mesure d’audience estimée selon les sites (moins pour les sites professionnels spécialisés, davantage pour un site très grand public) entre 20 et 40 %.
Aujourd’hui, la plupart des solutions proposées dans la mesure de la fréquentation comportent des mesures anti-cache qui, grâce par exemple à des codes reconnus par les proxys, permettent de comptabiliser en théorie toutes les pages vues.
3. Ad Serveur Centric
De la meme façon que les sites sont “taggés” avec des outils de mesures statistiques (tels Xiti), ils sont taggés avec des codes fournis par les régies publicitaires qui permettent d’afficher des publicités. A chaque fois qu’une page est chargée, le serveur de publicité comptabilise l’affichage. Cette method de mesure se fait selon les memes techniques que la mesure Site Centric sauf que le serveur qui comptabilise l’audience n’est pas le serveur du site mais le serveur publicitaire. Cette audience n’a pour but que de mesurer le volume publicitaire d’un site ainsi que le nombre de clics.
J’espère que cela va vous éclairer …






