24 mai 2006

Statistiques Web : La perfection n'existe pas

Hits, session d'utilisateur, visiteur, fichier, site, pages vues et visiteurs unique sont tous des termes employés dans les outils de statistiques Web. La plupart de de ces outils ne sont pas adéquats ou mal configuré.

Les chiffres obtenus peuvent souvent varié du simple au quintuple (et plus) selon les solutions employées. Voyons les 2 principales méthodes d'acquisition des statistiques :

Fichiers journaux (log files analyzer)

L'ancêtre des métriques Web. Le fichier journal est un fichier contenant les connexions demandées par les utilisateurs d'un site Web. Logeant sur le seveur Web, ce fichier comprend diverses informations comme; l'adresse IP, la date et l'heure, le document demandé, les code de statut du transfert, le nombre de kilo-octets transféré, etc.
[127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326]
À partir de chacune de ces lignes d'entrée du fichier journal, le logiciel d'analyse nous brosse des rapport un peu plus conviviaux.

Avantages
  • Peu onéreux
  • Souvent installé par défaut chez les hébergeurs
  • Archivage simple
  • Consultation sur la période souhaitée
  • Détection aisé des erreurs de transfert et précision de la bande passante utilisée
  • Rapport configurable à souhait
  • Contournement aisé des murs coupe-feu
Inconvénients
  • Sur des sites à grand trafic, le temps d'analyse des fichier journaux peut-être très long
  • L'analyse des fichiers doit être fait sur un réseau interne contenant aussi un serveur de noms de domaine
  • Assez grande imprécision des statistiques dû aux serveurs cache des FAI
  • Difficilement configurable pour sites à serveurs multiples
  • Mauvaise détection des utilisateurs versus robots indexeurs
  • Rapport statistiques pas toujours conviviaux pour tous
  • Mauvaise interprétation des adresses IP dynamiques

Système d'étiquetage
(tags, web beans)

Les statistiques par étiquettes utilise un petit code javascript qu'on insère sur chaque page du site. Ceci permet de faire la lecture des informations au niveau du client Web et non plus au niveau du serveur du site. La plupart des ces solutions utilise aussi un/des cookie(s) enregistré sur l'ordinateur du client.

Avantages
  • Suivit possible en temps réel
  • Permet d'avoir beaucoup plus d'informations sur le client
  • Consultation aisée selon l'outil utilisé
  • Erreurs de transfert et précision de la bande passante utilisée
  • Contournement aisé des proxy
  • Permet des statistiques sur un réseau de sites grâce aux cookies
  • Filtrage automatique des robots
Inconvénients
  • Impossible d'obtenir des statistiques si le navigateur a son JavaScript désactivé
  • Mesures déficientes si l'anti-virus (ou autre système de sécurité) du client bloque les cookies
  • Les murs coupe-feu (firewalls) peuvent bloquer les étiquettes
  • Les temps de réponses des serveurs distants peuvent altérer les statistiques
  • Pas facilement configurable dans les zones sécurisés
  • Erreurs dans les pages plus difficilement détectables
  • Origine exacte du référants pas toujours disponible
Conclusion

Le système par étiquetage est tout de même mieux que la seule analyse des fichiers journaux. Idéalement le tracking des étiquettes devrait être implanté sur le même serveur où se situe le site Web, ce qui est rarement le cas.

Cybermétrie idéale

La cybermétrie idéale combine les deux solutions ci-haut et même avec deux systèmes d'étiquetage différents et une solution d'analyse des fichiers journaux.

Technorati Tags: , , , , ,

19 mai 2006

Interview Vidéo

Petite interview que j'ai donné au collègue Philippe Martin co-réalisé par l'ami Aubry et sa nouvelle entreprise Économie Logique Communication. Bravo les mecs, rendu très professionnel et expérience agréable en quelques 15 minutes ! Encore chapeau !


Eric Baillargeon-Intercommunication
Vidéo envoyée par pmartin

18 mai 2006

MCeTech 2006

Aujourd'hui petite sortie pour aller voir une présentation de l'ami Michel Leblanc d'Analyweb à la conférence montréalaise sur les Technologies de l’Internet à l'hotel Godin où ce tient jusqu'à demain encore le MCeTech2006 - Montreal Conference on e-technologies. Je crois que l'audience a bien aimé la vulgarisation et la démystification de l'optimisation Web fait par Michel, et cette petite photo en fait foi.



Technorati Tags: , ,

15 mai 2006

Skype va faire enrager les Telco

Skype annonce aujourd'hui la gratuité des appels de PC à téléphone filaire ou cellulaire, partout* au Canada et aux États-Unis.

*M'enfin presque partout, car plusieurs FAI (Fournisseurs d'Accès Internet) comme le mien, ne semble pas reconnus par Skype qui doit vérifier les adresses IP géographiques avant d'établir la communication ;-(

Technorati Tags: , ,

14 mai 2006

Yahoo existe... mais surtout aux États-Unis

Voici un petit billet pour répondre à Martin sur le fait que Yahoo et MSN soit pratiquement totalement absent de ses statistiques.

Voici les statistiques de mes trois carnets sur Blogger suivit d'un site bilingue de commerce électronique.

Le premier est mon carnet dans la langue de Shakespeare et le second dans celle de Molière. Yahoo n'aime pas spécialement Molière.

Le troisième est un carnet photo français mais presque sans texte, et le quatrième est un site bilingue de commerce électronique où 35% des ventes sont faîtes au États-Unis.

Mes interprétations
  • C'est bien connu, Yahoo et MSN ne font pas le poids hors des États-Unis et spécialement en Europe et en Asie (sauf le Japon pour Yahoo).
  • La façon dont Blogger publie les billets, -en utilisant le titre comme nom de fichier et de balise Title-, favorise les référents Google car Yahoo, lui, ne leur accorde pas beaucoup d'importance.
  • Le marché publicitaire de Yahoo est en très grande majorité anglophone et américain.
  • Le seul autre endroit où Yahoo perce un peu le marché est le Japon.
Tu devrais mettre ton carnet anglais sour Analytic aussi Martin. Comme tes billets sont souvent assez long, tu devrais voir le pourcentage de Yahoo augmenté sur celui-là.

13 mai 2006

Achats de groupe éclair : Tuangou : 队购买

Tuangou (队购买) signifie achat de groupe ou "team purchase" en chinois. C'est un style de réunion-éclair (FlashMobilization) pour faire des achats en groupe pour pouvoir marchander.

Le modèle d'achat groupé n'est pas nouveau sur la toile et pendant la bulle internet plusieurs sites offraient un peu ce modèle, mais ils ont presque tous disparus.

Les Chinois ont repris le modèle

Le Tuangou peux se faire de deux façons. À la FlashMob en utilisant des forums ou carnets pour déterminer le lieu et le moment de l'achat ou par des sites web spécialisés locaux comme celui de la ville de Guangzhou (10,000 membres) qui eux s'occuperont d'envoyer des négociateurs à l'avance au magasin pour déterminer l'escompte et/ou les primes gratuites et qui se prendront une commission.

En tapant "Tuangou" dans Google.com ou même Google.cn, on obtient 302,000 résultats.

Via le Christian Science Monitor !

10 mai 2006

Google Trends


Google Trends a été lancé aujourd'hui à la conférence annuelle des médias Press Day.
Ce nouveau service présente les données statistiques des tendances à la sauce Web 2 avec une interface similaire mais un peu moins évoluée que Google Finance. La partie supérieure affiche les recherches effectuées sur les mots-clés entrés tandis que la partie inférieure montre le volume des nouvelles .

Outil de comparaison

Une des fonctionnalités intéressantes est la possibilité de comparer jusqu'à 5 expressions clés avec cet outil.

Cet outil pourrait être très utile pour les analystes et les gens de marketing, mais malheureusement l'échantillonage semble un peu faible et surtout pas toujours crédible surtout si l'on regarde le graphe suivant pour les villes !

Par contre pour les journaliste et carnetiers ce sera un très bon atout pour suivre les tendances comme le montre le premier graphe de ce billet.

Technorati Tags:

AlltheWeb 2

AlltheWeb qui a vu le jour pratiquement en même temps que Google et qui était un sérieux compétiteur d'AltaVista à l'époque renait de ses cendres sous le vocable AlltheWeb LiveSearch. Overture avait acquis AlltheWeb en 2003 et avait été ensuite avalé par Yahoo.

La nouvelle fonctionnalité pousse un peu plus loin le même principle que Google Suggest et affiche en temps réel les résultats lors de l'entrée des caractères dans la case de recherche.

Technorati Tags: , ,

9 mai 2006

Rayonnement Web : Le jardinage et recyclage du contenu

Pour avoir un trafic en constante augmentation sur un site Web, il faut l'entrenir et le jardiner. L'émondage aide l'arbre pour qu'il profite bien. On doit tailler les branches faibles ou poussant dans une mauvaise direction pour favoriser le bon développement de l'arbre. Je viens d'ailleur de livrer une analyse à un de mes clients pour qu'il "émonde" un peu son site. Les liens et sujets partent dans toutes les directions et sur plusieurs de ses pages il y beaucoup trop de liens.

Il y a beaucoup de similitude entre un site Web et un sapin de Noël. Les racines et le tronc sont le serveur Web et l'architecture, les branches sont les liens, les aiguilles sont le contenu et les guirlandes sont les publicités. Comme l'émondage réel, les branches et aiguilles doivent être recyclés pour pouvoir faire un bon terreau. Le terreau Web s'appelle : Archive. Une chose tellement rare sur la toile !

Le danger avec les jardiniers du Web c'est qu'ils ont tendance à surcharger les aiguilles (contenu) de guirlandes (publicité) et on a de la misère à les voir. Ceci risque de mettre le sapin à la rue. Donc, j'essaie de lui faire un beau terreau où il pourra aussi mettre des guirlandes.

SkypeCast : Oui mais....

Il y a exactement une semaine Skype dévoilait ses SkypeCasts. Ce sont des appels conférence relié autour d'un thème et peuvent ralié jusqu'à cent utilisateurs à la fois.
Comme j'utilise Skype pour des appels conférence à trois ou quatre pratiquement tous les jours, je connais bien ces forces et faiblesses. Les principaux problèmes des utilisateurs de Skype sont le non-emploi d'un casque d'écoute avec micro intégré ou l'utilisation d'un casque de piètre qualité ce qui créer des retours de son irritants ou des grichements harrasants. C'est exactement ce qui a irriter Francis Pisani à son baptème.

Les SkypeCasts fonctionne tout de même assez bien. Ils permettent à l'initiateur de rendre muet un ou toutes les personnes d'une discussion et même d'éjecter les indésirable. Par contre, comme les SkypeCasts sont un service Web et non un programme, la fenêtre de commande disparait à chaque utilisation d'un autre logiciel sur son ordinateur. Contrairement aux messageries instantanés, il ne peut y avoir de fonction pour garder cette fenêtre en avant-plan.

J'en tiendrai donc un petit de 11h à 11h30 (GMT -05:00) sur le rayonnement Web ce matin.

3 mai 2006

Rumeurs : Microsoft et Yahoo contre Google qui lui convoite Olive

Rumeur de CNN money qui mentionnerait un achat massif d'actions d'actions de Yahoo par Microsoft ! Huuuum ? Il y a des fois que la lecture de carnets semble plus raisonnable.

Il serait très surprenant que Bill investisse dans Yahoo après les centaines de millions qu'il a investit dernièrement dans le peaufinement de son moteur et dans son futur réseau publicitaire pour concurrencer les GY !

Google, lui semble vouloir faire un merveilleux coup avec Olive Software ! Les débouchés pour Google Catalog, Google Print et Google tout court semblent assez évident !

Technorati Tags: , , ,

2 mai 2006

Un Carnet de plus de 28 millions de VU et un minimum de 1,000 commentaires par billet

Elle tient carnet depuis un gros six mois. Depuis fin octobre 2005 le carnet nous indique un décompte de plus de 28 millions de visites. Ouille ! BoingBoing fait finalement pitié !

Le carnet attire en moyenne de 100,000 à 400,000 pages lues par billet. Et ici, le système de statistique des carnets de Sina ne semble comptabiliser que le 2eme clique de souris contrairement à la grande majorité des statistiques absolument gonflées que je vois sur la Web où en moyenne 5 pages vues équivaut à un visiteur unique (VU) quand la norme depuis 6 ans est habituellement de 1,5 pages à 2 pages vues par VU.
Ces billets génèrent en moyenne de 1,000 à 4,000 commentaires !

Oui elle jolie actrice mais spécialement une chinoise.

La censure chinoise : Politique oui mais...

Évidemment comme dans quasiment tous les pays non-occidentaux il y a de la censure en Chine, mais il y a aussi de plus en plus de déb(o|a)uchées pour les audacieuses !

PS: Les fils RSS sont un des meilleurs outils anti-censure à l'heure actuelle pour nos amis de l'est !