J’en ai déjà parlé dans plusieurs billets, dont celui sur les ajouts indispensables à votre navigateur internet et dans mon manuel de protection de la vie privée, la majeure partie des sites traque l’activité de l’internaute qui le visite. Ce blog-ci n’échappe pas à la règle, utilisant deux outils de ce type (en plus des boutons des réseaux sociaux, mais j’y reviendrai dans un billet ultérieur). Tout simplement déjà pour savoir combien de visites je reçois, et quels articles sont lus. Plusieurs fois déjà on m’a posé la question pourquoi j’utilisais ces outils, appartenant à des compagnies plutôt que des outils de traques sous licence libre, tels que piwik. Je voulais donc, par soucis de transparence vous expliquer pourquoi, et vous montrer quelles informations je récolte.
Avant: Webalizer
Sur mon ancien serveur, j’utilisais un outil de traçage appelé Webalizer. Il était très puissant, et son avantage est qu’il est programmé en langage C. Sa grande force, hébergeant plusieurs sites internet sur une seule machine, était qu’il analysait tout le traffic du serveur web, sans que j’aie rien à faire. Mais je le trouvais trop intrusif: récolte de toutes les adresses IP (votre adresse internet, comme si c’était une adresse postale), le système d’exploitation, le navigateur,… Lorsque j’ai changé de machine, je ne l’ai pas réinstallé: certains sites appartenaient à des amis, je pouvais voir toute l’activité de leurs visiteurs sans leur consentement, et je ne trouvais pas cela très honnête de le faire sans un quelconque consentement (et cela ne leur laissait aucun choix de toute façon).
Premier outil sur le blog: StatCounter
Lorsque j’ai commencé timidement à faire ce blog-ci, début 2012, je voulais néanmoins garder un outil qui m’indique le nombre de visites. J’ai trouvé un petit outil qui s’installe via un plugin wordpress, appelé StatCounter. Il existe en version gratuite (celle que j’utilise) et une version payante, permettant beaucoup plus de choses. Ma méthode d’utilisation est très simple: je reçois un mail hebdomadaire le dimanche soir, m’indiquant le nombre visites, le nombre de clics. J’ai une indication sur les premières visites d’un internaute ou si c’est un visiteur récurrent. Voici une capture d’écran des informations que je reçois par mail:
Les stats de wordpress.com
L’autre outils de statistiques que j’utilise est l’outil de statistique fourni avec le gros plugin Jetpack pour wordpress. Ce gros plugin permet beaucoup de choses, dont relier son blog avec le réseau de blogs wordpress, et de pouvoir utiliser les statistiques de visites. Cela me permet d’avoir plus d’informations: le nombre de personnes abonnées à mon blog, et la raison essentielle pour laquelle j’ai décidé d’utiliser cet outil de statistique est que je peux voir le nombre de lecture par article, ainsi que d’où viennent la majorité des internautes. Par contre, il ne prend pas en compte certains clics ne faisant pas partie du programme du blog. Pour tout vous dire, je ne sais absolument pas combien de fois mon manuel de la vie privée a été téléchargé! Voici donc une capture d’écran de la page des statistiques, coupée en deux (et comme pour la première, cliquez sur l’image pour les agrandir):
Note: ce qui est flouté est un référant (une source de lien) privé et donc par respect pour cette personne, je ne peux en aucun cas, afficher ce lien. Bien sûr, il y a des moyens de tronquer certaines de ces statistiques, avec des outils tels que Do Not Track Me, TOR,…
Et si on regardait ce que fait piwik?
Je voudrais maintenant vous montrer ce que fait piwik, en matière de surveillance de l’activité du visiteur. Pour ce faire, j’ai installé un piwik et l’ai relié à mon blog qui me sert uniquement à tester ce que je vais intégrer dans ce blog-ci ou un autre. Voici à quoi ressemble la page d’accueil de piwik, une fois connecté sur le machin:
Rien de bien sorcier, on retrouve d’une autre manière la plupart des informations fournies par l’outil de WordPress. Mais j’ai de nouveau pléthore d’information: les adresses IP, le navigateur utilisé,… Mais chose surprenante à laquelle je ne m’attendais pas du tout: dans certains cas, il est même possible d’avoir directement le Fournisseur d’accès Internet (alors vous me direz que c’est facile d’obtenir cette information avec de simples sites web), mais ici, j’obtiens l’information sans rien faire!
Je tiens encore à montrer une petite chose avant de clôturer l’article. Sur la capture d’écran ci-dessus, vous pouvez voir à droite un petit lien en bleu, où il est marqué « Afficher le profil du visiteur ». En cliquant dessus, on arrive à une petite fenêtre qui permet de montrer l’activité du visiteur sur son site internet, et l’on peut même voir combien de temps ce visiteur est resté sur une page donnée
Je voudrais maintenant vous poser une question, à vous, mes lecteurs. Il va y avoir d’ici peu mal de changement sur mon blog et sur d’autres satellites dont je m’occupe de manière plus sporadique (mais je vous en parlerai dans quelques temps, histoire de tout préparer et de vous laisser quelques surprises), et je suis confronté à ce dilemme: dois-je continuer à utiliser le système que j’ai actuellement, à savoir StatCounter et WordPress.com via Jetpack (celui-ci est libre), et donc je suis tributaire de sociétés privées. Dans l’autre cas, utiliser piwik est un logiciel totalement libre et sur lequel j’ai le contrôle absolu, mais cela nécessite encore plus une relation de confiance entre vous lecteurs et moi-même. C’est pourquoi je vous laisse le choix: Mon ancien système ou piwik?
Vous pouvez simplement répondre à cette question en utilisant les commentaires ci-dessous!
Désireux de mieux vous protéger en ligne? Retrouvez l’ensemble des techniques pour protéger votre vie privée en ligne sur la page votre vie privée
Vous aimez mes petits articles ou histoires? Vous voulez me soutenir ou me remercier? Choisissez la façon qui vous convient le mieux!
Image de Todd Huffman sous licence CC BY
Ayant l’âme libriste (surtout en ce qui concerne le web) je te dirais bien d’utiliser alors piwik, surtout que niveau relation de confiance, elle est total envers toi me concernant ^^
Je vous dirais bien d’utiliser également piwik en licence libre mais cela me poserait un problème.
En effet, comme LeGourou je vous fais plus confiance à vous, qu’en d’autres sites/blog commerciaux donc je sais que vous n’utiliserez pas ces données à mauvais escient.
Néanmoins, le fichage individuel des visiteurs (pays, naviguateur, adresse IP, articles visités, durée de visite, …) est une pratique d’espionnage qui est une des choses contre lesquels vous vous battez je crois.
Or, je pense qu’il est plus cohérent si c’est le cas, de mettre en pratique vos enseignements et d’éviter un tel outils.
Son utilisation pourrait mettre à mal votre crédibilité et être utilisé par vos détracteurs (futurs ou actuels si vous en avez) pour ironiser vos propos.
Je suis donc, personnellement contre, pensant qu’il vaut mieux une demi licence libre plutôt qu’une totale hypocrisie.
Et cela en attendant qu’une version libre d’un outils comme StatCounter voit le jour.
En revanche, je trouve votre démarche de laisser le choix à vos visiteurs tout à fait honnête de votre part, nous laissant une liberté que sur la plupart des sites et blogs nous n’avons pas.
Intéressant. Merci de te poser toutes ces questions éthiques, si seulement tous les webmasters en faisaient autant !
J’ai toutefois quelques interrogations: Si je comprends bien, StatCounter n’est pas un logiciel libre, c’est-à-dire que son code source n’est pas public, donc comment peut-on avoir la moindre idée de ce qu’il fait et que même toi tu ne verrais pas ? Peut-être qu’il envoiie plein d’infos à sa maison mère, des infos aussi intrusives que celles de Google Analytics… Comment savoir ? Je me demande en particulier comment il peut faire la différence entre un nouveau visiteur et un visiteur récurrent sans un minimum « d’espionnage » (au moins des cookies, voire pire) ?
Il me semble que d’une manière générale, tu confondes les infos que ces applications te donnent, à toi webmasters, et celles qu’elles récoltent. Je n’ai pas étudié la question en profondeur, je ne connais que Piwik. Mais il me semble qu’avec lui au moins, il y a une grande transparence en ce que les infos qu’il montre au webmaster sont celles qu’il récoltent, ni plus, ni moins. C’est ensuite un question d’éthique de la part du webmaster que de décider qu’en faire. Il peut, par exemple, placer un bouton sur son site par lequel ses visiteurs peuvent se soustraire à la surveillance de piwik… je sais, c’est un peu comme dire à la caméra qui nous filme qu’on ne veut pas être filmé, mais c’est déjà ça.
Bref, je n’ai rien d’absolu à affirmer ici. Je te fais juste part des réflexions que me suscitent ton article…
Merci à tous pour vos commentaires!
Pour déjà répondre à Fred, StatCounter oui, doit se baser sur les cookies étant donné que WordPress travaille avec. Le client, même s’il n’est pas libre a son code lisible, mais il suffirait qu’il fasse appel à une fonction sur le site de la boite pour que l’utilisation ne soit pas transparente (et je vais être honnête, je n’ai pas analysé le code de ce plugin WP, et je ne suis pas sûr d’avoir les connaissances suffisantes en PHP pour cela).
Pour le tracking, tu suggères un bouton « ne pas regarder ici »: Il existe déjà des outils pour cela, voir « des extensions indispensables pour votre navigateur internet », et j’encourage un maximum de monde à les utiliser. C’est pourquoi également, j’en parlerai la semaine prochaine, les boutons de partage vont être changés au profit d’un système au double clic (pour voir ce système en action, il est consultable sur le site connard.pro ) .
C’est déjà par soucis de transparence que j’explique tout cela. Pour piwik, Il existe bien une fonction permettant de ne pas enregistrer les adresses IP des visiteurs. Je n’en ai pas parlé dans l’article, car comme je l’ai dit, c’est une question de confiance que le visiteur doit avoir avec le webmaster du site, et je voulais montrer les données récoltables, pas ce qui est effectivement récolté. Juste pour que vous puissiez vous faire un avis sur la question. Il est clair que dans le cas où je devrais utiliser piwik, cette fonction ne serait pas activée (sauf si un petit malin m’ennuie de manière récurrente, mais on y est pas encore).
Il est clair qu’il n’y as pas de réponse optimale à cette question. L’idéal serait de ne pas avoir d’outil de statistique sur le site. Mais pour moi, c’est un moyen de savoir ce qui est lu sur le blog. Et de savoir si je peux continuer à travailler sur certaines idées plutôt qu’une autre. Peut être que bientôt, je n’en aurai plus besoin (et je l’espère fortement!)
« Il est clair qu’il n’y as pas de réponse optimale à cette question. » -> Je suis bien d’accord. Entre les droits et intérêts des uns et des autres, l’équilibre ne peut être qu’un compromis, comme souvent. Et n’avoir aucune idée de la fréquentation de son site serait tout de même bien ingrat…
« c’est une question de confiance » -> ben oui, voilà. Les contrats (les licenses étant des formes de contrats) sont censés établir la confiance entre inconnus, mais ne vaudront jamais la confiance en quelqu’un que l’on connait…
La confiance en vous je l’ai, c’était plutôt le fichage systématique et individuel des visiteurs qui m’embêtait, pas l’utilisation que vous en ferait.
Le besoin d’avoir des statistiques globales pour savoir ce qui est lu est compréhensible et n’est pas dérangeant.
Après comme vous le dites, si piwik permet de ne pas activer cette fonction, c’est parfait, je n’ai rien à y redire.
Fred a effectivement soulevé un point important, je réfléchissais plus aux données qui étaient accessibles au webmaster plutôt qu’aux données qui seraient accessibles à l’entité possédant cet outils. À ce compte là effectivement, je préfère vous faire confiance à vous qu’à eux et donc choisir piwik.
En tout cas merci à vous de nous demander notre avis.
PS : je viens de voir le système de bouton pour réseaux sociaux, je l’avais déjà vu sur d’autres sites et effectivement c’est pas mal du tout.
Maintenant, il y a un autre problème: même quand je suis sûr qu’un webmaster n’utilisera pas mes données à mauvais escient, il reste qu’un serveur ça se pirate, et donc les données récoltées, si elles sont conservées, pourraient bien se retrouver chez quelqu’un qui ne me veut pas que du bien un jour…
Je crois que pour pallier à ça (et aussi pour des raisons évidentes de gain de place), Piwik efface automatiquement les données vieille de plus de [x] mois, pour ne conserver que leur compilation statistique anonyme… Ou quelque chose comme ça. C’est expliqué sur leur site.
(Sorry pour les posts multiples)