HOMO-NUMERICUS
LINUX POUR DE VRAI
LA FEUILLE
 
CATÉGORIES
Billets récents
17
11
2007
La confusion des documents

In the name of god

J’observe chaque jour les progrès d’une maladie rampante : la confusion entre le formulaire de recherche de Google et la barre d’adresse du navigateur.

Aux débuts d’Internet, les technologies utilisées étaient rudimentaires. Cependant, elles avaient le mérite d’être explicites dans le domaine des URL, c’est-à-dire des adresses de pages web. [1] Le navigateur Netscape 1.0 proposait "d’aller à" ("Go to") et Internet explorer 2.0 proposait de renseigner une "adresse". Rien de plus explicite et de plus transparent, ainsi que le montrent deux captures d’écran [2]. Depuis, les navigateurs ont considérablement évolué. En particulier, on notera la convergence des moteurs de recherche et des navigateurs.

Dans les premiers navigateurs, on saisissait l’adresse d’un moteur de recherche, par exemple Altavista.fr, et une fois arrivés sur ce moteur, on lançait une requête, par exemple "Apocalypse now Coppola". Les navigateurs récents proposent désormais les formulaires de recherche directement dans le navigateur. Ce progrès ergonomique a induit la cohabitation de deux formulaires de recherche dans un espace très restreint, sous la barre de menus. Et a provoqué la disparition de l’intitulé de ces deux champs. Celui de gauche, par convention, est celui de l’URL. Celui de droite est celui de la recherche [3].

Jusqu’ici, tout va bien. Cela se complique lorsque l’utilisateur commence à confondre les formulaires. Lorsque je tape "Apocalypse now Coppola" dans le formulaire de recherche sur Firefox 2, qui utilise Google par défaut, j’obtiens des propositions parmi les sites : Annalyse filmique, Wikipedia, Allocine, Cannest-fest.com, Monde diplomatique, Thucydide.com, Universalis.fr et Objectif-cinema.com  [4] [5]. Sur la même requête, Live search propose des résultats parmi Allocine.fr, Thucydide.com, Ina.fr, Cineclubdecaen.com, Cadrage.net, ina-festivaldecannes.com [6].

Au lieu d’indiquer une erreur ("cette adresse n’existe pas"), Firefox lance une requête sur Google

Que se passe-t-il si je me trompe de formulaire et que je tape "Apocalypse now Coppola" dans la barre d’adresse ? Au lieu de m’indiquer une erreur ("cette adresse n’existe pas"), Firefox lance une requête sur Google, qui donne donc les résultats sus-mentionnés. Internet explorer lance une requête sur Livesearch... Mais alors, à quoi sert-il de distinguer les deux formulaires ? Menons notre enquête plus avant... Tapons "Apocalypse now" dans la barre d’adresse. Surprise : Firefox n’affiche pas les résultats d’une recherche Google mais le contenu de la page "Apocalypse now" de Wikipedia ! Internet explorer, lui, lance une requête sur Live search.

Retentons l’expérience avec le mot "revues". Tapé dans la barre d’adresses de Firefox, le mot "revues" vous envoie directement sur Revues.org [7]. Ce faisant, le navigateur se comporte comme une sorte de résolveur de liens "maison". Un tel comportement pose, de toute évidence, deux problèmes.

Une saisie dans le formulaire d’adresse peut donc déboucher sur une page web, sur une recherche Google, sur une notice Wikipedia. Au petit bonheur, la chance.

1. L’inconstance du comportement des navigateurs. Une saisie dans le formulaire d’adresse peut donc déboucher sur une page web, sur une recherche Google, sur une notice Wikipedia. Au petit bonheur, la chance. Pourquoi changer, ainsi, le comportement du navigateur ? Comment peut-on espérer construire des représentations claires d’Internet si un navigateur se comporte de façon si imprévisible ?

2. Le caractère arbitraire du choix de la page proposée par le moteur. Pourquoi pointer vers Revues.org, et pas vers la page "revues" de Wikipedia, comme dans le cas "Apocalypse now" ? Ou sur une requête sur Google au sujet du mot "revues" ? Quelle est la raison qui préside à ce choix ? On devine les dérives possibles d’un tel fonctionnement, qui pousse l’utilisateur vers une ressource unique, qu’il ne choisit pas, alors qu’on pourrait lui offrir le choix de ressources multiples, parmi lesquelles il exercerait un tri. Les dérives possibles dépendant nécessairement du contexte. Elles peuvent être intellectuelles, politiques ou commerciales. Un courant de pensée, un Etat totalitaire, une régie publicitaire peuvent s’emparer d’un tel mécanisme et en tirer profit.

Les navigateurs sont devenus une source majeure d’accès à la culture, à l’information et au savoir. Pourtant, ils sont en train d’induire une confusion délétère entre URL et moteur de recherche, c’est-à-dire, in fine, entre document et indexation.

Les navigateurs sont devenus une source majeure d’accès à la culture, à l’information et au savoir. Pourtant, ils sont en train d’induire une confusion délétère entre URL et moteur de recherche, c’est-à-dire, in fine, entre document et indexation.

- Par la dissolution progressive des contours de la définition de l’URL, les nouveaux navigateurs induisent le recul des pratiques de citation de documents en ligne. Introduire une confusion entre résolution de liens et indexation, c’est brouiller les représentations du Web. C’est brouiller l’organisation originelle du réseau hypertextuel.

- Introduire des résolutions de liens "propriétaire" au cours d’une recherche est source de confusions et de régressions des pratiques de citations par URL. Les médias révèlent ce type de régression. On ne mémorise pas l’URL d’un document intéressant. On mémorise la façon dont on y a accédé. Les journalistes nous accompagnent dans cet abandon à l’imprécision du parcours du réseau : "Pour retrouver ce site, tapez "Apocalypse Now Copola" sur Internet" nous dit France Inter. De cette imprécision sidérale du langage découle une molesse méthodologique excessive. Amis journalistes, suivez, s’il-vous-plaît, une petite formation sur les adresses sur le web, la résolution de noms et l’indexation. Savez-vous qu’un résultat de moteur de recherche n’est pas une constante scientifique, mais le résultat d’un processus, sans cesse changeant, d’algorithmes complexes et secrets ? Messieurs les journalistes, amis professeurs, apprenez-nous les adresses des sites. Messieurs les responsables de sites, construisez des sites citables.

Il est nécessaire que l’internaute maîtrise quelques notions de base, dont la première est celle d’URL, qui ne supportent pas la paresse d’esprit ni les approximations.

L’internaute citoyen est de plus en plus assisté dans sa recherche d’informations. Pour qu’il reste acteur de sa propre culture et de ses représentations, il est nécessaire qu’il maîtrise quelques notions de base, dont la première est celle d’URL, qui ne supportent pas la paresse d’esprit ni les approximations.


[1] Certains utilisent l’expression "adresse URL", me semble-t-il de façon impropre.

[2]

Netscape1.0 :

Internet explorer 2.0 :

Internet explorer 7 :

Blogo-numericus sur Internet explorer 7

Firefox 2 :

Le CLEO sur Firefox 2

[3] Il est significatif que le formulaire de saisie de l’URL soit faiblement identifié : sur Firefox 2, il est signalé par une flèche verte horizontale, sur Internet explorer 7, il est signifié par deux flèches tournantes. Le formulaire de recherche est plus facile à identifier, en particulier sur Firefox, qui utilise une favicon) pour identifier le moteur qui est utilisé pour la recherche (oui : il n’y a pas que Google comme possibilité, mais également Yahoo, Amazon.fr, Delicious, Wikipedia, etc). Sur Internet explorer 7, c’est une loupe qui est proposée, car on cherche par défaut dans Live search, le moteur de Microsoft, et il serait malvenu de laisser penser que des alternatives existent...

[4] Les essais de recherche ont été réalisés dans la matinée du 17 novembre 2007.

[5] Google annonce 631.000 résultats, dont les dix premiers résultats sont les suivants :
- analysefilmique.free.fr
- fr.wikipedia.org/wiki/Apocalypse_Now
- www.allocine.fr/film/fichefi...
- www.cannes-fest.com/1979b.htm
- www.monde-diplomatique.fr/ma...
- www.thucydide.com/realisatio...
- www.universalis.fr/encyclope...
- www.objectif-cinema.com/poin...

[6] Live search propose 330.000 résultats, dont voici la première page.

- www.allocine.fr/film/fichefi...
- www.thucydide.com/realisatio...
- www.ina.fr/cannes/index.php ?...
- www.cineclubdecaen.com/reali...
- www.cadrage.net/films/apocal...
- www.ina-festivaldecannes.com...

[7] Dans Internet explorer, une recherche sur Livesearch est lancée. En voici les résultats :
- www.revues.org
- www.entrevues.org
- album.revues.org
- lhomme.revues.org
- ch.revues.org
- clio.revues.org
- www.librairie-gaia.com/Revue...



 
10 commentaire(s)
1 “Caractère arbitraire du choix de la page proposée par le moteur.”
17 novembre 2007 04:22, par Fr.

Il me semble qu’il y a confusion dans le passage qui se réfère au “caractère arbitraire du choix de la page proposée par le moteur” puisque, justement, ce qui est en discussion est la page affichée par le navigateur et pas le moteur.

Le lapsus a valeur explicative parce que la barre d’adresse de Firefox se comporte exactement comme la fonction “I’m Lucky” de Google. La fonction elle-même me semble renvoyer la première requête de l’algorithme Google, dont les composantes (Google ranking etc.) sont bien sûr sujets à débat.

Pour conclure, je crois que le navigateur n’est vraiment que l’intermédiaire entre l’utilisateur et Google, et que si risque d’arbitraire il y a, cela se situe au niveau de Google, qui a tout de même conforté la politique chinoise vis-à-vis du Tibet. Ce n’est pas innocent.

La domination de Wikipedia est un sujet connexe. Le New York Times a récemment couvert un rapport d’expert qui indiquait que les étudiants se réfèrent tellement à Wikipedia qu’ils en oublient (les parresseux !) les ressources non signalées dans ses pages. Résultat : une encyclopédie gratuite en ligne peut également nuire à l’acquisition de la connaissance, en créant des ”sloths“.


2 Ortho.
17 novembre 2007 06:10, par Fr.

Um, un seul r à paresseux.


3 La confusion des documents
17 novembre 2007 07:51, par Hubert Guillaud

Intéressant. Il me semble que cela dessine surtout un avenir : les deux barres vont finir par tout simplement fusionner. Que vous tapiez une URL ou une suite de mots, vous serez dirigé vers un site ou vers les résultats d’un moteur.

Le problème, comme tu le dis, c’est pour les termes ambigus. Si je tape Revues, la barre d’adresse doit-elle me renvoyer vers Revues.org (qui est de tous les noms de domaines, le "Revues" le plus utilisé) ou vers un résultat de moteur de recherche ?

D’un autre côté, les URL de documents subsistent (bien que les Ajax like par exemple, viennent aussi les battre en brèche). Mais pour combien de temps ? Décidément, le web des universitaires continue de se transformer sous nos yeux.


4 Une remarque purement formelle
17 novembre 2007 08:30, par Claire

Très intéressant - et un peu effrayant. Ca me rappelle la disparition progressive du Gestionnaire de fichiers/Explorateur dans les limbes de Windows (et je ne parle même pas des Macintosh). Qui répond sans doute à une logique commerciale différente (vendre des gestionnaires de fichiers ?). On ne peut que constater en tout cas que tout ce qui aiderait les gens à s’y retrouver et comprendre comment les choses sont rangées tend à disparaître. Ne voulant pas en faire une théorie du complot, je suis très preneuse de toutes hypothèses sur le "pourquoi"... Et maintenant, la remarque purement formelle : personnellement les intertitres me gênent beaucoup à la lecture de ce billet. J’imagine que ça répond pour le coup à une logique d’indexation, mais alors par pitié faites-les courts...


5 Une remarque purement formelle
17 novembre 2007 08:59, par Marin

En fait, ce ne sont pas des intertitres, mais des citations extraites du texte, un peu comme le fait la presse, pour aider le lecteur à s’y retrouver. Il me semble que ta remarque signifie qu’il faut que nous améliorions la maquette, afin que les citations soient plus clairement identifiées comme telles.


6 Une remarque purement formelle
21 novembre 2007 08:56, par X

Un avis à deux cents d’un ex-SR : en maquette presse magazine, les citations de cette sorte (entourées de guillemets) sont des accroches visuelles généralement destinées à prendre connaissance du contenu d’une page complète, voire d’une double page, vue dans son ensemble et souvent maquettée en 2-3 colonnes. Rien de tel dans la maquette actuelle du site, puisque on défile sur une seule colonne de texte qui se déroule sans rupture. A mon humble avis, et comme le suggère Claire, de simples intertitres de quelques mots (et non des citations), sur la même typo mais calés à gauche, seraient plus adéquats pour juste séparer les suites de paragraphes.


7 Une remarque purement formelle
22 novembre 2007 11:15, par Alain Pierrot

Je souscris à la remarque signée X : des intertitres rédigés, au fer à gauche, seraient plus lisibles.

Le savoir-faire des « arts de la lisibilité »* est un acquis à mettre en valeur (et en perspective) en ces temps d’invention de nouveaux supports.

Voir à ce sujet les discussions sur la restitution des formats PDF d’Adobe sur les nouveaux dispositifs d’affichage que constituent les liseuses (Kindle, ou la discussion du 15 octobre 2007 chez Pisani « Je hais les PDF »).

Lire efficacement, lire avec plaisir, lire confortablement, …

* : typographie, maquette, design, …


8 La confusion des documents
22 novembre 2007 11:26, par Alain Pierrot

Dans le même ordre de confusion entre les URL et les moteurs de recherche, il semble que des fournisseurs d’accès se permettent de substituer des propositions de liens (sponsorisés) à ce qui pourrait/devrait être un « time-out » sur une requête DNS.

Vous lancez une requête, elle est effectivement lente, ou interceptée ou artificiellement retardée, on vous “propose” des substituts, manifestement calculés à partir de votre requête de résolution DNS (marque-page, IP connue... mais suggestions pertinentes !).

Rien dans les contrats de fournisseurs d’accès ne garantit contre ce genre de pratique...


9 La confusion des documents
21 décembre 2007 01:42, par e

Dans le même ordre d’idées :

au lycée, la page d’accueil par défaut est google.fr. Quand j’écris une url au tableau, mes élèves la tapent dans le formulaire de recherche sur cette page google et pas dans la barre d’adresses. je présume que chez eux ils font de même avec le formulaire de recherches de la page d’accueil du fournisseur d’accès ?


10 Photo ?
21 décembre 2007 05:14, par petitcurieux

Texte intéressant, mais question qui n’a rien à voir : quel est le sujet de la photo qui l’illustre (ou plutôt qui ne l’illustre pas :-)