La confusion des documents

17 novembre 2007
By


In the name of god

J’observe chaque jour les pro­grès d’une mala­die ram­pante : la confu­sion entre le for­mu­laire de recherche de Google et la barre d’adresse du navigateur.

Aux débuts d’Internet, les tech­no­lo­gies uti­li­sées étaient rudi­men­taires. Cepen­dant, elles avaient le mérite d’être expli­cites dans le domaine des URL, c’est-à-dire des adresses de pages web. [43] Le navigateur Netscape 1.0 proposait "d'aller à" ("Go to") et Internet explorer 2.0 proposait de renseigner une "adresse". Rien de plus explicite et de plus transparent, ainsi que le montrent deux captures d'écran [44]. Depuis, les navigateurs ont considérablement évolué. En particulier, on notera la convergence des moteurs de recherche et des navigateurs.

Dans les premiers navigateurs, on saisissait l'adresse d'un moteur de recherche, par exemple Altavista.fr, et une fois arrivés sur ce moteur, on lançait une requête, par exemple "Apocalypse now Coppola". Les navigateurs récents proposent désormais les formulaires de recherche directement dans le navigateur. Ce progrès ergonomique a induit la cohabitation de deux formulaires de recherche dans un espace très restreint, sous la barre de menus. Et a provoqué la disparition de l'intitulé de ces deux champs. Celui de gauche, par convention, est celui de l'URL. Celui de droite est celui de la recherche [45].

Jusqu'ici, tout va bien. Cela se complique lorsque l'utilisateur commence à confondre les formulaires. Lorsque je tape "Apocalypse now Coppola" dans le formulaire de recherche sur Firefox 2, qui utilise Google par défaut, j'obtiens des propositions parmi les sites : Annalyse filmique, Wikipedia, Allocine, Cannest-fest.com, Monde diplomatique, Thucydide.com, Universalis.fr et Objectif-cinema.com
 [46] [47]. Sur la même requête, Live search propose des résultats parmi Allocine.fr, Thucydide.com, Ina.fr, Cineclubdecaen.com, Cadrage.net, ina-festivaldecannes.com [48].

Au lieu d'indiquer une erreur ("cette adresse n'existe pas"), Firefox lance une requête sur Google

Que se passe-t-il si je me trompe de formulaire et que je tape "Apocalypse now Coppola" dans la barre d'adresse ? Au lieu de m'indiquer une erreur ("cette adresse n'existe pas"), Firefox lance une requête sur Google, qui donne donc les résultats sus-mentionnés. Internet explorer lance une requête sur Livesearch... Mais alors, à quoi sert-il de distinguer les deux formulaires ? Menons notre enquête plus avant... Tapons "Apocalypse now" dans la barre d'adresse. Surprise : Firefox n'affiche pas les résultats d'une recherche Google mais le contenu de la page "Apo­ca­lypse now  » de Wiki­pe­dia ! Inter­net explo­rer, lui, lance une requête sur Live search.

Reten­tons l’expérience avec le mot « revues ». Tapé dans la barre d’adresses de Fire­fox, le mot « revues » vous envoie direc­te­ment sur Revues​.org [49]. Ce fai­sant, le navi­ga­teur se com­porte comme une sorte de résol­veur de liens « mai­son ». Un tel com­por­te­ment pose, de toute évidence, deux problèmes.

Une sai­sie dans le for­mu­laire d’adresse peut donc débou­cher sur une page web, sur une recherche Google, sur une notice Wiki­pe­dia. Au petit bon­heur, la chance.

1. L’inconstance du com­por­te­ment des navi­ga­teurs. Une sai­sie dans le for­mu­laire d’adresse peut donc débou­cher sur une page web, sur une recherche Google, sur une notice Wiki­pe­dia. Au petit bon­heur, la chance. Pour­quoi chan­ger, ainsi, le com­por­te­ment du navi­ga­teur ? Com­ment peut-​on espé­rer construire des repré­sen­ta­tions claires d’Internet si un navi­ga­teur se com­porte de façon si imprévisible ?

2. Le carac­tère arbi­traire du choix de la page pro­po­sée par le moteur.
Pour­quoi poin­ter vers Revues​.org, et pas vers la page «  revues  » de Wiki­pe­dia, comme dans le cas « Apo­ca­lypse now » ? Ou sur une requête sur Google au sujet du mot « revues » ? Quelle est la rai­son qui pré­side à ce choix ? On devine les dérives pos­sibles d’un tel fonc­tion­ne­ment, qui pousse l’utilisateur vers une res­source unique, qu’il ne choi­sit pas, alors qu’on pour­rait lui offrir le choix de res­sources mul­tiples, parmi les­quelles il exer­ce­rait un tri. Les dérives pos­sibles dépen­dant néces­sai­re­ment du contexte. Elles peuvent être intel­lec­tuelles, poli­tiques ou com­mer­ciales. Un cou­rant de pen­sée, un Etat tota­li­taire, une régie publi­ci­taire peuvent s’emparer d’un tel méca­nisme et en tirer profit.

Les navi­ga­teurs sont deve­nus une source majeure d’accès à la culture, à l’information et au savoir. Pour­tant, ils sont en train d’induire une confu­sion délé­tère entre URL et moteur de recherche, c’est-à-dire, in fine, entre docu­ment et indexation.

Les navi­ga­teurs sont deve­nus une source majeure d’accès à la culture, à l’information et au savoir. Pour­tant, ils sont en train d’induire une confu­sion délé­tère entre URL et moteur de recherche, c’est-à-dire, in fine, entre docu­ment et indexation.

-Par la dis­so­lu­tion pro­gres­sive des contours de la défi­ni­tion de l’URL, les nou­veaux navi­ga­teurs induisent le recul des pra­tiques de cita­tion de docu­ments en ligne. Intro­duire une confu­sion entre réso­lu­tion de liens et indexa­tion, c’est brouiller les repré­sen­ta­tions du Web. C’est brouiller l’organisation ori­gi­nelle du réseau hypertextuel.

-Intro­duire des réso­lu­tions de liens « pro­prié­taire » au cours d’une recherche est source de confu­sions et de régres­sions des pra­tiques de cita­tions par URL. Les médias révèlent ce type de régres­sion. On ne mémo­rise pas l’URL d’un docu­ment inté­res­sant. On mémo­rise la façon dont on y a accédé. Les jour­na­listes nous accom­pagnent dans cet aban­don à l’imprécision du par­cours du réseau : « Pour retrou­ver ce site, tapez « Apo­ca­lypse Now Copola » sur Inter­net » nous dit France Inter. De cette impré­ci­sion sidé­rale du lan­gage découle une molesse métho­do­lo­gique exces­sive. Amis jour­na­listes, sui­vez, s’il-vous-plaît, une petite for­ma­tion sur les adresses sur le web, la réso­lu­tion de noms et l’indexation. Savez-​vous qu’un résul­tat de moteur de recherche n’est pas une constante scien­ti­fique, mais le résul­tat d’un pro­ces­sus, sans cesse chan­geant, d’algorithmes com­plexes et secrets ? Mes­sieurs les jour­na­listes, amis pro­fes­seurs, apprenez-​nous les adresses des sites. Mes­sieurs les res­pon­sables de sites, construi­sez des sites citables.

Il est néces­saire que l’internaute maî­trise quelques notions de base, dont la pre­mière est celle d’URL, qui ne sup­portent pas la paresse d’esprit ni les approxi­ma­tions.

L’internaute citoyen est de plus en plus assisté dans sa recherche d’informations. Pour qu’il reste acteur de sa propre culture et de ses repré­sen­ta­tions, il est néces­saire qu’il maî­trise quelques notions de base, dont la pre­mière est celle d’URL, qui ne sup­portent pas la paresse d’esprit ni les approximations.

Tags: , ,

10 Responses to La confusion des documents

  1. Fr. on 17 novembre 2007 at 4 h 22 min

    Il me semble qu’il y a confu­sion dans le pas­sage qui se réfère au “carac­tère arbi­traire du choix de la page pro­po­sée par le moteur” puisque, jus­te­ment, ce qui est en dis­cus­sion est la page affi­chée par le navi­ga­teur et pas le moteur.

    Le lap­sus a valeur expli­ca­tive parce que la barre d’adresse de Fire­fox se com­porte exac­te­ment comme la fonc­tion “I’m Lucky” de Google. La fonc­tion elle-​même me semble ren­voyer la pre­mière requête de l’algorithme Google, dont les com­po­santes (Google ran­king etc.) sont bien sûr sujets à débat.

    Pour conclure, je crois que le navi­ga­teur n’est vrai­ment que l’intermédiaire entre l’utilisateur et Google, et que si risque d’arbitraire il y a, cela se situe au niveau de Google, qui a tout de même conforté la poli­tique chi­noise vis-​à-​vis du Tibet. Ce n’est pas innocent.

    La domi­na­tion de Wiki­pe­dia est un sujet connexe. Le New York Times a récem­ment cou­vert un rap­port d’expert qui indi­quait que les étudiants se réfèrent tel­le­ment à Wiki­pe­dia qu’ils en oublient (les par­res­seux !) les res­sources non signa­lées dans ses pages. Résul­tat : une ency­clo­pé­die gra­tuite en ligne peut égale­ment nuire à l’acquisition de la connais­sance, en créant des ”sloths“.

  2. Fr. on 17 novembre 2007 at 6 h 10 min

    Um, un seul r à paresseux.

  3. Hubert Guillaud on 17 novembre 2007 at 7 h 51 min

    Inté­res­sant. Il me semble que cela des­sine sur­tout un ave­nir : les deux barres vont finir par tout sim­ple­ment fusion­ner. Que vous tapiez une URL ou une suite de mots, vous serez dirigé vers un site ou vers les résul­tats d’un moteur.

    Le pro­blème, comme tu le dis, c’est pour les termes ambi­gus. Si je tape Revues, la barre d’adresse doit-​elle me ren­voyer vers Revues​.org (qui est de tous les noms de domaines, le « Revues » le plus uti­lisé) ou vers un résul­tat de moteur de recherche ?

    D’un autre côté, les URL de docu­ments sub­sistent (bien que les Ajax like par exemple, viennent aussi les battre en brèche). Mais pour com­bien de temps ? Déci­dé­ment, le web des uni­ver­si­taires conti­nue de se trans­for­mer sous nos yeux.

  4. Claire on 17 novembre 2007 at 8 h 30 min

    Très inté­res­sant — et un peu effrayant. Ca me rap­pelle la dis­pa­ri­tion pro­gres­sive du Ges­tion­naire de fichiers/​Explorateur dans les limbes de Win­dows (et je ne parle même pas des Macin­tosh). Qui répond sans doute à une logique com­mer­ciale dif­fé­rente (vendre des ges­tion­naires de fichiers ?). On ne peut que consta­ter en tout cas que tout ce qui aide­rait les gens à s’y retrou­ver et com­prendre com­ment les choses sont ran­gées tend à dis­pa­raître. Ne vou­lant pas en faire une théo­rie du com­plot, je suis très pre­neuse de toutes hypo­thèses sur le « pour­quoi »…
    Et main­te­nant, la remarque pure­ment for­melle : per­son­nel­le­ment les inter­titres me gênent beau­coup à la lec­ture de ce billet. J’imagine que ça répond pour le coup à une logique d’indexation, mais alors par pitié faites-​les courts…

  5. Marin on 17 novembre 2007 at 8 h 59 min

    En fait, ce ne sont pas des inter­titres, mais des cita­tions extraites du texte, un peu comme le fait la presse, pour aider le lec­teur à s’y retrou­ver. Il me semble que ta remarque signi­fie qu’il faut que nous amé­lio­rions la maquette, afin que les cita­tions soient plus clai­re­ment iden­ti­fiées comme telles.

  6. Anonyme on 21 novembre 2007 at 8 h 56 min

    Un avis à deux cents d’un ex-​SR : en maquette presse maga­zine, les cita­tions de cette sorte (entou­rées de guille­mets) sont des accroches visuelles géné­ra­le­ment des­ti­nées à prendre connais­sance du contenu d’une page com­plète, voire d’une double page, vue dans son ensemble et sou­vent maquet­tée en 2 – 3 colonnes. Rien de tel dans la maquette actuelle du site, puisque on défile sur une seule colonne de texte qui se déroule sans rup­ture. A mon humble avis, et comme le sug­gère Claire, de simples inter­titres de quelques mots (et non des cita­tions), sur la même typo mais calés à gauche, seraient plus adé­quats pour juste sépa­rer les suites de paragraphes.

  7. Alain Pierrot on 22 novembre 2007 at 11 h 15 min

    Je sous­cris à la remarque signée X :
    des inter­titres rédi­gés, au fer à gauche, seraient plus lisibles.

    Le savoir-​faire des « arts de la lisi­bi­lité »* est un acquis à mettre en valeur (et en pers­pec­tive) en ces temps d’invention de nou­veaux supports.

    Voir à ce sujet les dis­cus­sions sur la res­ti­tu­tion des for­mats PDF d’Adobe sur les nou­veaux dis­po­si­tifs d’affichage que consti­tuent les liseuses (Kindle, ou la dis­cus­sion du 15 octobre 2007 chez Pisani « Je hais les PDF »).

    Lire effi­ca­ce­ment, lire avec plai­sir, lire confortablement, …

    * : typo­gra­phie, maquette, design, …

  8. Alain Pierrot on 22 novembre 2007 at 11 h 26 min

    Dans le même ordre de confu­sion entre les URL et les moteurs de recherche, il semble que des four­nis­seurs d’accès se per­mettent de sub­sti­tuer des pro­po­si­tions de liens (spon­so­ri­sés) à ce qui pourrait/​devrait être un « time-​out » sur une requête DNS.

    Vous lan­cez une requête, elle est effec­ti­ve­ment lente, ou inter­cep­tée ou arti­fi­ciel­le­ment retar­dée, on vous “pro­pose” des sub­sti­tuts, mani­fes­te­ment cal­cu­lés à par­tir de votre requête de réso­lu­tion DNS (marque-​page, IP connue… mais sug­ges­tions pertinentes !).

    Rien dans les contrats de four­nis­seurs d’accès ne garan­tit contre ce genre de pratique…

  9. e on 21 décembre 2007 at 1 h 42 min

    Dans le même ordre d’idées :

    au lycée, la page d’accueil par défaut est google​.fr. Quand j’écris une url au tableau, mes élèves la tapent dans le for­mu­laire de recherche sur cette page google et pas dans la barre d’adresses. je pré­sume que chez eux ils font de même avec le for­mu­laire de recherches de la page d’accueil du four­nis­seur d’accès ?

  10. petitcurieux on 21 décembre 2007 at 5 h 14 min

    Texte inté­res­sant, mais ques­tion qui n’a rien à voir : quel est le sujet de la photo qui l’illustre (ou plu­tôt qui ne l’illustre pas :-)

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*


Notifiez-moi des commentaires à venir via email. Vous pouvez aussi vous abonner sans commenter.

Enter your email address to subscribe to this blog and receive notifications of new posts by email.

Join 5 other subscribers

Twitter de Marin

Twitter de Pierre