Les moteurs de recherche en Sciences humaines et sociales (1)

20 juin 2006
By


Brazil
Les cher­cheurs du CNRS, grâce à BiblioSHS, ont accès à de gigan­tesques bases de don­nées scien­ti­fiques, essen­tiel­le­ment en langue anglaise. Les cher­cheurs d’établissements d’enseignement et de recherche peuvent pro­fi­ter d’accès ache­tés pour les étudiants et les cher­cheurs. Par exemple, Jstor, est pro­posé par l’Ecole des hautes études en sciences sociales. L’Université Paris 7 pro­pose de nom­breuses res­sources [26]. L’ENS-LSH pro­pose notam­ment l’accès à JSTOR et à PIO-​chadwyck. Par­fois, ces accès ne sont dis­po­nibles qu’à l’intérieur du cam­pus. Les cher­cheurs com­met­tant l’erreur de tra­vailler en biblio­thèque ou chez eux devront se débrouiller.

Si l’on n’appartient pas à une ins­ti­tu­tion de ce type, il faut faire avec les moyens du bord, ou se tour­ner vers le web. De fait, si l’on cherche sur Inter­net des infor­ma­tions au sujet de Jeanne d’Arc, on n’aura pas de mal à trou­ver des sites non scien­ti­fiques sur le sujet, qui dis­posent de la même per­ti­nence, du point de vue de Google, que des articles scien­ti­fiques. Sur la ques­tion de l’avortement, des reli­gions ou du ter­ro­risme, on devine que la réseau four­mille de docu­ments de sta­tut très divers et qu’aucun moteur géné­ra­liste ne va dis­tin­guer les docu­ments scien­ti­fiques des des docu­ments poli­tiques, acti­vistes ou tout sim­ple­ment mani­pu­la­teurs. On com­prend, dès lors, l’importance des moteurs de recherche dédiés à des cor­pus scien­ti­fiques. Or, dans ce domaine, le pay­sage est confus.

On a d’abord constaté la dis­pa­ri­tion pro­gres­sive de presque toutes les ini­tia­tives de consti­tu­tion de moteurs de recherche scien­ti­fiques. En Sciences humaines, c’est Argos qui, je crois, fait figure de pion­nier. Lancé en 1996, ce moteur indexait les sites concer­nant l’Antiquité et le Moyen-​Age. Mais il a dû fer­mer ses portes en 2003. C’est dom­mage, mais on com­prend pour­quoi : il faut des moyens humains pour main­te­nir une liste de sites à indexer. Et il faut des moyens finan­ciers pour main­te­nir une appli­ca­tion capable d’indexer des mil­lions de page et de répondre à des requêtes d’internautes tou­jours plus nom­breux. En France, c’est Aleph qui fait figure de pion­nier. Lancé par Fabula, rejoint par Marges-​Linguistiques et par Revues​.org, ce moteur était com­posé de trois sec­tions : une dédiée à la recherche en Lit­té­ra­ture, une à la Lin­guis­tique et l’autre à l’Histoire et aux sciences sociales. Les mêmes causes pro­dui­sant les mêmes effets, Aleph a dis­paru, qua­si­ment dans l’indifférence générale.

Dans le monde, trois titans ont pris posi­tion. A ma gauche, Else­vier, l’ogre des sciences dures, qui s’appuie sur son immense por­te­feuille de revues pour prendre pied dans le gotha des moteurs de recherche scien­ti­fiques. A ma droite, Google, le cham­pion du monde des moteurs de recherche grand public. Else­vier a lancé Sci­rus et Google a lancé Google scho­lar, qui est, à l’heure actuelle, tou­jours en ver­sion beta. Et dans mon dos, Live Aca­de­mic Search : de Micro­soft (actuel­le­ment acces­sible seule­ment aux anglo­phones) vient de prendre place.

Ces moteurs, sur­tout Google scho­lar, ont fait cou­ler beau­coup d’encre. Pour diverses rai­sons que j’analyserai sans doute dans un autre billet, ils ne pré­sentent en réa­lité que peu d’intérêt pour nous, cher­cheurs ou ensei­gnants en Sciences humaines. Ils indexent en effet avant tout des sciences dures anglo­phones et leurs résul­tats com­portent énor­mé­ment de bruit, en rai­son d’une poli­tique de sélec­tion très déli­cate à mener, qui abou­tit par­fois à des résul­tats proches de l’absurde, voire de la dés­in­for­ma­tion. Pour­tant, du point de vue des fonc­tion­na­li­tés offertes, de nom­breux efforts ont été consen­tis. Et pour­raient faire mouche, à l’avenir. Mais pour l’instant, le cor­pus indexé est très lar­ge­ment déce­vant ; trop anglo­phone ; trop tourné vers les sciences dures ; trop inégal en qua­lité et en nature, c’est-à-dire, fina­le­ment, en pertinence.

Pour­quoi une telle décep­tion ? Il faut pro­ba­ble­ment en cher­cher l’explication dans les moti­va­tions des acteurs : il s’agit avant tout de prendre posi­tion sur un mar­ché en deve­nir, sans se lais­ser débor­der par l’émergence des moteurs de recherche issus de la com­mu­nauté uni­ver­si­taire elle-​même, qui aura ten­dance à pré­co­ni­ser le libre accès. Peu importe, donc, que Sci­rus soit pol­lué de mil­liers de sites non scien­ti­fiques. Peu importe, égale­ment, que Google Scho­lar soit encore en ver­sion beta, et que Live Aca­de­mic Search soit actuel­le­ment non consul­table depuis un navi­ga­teur fran­co­phone. Ce qui compte, sur­tout, c’est de prendre date. Mar­quer son ter­ri­toire. Comme au bon vieux temps du vapor­ware serions-​nous entrés dans l’ère des web­ware (si on me per­met un tel néo­lo­gisme) ? Pas vrai­ment, si l’on songe que ces ser­vices existent bel et bien, sont tes­tables et uti­li­sables. On pourra même pen­ser que leur sor­tie pré­coce, donc pré­ma­tu­rée, per­met de déploier un peu plus la logique du Web 2.0, qui veut que les nou­veaux outils soient le fruit d’un inter­ac­tion intense avec une masse d’utilisateurs éclairés.

Quoi qu’il en soit, un énorme mar­ché s’annonce. Celui de la mise en ordre du savoir mon­dial. Celui de l’indexation des res­sources payantes et des res­sources en libre accès, dans un joyeux mélange qui pro­fi­tera au com­merce. Celui qui mène l’internaute au plus près des articles qui l’intéressent et finit par lui en refu­ser l’accès au der­nier moment, en lui deman­dant de régler une fac­ture. Un modèle, on le devine, dans lequel les mut­li­na­tio­nales ont inté­rêt à ne pas voir se déve­lop­per l’accès ouvert, déjà acti­ve­ment porté par des réper­toires, des moteurs de recherches et des décla­ra­tions publiques.

Et en France, où en sommes-​nous ?

Tags:

One Response to Les moteurs de recherche en Sciences humaines et sociales (1)

  1. Hubert Guillaud on 20 juin 2006 at 11 h 52 min

    Heu­reu­se­ment, Quaero va résoudre tout cela, non ? :)

    Plus sérieu­se­ment, plus que la ques­tion des moteurs de recherche, tu poses la ques­tion des cor­pus de recherche. Et on voit bien qu’il y a là un sujet majeur — je crois. Com­ment mettre au point des cor­pus ? Com­ment les auto­ma­ti­ser le plus pos­sible ? Com­ment les per­son­na­li­ser sans réin­ven­ter la roue, c’est-à-dire sans devoir construire à chaque fois son propre cor­pus et sans contrainte d’utilisation… On voit que tout cela génère encore beau­coup de bruits comme tu le dis, c’est-à-dire de résul­tats inutiles et inadé­quats. J’ai bien peur que cela dure encore long­temps hélas.

    Le défi n’est pas si simple en tout cas.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*


Notifiez-moi des commentaires à venir via email. Vous pouvez aussi vous abonner sans commenter.

Enter your email address to subscribe to this blog and receive notifications of new posts by email.

Join 5 other subscribers

Twitter de Marin

Twitter de Pierre