Il n’est pas de document scientifique qui ne soit citable

10 juillet 2006
By
JPEG - 15.3 ko
Daddy Long Legs on Mus­ca­dine Leaf
CC by Old Shoe Woman

Il n’est pas de docu­ment scien­ti­fique qui ne soit citable. Dès lors, les efforts des archives ouvertes et des pro­jets d’édition élec­tro­nique s’appuieront sur une base fra­gile si le lec­teur ne sait pas citer en tout cer­ti­tude un docu­ment qu’il vient de lire. Cette ques­tion consti­tuera d’ailleurs pro­ba­ble­ment un frein au dépôt, si les auteurs ne com­prennent pas clai­re­ment à quoi sert leur dépôt. Pour ser­vir la science (avant de ser­vir les évalua­teurs et les mesu­reurs à la sauce Shan­gaï), les dépôts doivent pré­sen­ter une sûreté dans l’usage scien­ti­fique qui en sera fait (citer), bien avant tout autre chose (évaluer, sto­cker, conser­ver, indexer, etc.).

Pour lever cette incer­ti­tude il fau­dra que le docu­ment dis­pose d’un iden­ti­fiant unique stable, très très stable, très simple, très effi­cace. L’OAI ne devrait pas ser­vir à ça, mais on a ten­dance à le faire un peu, ce qui revient à for­mu­ler l’hypothèse d’un dépôt unique mon­dial, qui me semble rela­ti­ve­ment contraire à la logique dis­tri­buée de l’Open archives ini­tia­tive. Le DOI sert à ça, mais il me semble pré­sen­ter des défauts graves (et je suis content d’apprendre que je ne suis pas le seul à le pen­ser). Consé­quence : aujourd’hui, pour l’essentiel des Sciences humaines en France, point d’identifiant unique, seule­ment des URL. Mais même si elles sont l’objet de tous les soins des éditeurs élec­tro­niques, celles-​ci ont ten­dance à bou­ger. Si leur valeur d’usage est très bonne, leur fia­bi­lité l’est moins (même si on constate des évolu­tions notables et plus de rigueur dans leur gestion).

Mais ma pré­oc­cu­pa­tion pre­mière concerne la dif­fu­sion des usages. Si nous adop­tons un iden­ti­fiant unique (IU), il fau­dra être capables de l’expliquer aux lec­teurs, afin qu’ils l’utilisent pour citer la réfé­rence. Il fau­dra donc qu’ils com­prennent com­ment marchent les résol­veurs de noms. Qu’ils aient confiance dans leur fonc­tion­ne­ment. Que ce sys­tème ne leur appa­raisse pas comme une enième péri­pé­tie issue d’une tutelle chan­geante, sou­mise au jeu des chaises musi­cales. Ce sys­tème devra donc avoir des chances d’être mieux que franco-​français : il doit être –ou pou­voir deve­nir– un stan­dard dépas­sant une dis­ci­pline ou un pays. Culti­ver notre excep­tion natio­nale ne me semble pas vrai­ment pertinent.

Il fau­dra aussi que le sys­tème soit simple : je pré­fère des iden­ti­fiants res­sem­blant à un numéro de plaque d’immatriculation plu­tôt que des iden­ti­fiants res­sem­blant à une clé WEP 128 bits ! Les URL uti­li­sées par lemonde​.fr sont signi­fi­ca­tives de ce qu’un pilo­tage par la tech­nique (et/​ou le com­merce) peut don­ner comme résul­tat (désas­treux). Je pré­fère des iden­ti­fiants courts, qui ne seront pas cou­pés dans les cour­riels, qui ne cas­se­ront pas la mise en page d’une note de bas de page, bref, qui s’insèrent dans des usages quo­ti­diens sans pro­vo­quer de conflit, d’interrogation, d’effets secondaires.

Ma convic­tion est que l’URL est un excellent sys­tème, c’est d’ailleurs le seul qui soit aujourd’hui uni­ver­sel, mais qu’il est trop pauvre et fra­gile. Il n’est pas besoin d’expliquer la façon de s’en ser­vir. D’où l’hypothèse d’un IU qui pas­se­rait par le pro­to­cole http. Et la ten­ta­tion de cher­cher du côté des résol­veurs de noms des­ti­nés à réduire la lon­gueur des URL (tinyURL, par exemple). Cette solu­tion per­met­trait de nour­rir les textes de liens stables. L’adoption d’IU igno­rant tota­le­ment l’hypertexte et http pro­vo­que­rait un obs­tacle puis­sant à son usage dans les textes en ligne. Il y aurait, d’une part, la chaine de l’hypertexte, le monde réel, et, d’autre part, le monde idéal des normes par­faites, inuti­li­sées (cf. le cla­vier Dvo­rak et l’espe­ranto). C’est bien d’une inno­va­tion que nous avons besoin, plu­tôt que d’une invention.

Idéa­le­ment, un bon sys­tème d’IU résou­drait le pro­blème de la publi­ca­tion en ligne, d’une part, et du dépôt, d’autre part, c’est-à-dire des dou­blons. Même en uni­fiant les dépôts d’archives ouvertes, il fau­dra prendre en compte la diver­sité des pla­te­formes d’édition élec­tro­nique, qui ont plus voca­tion à se déve­lop­per qu’à dis­pa­raître (Eru­dit, Per­sée, Cairn, Revues​.org pour ne citer que cer­taines, qui relèvent des SHS). Il serait bon de pen­ser à un sys­tème qui soit capable de signa­ler les dépôts sur l’archive natio­nale, d’une part, et la ver­sion éditée en ligne, d’autre part. Une expé­rience sera menée en ce sens entre Revues​.org et HAL l’année pro­chaine, afin de faire en sorte que les dépôts et l’édition élec­tro­nique ne se fassent pas concur­rence, mais au contraire se sou­tiennent. Pour ça, le par­tage d’un IU entre les pla­te­formes me semble indispensable.

Conti­nuons à réflé­chir à un sys­tème d’IU idéal :

- il serait très simple tech­ni­que­ment, donc très robuste

- l’obtention d’un iden­ti­fiant serait gra­tuite

- son attri­bu­tion ne néces­si­te­rait pas de lourdes pro­cé­dures

- il serait très simple dans sa forme, ce qui favo­ri­se­rait son usage quo­ti­dien, et com­pa­tible avec des usages en PAO, trai­te­ment de texte, cour­riel, mes­sa­ge­rie ins­tan­ta­née et dans des articles en ligne (IU cli­quable)

- il ne néces­si­te­rait aucun inves­tis­se­ment tech­nique de la part des cher­cheurs (pas de nou­veau logi­ciel sur le poste du cher­cheur)

- il serait exploi­table par les logi­ciels de biblio­gra­phie (End­note, etc.), par les biblio­thèques, par les éditeurs (et ce, quel que soit le sup­port, ce qui impose un fonc­tion­ne­ment très souple et très rapide)

- il serait capable de dis­tin­guer les ver­sions des docu­ments et, éven­tuel­le­ment, leur sup­port

- il s’appuierait sur un sys­tème rela­ti­ve­ment cen­tra­lisé et serait inter­ro­geable sur autant de sys­tèmes dis­tants que néces­saire (un sys­tème proche du DNS semble assez inté­res­sant à creu­ser)

- il com­por­te­rait peu (pas ?) d’erreurs

- sa main­te­nance édito­riale serait rela­ti­ve­ment économe en moyens humains

- il per­met­trait de décrire des objets très divers (sources his­to­riques, articles scien­ti­fiques, ouvrages, etc.)

- il per­met­trait de jouer, a minima, sur la gra­nu­la­rité de l’information, c’est-à-dire de citer une sub­di­vi­sion du docu­ment. Je pense bien sûr au para­graphe, dont la prise en compte dans le sys­tème pré­sen­te­rait un inté­rêt immense. Mais j’ai conscience que les obs­tacles sont nom­breux.

- il serait adop­table, à terme, par l’édition papier, au même titre que l’ISBN. On obtien­drait ainsi une conti­nuité entre les éditions, et pas un hia­tus voire un conflit entre les uni­vers ana­lo­giques et numé­riques.

- il gère­rait les dou­blons, non par l’ignorance, mais par leur signa­le­ment (conver­gence des ver­sions plu­tôt que conflit des ver­sions, quel que soit le sup­port, quelle que soit la plateforme).

Voici donc le début d’un « cahier des charges idéal », qui se construit en igno­rant volon­tai­re­ment ce qui existe déjà. Vien­dra le temps de l’établissement d’un état de l’Art, qui devra débou­cher sur un tableau com­pa­ra­tif des solu­tions exis­tantes au regard de ce cahier des charges. Espé­rons que des solu­tions concrètes et appli­cables en sortiront.

Tags: ,

3 Responses to Il n’est pas de document scientifique qui ne soit citable

  1. François/phnk on 11 juillet 2006 at 0 h 46 min

    Le DOI a ses limites mais c’est le sys­tème qui convient le mieux à ton cahier des charges actuel.

    Pour ma part je per­çois un pro­blème sérieux du côté des exten­sions, comme dans /​article 544.php ou /document899.html — le for­mat de la page n’apporte rien de sub­stan­tiel à la cita­tion, et il peut être amené à chan­ger sinon à dis­pa­raître (rien ne garan­tit la péren­nité du HTML ou du PHP à long terme). En l’état des choses, un réglage ser­veur assez simple peut régler ce souci.

    Par consé­quent le DOI comme il existe actuel­le­ment, de type dx​.doi​.org/​000 – 111-​etc me satis­fait plutôt.

  2. Got on 11 juillet 2006 at 8 h 21 min

    DOI ne convient pas pour trois raisons :

    -Il faut payer pour avoir un iden­ti­fiant DOI (et c’est assez cher)

    - Prendre un iden­ti­fiant DOI rend dépen­dant d’un orga­nisme inter­na­tio­nal privé et je vous laisse ima­gi­ner les consé­quences.

    - DOI est basé sur le sys­tème Handle qui ne gère pas la granularité

    Sinon petite pré­ci­sion (chi­po­tage…) : une URL peut être un iden­ti­fiant pérenne (et URI un bon sys­tème d’identifiants pérennes), c’est d’ailleurs le cas pour les recom­man­da­tions du W3C (ils ont un sys­tème assez inté­res­sant de nom­mage et de redi­rec­tions), il suf­fit donc de s’en don­ner les moyens.

    Effec­ti­ve­ment, ton cahier des charges est très idéal, aucun sys­tème ne répond pour l’instant à l’ensemble de tes besoins…

  3. V on 18 juillet 2006 at 1 h 33 min

    « Prendre un iden­ti­fiant DOI rend dépen­dant d’un orga­nisme inter­na­tio­nal privé et je vous laisse ima­gi­ner les conséquences. » =

    Les consé­quences ne peuvent qu’être posi­tives : l’entreprise s’arrangera pour assu­rer le meilleur rap­port qualité/​prix à ses clients, au risque de les voir partir.

    Quant au fait qu’il faut payer, c’est nor­mal, rien n’est gra­tuit. Et qu’un orga­nisme public le paye aux uni­ver­si­taire n’y change rien : au final il fau­dra tou­jours les efforts de cer­tains pour assu­rer ce ser­vice, qui pour­ront donc légi­ti­me­ment récla­mer un salaire en contre­par­tie. « Gra­tuit » veut dire : payé par les contribuables.

    Le pre­mier point du cahier des charges devrait être : le pro­jet ne pourra se déve­lop­per avec des anti-​libéraux pri­maires et butés.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*


Notifiez-moi des commentaires à venir via email. Vous pouvez aussi vous abonner sans commenter.

Enter your email address to subscribe to this blog and receive notifications of new posts by email.

Join 5 other subscribers

Twitter de Marin

Twitter de Pierre