Archives du mot-clé Identifiants

L’unité documentaire de Google, c’est vous.

PNG - 9.8 ko
Pas­sez au nou­veau Blogger
Pas­sez au nou­veau Blog­ger… et essayer de l’utiliser sans votre compte Gmail…

Tous les jours, nous assis­tons au débar­que­ment de Moun­tain View, la cité-​mère de Google, dans nos ser­vices web. La créa­tion de ser­vices Google se fait à une vitesse galo­pante, les acqui­si­tions de ser­vices exis­tants sont annon­cées très régu­liè­re­ment (der­nier en date : You­Tube), les ser­vices expé­ri­men­taux foi­sonnent [35]. Sur cela, tout a été dit et redit. On insiste peut-être un peu moins sur la cohérence que Google compte donner à son entreprise. Pourtant, l'unité documentaire de Google, c'est vous, c'est nous, c'est moi. Se construit peu à peu un système d'information mondial unifié autour d'un identifiant unique, qui s'appuie sur la pierre angulaire que constitue Gmail, le service de courrier électronique de Google. Les exemples qui confirment ce mouvement de fond engagé à pleine vitesse sont nombreux. Le nouveau Blog​ger​.com vous demande de conver­tir vos iden­ti­fiants anciens en iden­ti­fiants gmail. Le trai­te­ment de texte en ligne Wri­tely, après vous avoir qua­si­ment obligé à pas­ser de votre identifiant-​courriel clas­sique à votre identifiant-​courriel Gmail, vient de chan­ger de nom et de s’intégrer, cette nuit, à http://​docs​.google​.com/ (la pein­ture n’est pas encore tout-​à-​fait sèche). Près de trois ans après sa créa­tion, Gmail conti­nue à fonc­tion­ner exclu­si­ve­ment par coop­ta­tion, ce qui per­met à Google de savoir qui est l’ami de qui. Don­née dont ne dis­pose aucun socio­logue et qui consti­tue qua­si­ment un Graal publicitaire…

PNG - 54.9 ko
Docu­ments will be moved permanently
Avant sa dis­pa­ri­tion, Wri­tely vous inci­tait for­te­ment à uti­li­ser votre compte Gmail comme identifiant-​courriel. Opé­ra­tion défi­ni­tive, s’il en est ! Depuis, Wri­tely a été fondu dans l’offre de bureau­tique en ligne de Google et votre compte Gmail sim­pli­fie votre vie… et celle de Google.

L’offre affo­lante de ser­vices en ligne donne chaque jour un peu plus corps au « rêve » d’un Web-​OS. Ser­vices et tech­no­lo­gies inno­vantes, qui per­mettent presque d’espérer se défaire de la tutelle de Micro­soft sur nos bureaux. Mais voilà un rêve qui per­met à Google de lire mes cour­riels (Gmail vous pro­pose déjà des publi­ci­tés contex­tuelles, liées aux mots pré­sents dans votre cor­res­pon­dance), de lire les rap­ports et articles que je rédige (ex-​writely), de connaître mon emploi du temps (Google Calen­dar), de savoir les vidéos que j’aime (You­Tube), etc. Ce n’est pas tota­le­ment nou­veau ? Ce qui est nou­veau, c’est qu’à l’aide de sa quasi-​universalité, des cookies et de l’identifiant-courriel, Google peut connec­ter l’ensemble de ces don­nées autour d’une seule unité docu­men­taire : vous. Le filet, peu à peu, se res­serre. Jamais notre vie pri­vée n’a été aussi menacée.

Faut-​il crier au loup contre ce qui s’apparente, peu ou prou, à un Escla­vage à la sauce « 2.0″ ? On peut le faire. Et consta­ter des pra­tiques simi­laires chez Yahoo (qui a fait conver­ger Fli​ckR​.com vers les comptes Yahoo) et Micro­soft (qui, comme d’habitude, part après la bataille mais s’appuie sur son inso­lente maî­trise de plus de 90% des bureaux). Mais cette démarche permettra-​t-​elle de contrer le pro­ces­sus en cours ? En pous­sant des cris d’orfraie, ne se donne-​t-​on pas bonne conscience à peu de frais ? Les dénon­cia­tions des pra­tiques mono­po­lis­tiques de Micro­soft ont-​elles suffi à contre­ba­lan­cer son immense puis­sance ? L’énergie pas­sée à atta­quer Micro­soft n’aurait-elle pas été mieux uti­li­sée à construire GNU/​Linux ?

Je crois qu’il faut avant tout réflé­chir à des pro­po­si­tions concer­nant les don­nées per­son­nelles en ligne. C’est-à-dire inven­ter des pra­tiques et des prin­cipes n’empêchant pas l’innovation, tout en pré­ser­vant la vie pri­vée et la liberté d’exister hors des « majors du web ». Puis construire un mou­ve­ment de pres­sion assez puis­sant pour impo­ser le res­pect de ces règles. Et, au besoin, s’appuyer sur des outils nous pro­té­geant sans nous iso­ler du numé­rique pour autant. Mozilla Fire­fox, de ce point de vue, pour­rait être notre ami. GNU/​Linux, encore trop mar­gi­nal aujourd’hui, le sera peut-​être moins, mais ses pro­grès sont sai­sis­sants et pour­raient pro­vo­quer la sur­prise. Quoi qu’il en soit, ne l’oublions pas : l’unité docu­men­taire, c’est nous. Sans nous, rien ne se fera. L’avenir ne tient donc qu’à un fil, mais ce fil est dans nos mains.

Il n’est pas de document scientifique qui ne soit citable

JPEG - 15.3 ko
Daddy Long Legs on Mus­ca­dine Leaf
CC by Old Shoe Woman

Il n’est pas de docu­ment scien­ti­fique qui ne soit citable. Dès lors, les efforts des archives ouvertes et des pro­jets d’édition élec­tro­nique s’appuieront sur une base fra­gile si le lec­teur ne sait pas citer en tout cer­ti­tude un docu­ment qu’il vient de lire. Cette ques­tion consti­tuera d’ailleurs pro­ba­ble­ment un frein au dépôt, si les auteurs ne com­prennent pas clai­re­ment à quoi sert leur dépôt. Pour ser­vir la science (avant de ser­vir les évalua­teurs et les mesu­reurs à la sauce Shan­gaï), les dépôts doivent pré­sen­ter une sûreté dans l’usage scien­ti­fique qui en sera fait (citer), bien avant tout autre chose (évaluer, sto­cker, conser­ver, indexer, etc.).

Pour lever cette incer­ti­tude il fau­dra que le docu­ment dis­pose d’un iden­ti­fiant unique stable, très très stable, très simple, très effi­cace. L’OAI ne devrait pas ser­vir à ça, mais on a ten­dance à le faire un peu, ce qui revient à for­mu­ler l’hypothèse d’un dépôt unique mon­dial, qui me semble rela­ti­ve­ment contraire à la logique dis­tri­buée de l’Open archives ini­tia­tive. Le DOI sert à ça, mais il me semble pré­sen­ter des défauts graves (et je suis content d’apprendre que je ne suis pas le seul à le pen­ser). Consé­quence : aujourd’hui, pour l’essentiel des Sciences humaines en France, point d’identifiant unique, seule­ment des URL. Mais même si elles sont l’objet de tous les soins des éditeurs élec­tro­niques, celles-​ci ont ten­dance à bou­ger. Si leur valeur d’usage est très bonne, leur fia­bi­lité l’est moins (même si on constate des évolu­tions notables et plus de rigueur dans leur gestion).

Mais ma pré­oc­cu­pa­tion pre­mière concerne la dif­fu­sion des usages. Si nous adop­tons un iden­ti­fiant unique (IU), il fau­dra être capables de l’expliquer aux lec­teurs, afin qu’ils l’utilisent pour citer la réfé­rence. Il fau­dra donc qu’ils com­prennent com­ment marchent les résol­veurs de noms. Qu’ils aient confiance dans leur fonc­tion­ne­ment. Que ce sys­tème ne leur appa­raisse pas comme une enième péri­pé­tie issue d’une tutelle chan­geante, sou­mise au jeu des chaises musi­cales. Ce sys­tème devra donc avoir des chances d’être mieux que franco-​français : il doit être –ou pou­voir deve­nir– un stan­dard dépas­sant une dis­ci­pline ou un pays. Culti­ver notre excep­tion natio­nale ne me semble pas vrai­ment pertinent.

Il fau­dra aussi que le sys­tème soit simple : je pré­fère des iden­ti­fiants res­sem­blant à un numéro de plaque d’immatriculation plu­tôt que des iden­ti­fiants res­sem­blant à une clé WEP 128 bits ! Les URL uti­li­sées par lemonde​.fr sont signi­fi­ca­tives de ce qu’un pilo­tage par la tech­nique (et/​ou le com­merce) peut don­ner comme résul­tat (désas­treux). Je pré­fère des iden­ti­fiants courts, qui ne seront pas cou­pés dans les cour­riels, qui ne cas­se­ront pas la mise en page d’une note de bas de page, bref, qui s’insèrent dans des usages quo­ti­diens sans pro­vo­quer de conflit, d’interrogation, d’effets secondaires.

Ma convic­tion est que l’URL est un excellent sys­tème, c’est d’ailleurs le seul qui soit aujourd’hui uni­ver­sel, mais qu’il est trop pauvre et fra­gile. Il n’est pas besoin d’expliquer la façon de s’en ser­vir. D’où l’hypothèse d’un IU qui pas­se­rait par le pro­to­cole http. Et la ten­ta­tion de cher­cher du côté des résol­veurs de noms des­ti­nés à réduire la lon­gueur des URL (tinyURL, par exemple). Cette solu­tion per­met­trait de nour­rir les textes de liens stables. L’adoption d’IU igno­rant tota­le­ment l’hypertexte et http pro­vo­que­rait un obs­tacle puis­sant à son usage dans les textes en ligne. Il y aurait, d’une part, la chaine de l’hypertexte, le monde réel, et, d’autre part, le monde idéal des normes par­faites, inuti­li­sées (cf. le cla­vier Dvo­rak et l’espe­ranto). C’est bien d’une inno­va­tion que nous avons besoin, plu­tôt que d’une invention.

Idéa­le­ment, un bon sys­tème d’IU résou­drait le pro­blème de la publi­ca­tion en ligne, d’une part, et du dépôt, d’autre part, c’est-à-dire des dou­blons. Même en uni­fiant les dépôts d’archives ouvertes, il fau­dra prendre en compte la diver­sité des pla­te­formes d’édition élec­tro­nique, qui ont plus voca­tion à se déve­lop­per qu’à dis­pa­raître (Eru­dit, Per­sée, Cairn, Revues​.org pour ne citer que cer­taines, qui relèvent des SHS). Il serait bon de pen­ser à un sys­tème qui soit capable de signa­ler les dépôts sur l’archive natio­nale, d’une part, et la ver­sion éditée en ligne, d’autre part. Une expé­rience sera menée en ce sens entre Revues​.org et HAL l’année pro­chaine, afin de faire en sorte que les dépôts et l’édition élec­tro­nique ne se fassent pas concur­rence, mais au contraire se sou­tiennent. Pour ça, le par­tage d’un IU entre les pla­te­formes me semble indispensable.

Conti­nuons à réflé­chir à un sys­tème d’IU idéal :

- il serait très simple tech­ni­que­ment, donc très robuste

- l’obtention d’un iden­ti­fiant serait gra­tuite

- son attri­bu­tion ne néces­si­te­rait pas de lourdes pro­cé­dures

- il serait très simple dans sa forme, ce qui favo­ri­se­rait son usage quo­ti­dien, et com­pa­tible avec des usages en PAO, trai­te­ment de texte, cour­riel, mes­sa­ge­rie ins­tan­ta­née et dans des articles en ligne (IU cli­quable)

- il ne néces­si­te­rait aucun inves­tis­se­ment tech­nique de la part des cher­cheurs (pas de nou­veau logi­ciel sur le poste du cher­cheur)

- il serait exploi­table par les logi­ciels de biblio­gra­phie (End­note, etc.), par les biblio­thèques, par les éditeurs (et ce, quel que soit le sup­port, ce qui impose un fonc­tion­ne­ment très souple et très rapide)

- il serait capable de dis­tin­guer les ver­sions des docu­ments et, éven­tuel­le­ment, leur sup­port

- il s’appuierait sur un sys­tème rela­ti­ve­ment cen­tra­lisé et serait inter­ro­geable sur autant de sys­tèmes dis­tants que néces­saire (un sys­tème proche du DNS semble assez inté­res­sant à creu­ser)

- il com­por­te­rait peu (pas ?) d’erreurs

- sa main­te­nance édito­riale serait rela­ti­ve­ment économe en moyens humains

- il per­met­trait de décrire des objets très divers (sources his­to­riques, articles scien­ti­fiques, ouvrages, etc.)

- il per­met­trait de jouer, a minima, sur la gra­nu­la­rité de l’information, c’est-à-dire de citer une sub­di­vi­sion du docu­ment. Je pense bien sûr au para­graphe, dont la prise en compte dans le sys­tème pré­sen­te­rait un inté­rêt immense. Mais j’ai conscience que les obs­tacles sont nom­breux.

- il serait adop­table, à terme, par l’édition papier, au même titre que l’ISBN. On obtien­drait ainsi une conti­nuité entre les éditions, et pas un hia­tus voire un conflit entre les uni­vers ana­lo­giques et numé­riques.

- il gère­rait les dou­blons, non par l’ignorance, mais par leur signa­le­ment (conver­gence des ver­sions plu­tôt que conflit des ver­sions, quel que soit le sup­port, quelle que soit la plateforme).

Voici donc le début d’un « cahier des charges idéal », qui se construit en igno­rant volon­tai­re­ment ce qui existe déjà. Vien­dra le temps de l’établissement d’un état de l’Art, qui devra débou­cher sur un tableau com­pa­ra­tif des solu­tions exis­tantes au regard de ce cahier des charges. Espé­rons que des solu­tions concrètes et appli­cables en sortiront.