L’open archives initiative (octobre 2005)

11 octobre 2005
By


Le mou­ve­ment des archives ouvertes est déci­sif pour la dif­fu­sion des résul­tats de la recherche scien­ti­fique. Sa réus­site est pos­sible car elle fait conver­ger une volonté des cher­cheurs et des ins­ti­tu­tions. Ce mou­ve­ment est en train de tou­cher les sciences humaines et sociales fran­çaises, avec l’ouverture d’HALSHS. Il reste cepen­dant encore peu connu, mal­gré les prises de posi­tion offi­cielles de grands orga­nismes de recherche inter­na­tio­naux (voir la décla­ra­tion de Ber­lin), CNRS en tête.

Dans la fran­co­pho­nie et en sciences humaines et sociales, voici les dépôts ouverts au public et que j’ai pu iden­ti­fier et mois­son­ner sans pro­blème. Le total est de 55000 enregistrements.

-Biblio­thèque natio­nale de France (28371 enregistrements)

-Per­sée (12262 enregistrements)

-Revues​.org (10005 enregistrements)

-Hal SHS (2061 enregistrements)

-Archi­ve­SIC (619 enregistrements)

-Uni­ver­site Lyon 2 — Cyber­theses (542 enregistrements)

-Jean Nicod (434 enregistrements)

-Ecole natio­nale des chartes (253 enregistrements)

-ENS LSH (103 enregistrements)

-Mém­SIC : Mémoires en Sciences de l’Information et de la Com­mu­ni­ca­tion (56 enregistrements)

-Uni­ver­sité de Reims (49 enre­gis­tre­ments, dont une par­tie ne relèvent pas des SHS)

-Dépôt archives ouvertes de Lyon 2 (38 enregistrements)

-Uni­ver­sité Paris X (14 enregistrements)

Quelques remarques :

- Le dépôt de la BNF est en fait celui de Gal­lica. La moder­ni­sa­tion de Gal­lica est donc en route et c’est une excel­lente nou­velle. L’insertion de notre Biblio­thèque natio­nale dans le pay­sage des archives ouvertes est un événe­ment déci­sif.

- On notera le record détenu par l’Institut Jean Nicod (pour un dépôt de labo­ra­toire) dont la poli­tique est claire et établie, et qui par­vient à rem­plir son dépôt de façon très effi­cace.

- L’absence d’Erudit est éton­nante.

- Les pro­jets nais­sants que sont Cairn et le CENS sui­vront probablement.

En conclu­sion, le total d’enregistrements est encou­ra­geant. La plu­part des dépôts signa­lés dans cette liste pré­voient une crois­sance très impor­tante à court ou moyen terme. En par­ti­cu­lier, HAL SHS et Per­sée semblent pro­mis à un bel ave­nir. Cepen­dant, il ne fau­drait pas se méprendre sur le clas­se­ment que j’ai adopté, car il n’indique pas une hié­rar­chie : le dépôt de Gal­lica n’a pas plus d’importance scien­ti­fique ou stra­té­gique que celui de l’ENS LSH ou de l’Ecole natio­nale des chartes. Le prin­cipe intrin­sèque de l’OAI est l’interopérabilité, c’est-à-dire que les rivières vont aux fleuves et que les fleuves vont à la mer. Il est sain qu’une grande archive natio­nale assure la sécu­rité et la sta­bi­lité des dépôts per­son­nels de cher­cheurs (HALSHS), mais il est égale­ment heu­reux que des ini­tia­tives telles que Archi­ve­SIC et Mém­Sic (por­tées, d’ailleurs, par la même struc­ture que HALSHS, le CCSD), per­mettent d’identifier clai­re­ment des espaces thé­ma­tiques. C’est à la fois un gain pour le lec­teur, qui trou­vera plus faci­le­ment ce qu’il cherche, et pour l’auteur, qui est incité au dépôt de façon moins anonyme.

Il ne faut pas non plus prendre le nombre d’enregistrements pour argent comp­tant. En effet, un enre­gis­tre­ment peut être une simple réfé­rence biblio­gra­phique et un autre peut conte­nir le texte inté­gral de l’article. Cer­tains dépôts iden­ti­fient des pages de « Livres reçus » d’une revue comme enre­gis­tre­ment, au même titre qu’une thèse entière publiée par Cyber­thèse. Le tra­vail néces­saire à la mise en ligne et l’intérêt scien­ti­fique de chaque docu­ment sont extrê­me­ment inégaux. Il est donc pru­dent de ne pas s’en tenir au seul cri­tère quan­ti­ta­tif, même s’il reste un indi­ca­teur inté­res­sant, sur lequel l’observatoire fera des points réguliers.

Tags: ,

5 Responses to L’open archives initiative (octobre 2005)

  1. Hubert Guillaud on 11 octobre 2005 at 17 h 32 min

    L’inégalité des dépôts pose tout de même ques­tion sur la « valeur » du quan­ti­ta­tif. Le chiffre de 53 000 dépôts ne peut donc pas être livré brut, car il invite à une course au volume, à la visi­bi­lité ins­ti­tu­tion­nelle, qui risque de se faire au détri­ment de la qua­lité. Il faut qu’émergent les outils d’une pon­dé­ra­tion claire et pré­cise de ce volume.

    Je sup­pose que ça va être l’enjeu des pro­chains billets. :)

  2. Marin on 11 octobre 2005 at 18 h 31 min

    En fait, il y a une dou­zaine de dépôts, et 50.000 enre­gis­tre­ments dans ces dépôts (petite nuance de voca­bu­laire). J’ai pro­cédé à ce repé­rage quan­ti­ta­tif pour faire un état des lieux concret, rapide et facile.

    Je ne crois pas vrai­ment à la mise au point d’une méthode de pon­dé­ra­tion des volumes par la qua­lité. Clai­re­ment, la quan­tité res­tera ce qu’elle est, c’est-à-dire sans inté­rêt, si elle n’a pas de valeur. Pour ça, l’heure n’est pas à la pon­dé­ra­tion mais à la dif­fu­sion d’usages de lec­ture, d’une part, et de dépôt, d’autre part. Ensuite, le jeu des cita­tions fera le reste. Pas­sée une période de tran­si­tion néces­sai­re­ment confuse, les dépôts seront tel­le­ment visibles dans la com­mu­nauté scien­ti­fique, tel­le­ment déci­sifs dans l’évaluation des cher­cheurs et des équipes, que la médio­crité y sera chas­sée par les inté­res­sés eux-​mêmes. Car ce qui fai­sait impres­sion dans un CV (plu­tôt 20 réfé­rences que 10, même si les 10 sup­plé­men­taires ont peu d’intérêt) va plom­ber, lit­té­ra­le­ment, un iti­né­raire scien­ti­fique, car le texte inté­gral sera asso­cié à la réfé­rence biblio­gra­phique. Dès lors, le nombre tuera le nombre, et la qua­lité, assez logi­que­ment, devrait l’emporter.

    La pleine lumière est gage de qua­lité. Elle consti­tue un excellent régu­la­teur. Ce qui était pos­sible dans une revue peu dif­fu­sée, peu connue, peu acces­sible, devient impos­sible dans l’espace public, acces­sible, indexable, consul­table, impri­mable et citable que consti­tue le dépôt d’archive ouverte.

  3. Anonyme on 11 octobre 2005 at 22 h 15 min

    Le dépôt de la BNF, « déci­sif pour la dif­fu­sion des résul­tats de la recherche scien­ti­fique » ? Les cher­cheurs de D-​Lib ont com­mis la même bourde.

    Les eprints fran­çais sans la BNF, c’est à peine plus de 20 000 réfé­rences (vous en avez oublié quelques-​uns, la MSH-​Alpes par exemple, mais leur publi­cité est tel­le­ment mau­vaise que c’est plus qu’excusable). Il faut aussi attendre le bas­cu­le­ment de PubliCNRS dans HAL-​SHS.

    On est très, très loin d’une pro­duc­tion aca­dé­mique hono­rable. L’Amérique latine a lancé un réper­toire de thèses qui est déjà deux à trois plus impor­tant que l’ensemble des IR (ins­tit. repo­sit.) français.

  4. Marin on 12 octobre 2005 at 8 h 39 min

    Ce n’est pas une bourde, même si, en effet, Gal­lica ne pro­duit pas des articles scien­ti­fiques, mais des archives, au sens clas­sique. C’est déci­sif comme fac­teur d’incitation, sachant que dans un pays de tra­di­tion jaco­bine comme le nôtre, le ral­lie­ment de struc­tures majeures et cen­trales est sus­cep­tible d’atténuer les freins.

    Avec les mêmes don­nées, j’aurais en effet pu écrire un billet pes­si­miste ou insa­tis­fait. Mais, pour avoir bataillé depuis six ans sur ce type de dos­sier, pour avoir essuyé des « vous êtes bien naïf, jeune homme, jamais les cher­cheurs n’accepteront de mettre en ligne gra­tui­te­ment leurs articles » dans de mul­tiples col­loques, pen­dant de longues années, je constate que les choses changent. J’ai plai­sir à le sou­li­gner. J’ai conscience que nous n’en sommes qu’au début d’un vaste mouvement.

    Lors de la créa­tion des pre­miers dépôts (Jean Nicod, Cyber­thèses, ENS LSH, HAL), l’écho dans la com­mu­nauté scien­ti­fique fut tota­le­ment nul. L’écho de la créa­tion de HALSHS est incom­pa­rable. Pour des rai­sons jaco­bines, d’ailleurs : l’impulsion vient du som­met du CNRS. Mais, au fond, peu importe le vin, pourvu qu’on ait l’ivresse. D’autant que, pour une fois, les « tutelles » ont reconnu le tra­vail pion­nier des pré­cur­seurs, et leur ont donné les moyens de tra­vailler correctement.

    Tout n’est pas par­fait, loin de là, mais le train a démarré. C’était, au fond, le mes­sage de mon billet.

  5. Marin on 12 octobre 2005 at 8 h 53 min

    Concer­nant les dépôts qui sont man­quants dans ma liste : j’ai pu en oublier (merci de me les signa­ler), mais j’en ai sur­tout éliminé. J’ai testé le dépôt de la MSH Alpes et décidé de ne pas le citer car je ne le consi­dère pas comme opé­ra­tion­nel, dans la mesure où les URL per­met­tant d’accéder à la fiche des enre­gis­tre­ments sont fausses et débouchent sur des erreurs 404. Par exemple, l’article « Intro­duc­tion (83, 2) » n’a pas d’auteur, a une date pro­ba­ble­ment fausse, n’a pas de résumé per­ti­nent, et pointe vers une URL rela­tive qui pro­voque une « Page not found ». Dom­mage. Cela dit, ma ligne de conduite consiste plus à mettre en avant ce qui marche que ce qui ne marche pas encore. Car je n’en doute pas : le dépôt de la MSH Alpes finira par fonc­tion­ner et, ce jour-​là, je serai heu­reux d’en signa­ler l’existence.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*


Notifiez-moi des commentaires à venir via email. Vous pouvez aussi vous abonner sans commenter.

Enter your email address to subscribe to this blog and receive notifications of new posts by email.

Join 5 other subscribers

Twitter de Marin

Twitter de Pierre