Archives mensuelles : février 2010

Digital communities and scholarly collaboration

J’ai assisté la semaine der­nière au sémi­naire « tech­nique de publi­ca­tion élec­tro­nique » orga­nisé par le Ser­vice édito­rial et Publi­ca­tion élec­tro­nique de l’IRHT. Pour cette séance, c’est Paul Spence du Cen­ter for Com­pu­ting in the Huma­ni­ties (CCH) du King’s Col­lege qui pré­sen­tait un exposé sur « com­mu­nau­tés numé­riques et col­la­bo­ra­tion savante ». Voici un état brut de mes notes :

Le CCH cor­res­pond à un modèle de « digi­tal huma­ni­ties » dont la recon­nais­sance en Angle­terre est aussi pro­blé­ma­tique qu’en France. L’idée la plus impor­tante est qu’il s’agit d’un « dépar­te­ment » dans la School of Arts and Huma­ni­ties. Ce n’est pas un centre tech­nique, mais un vrai dépar­te­ment qui donne des cours en licence, mas­ter et depuis récem­ment, un doc­to­rat en digi­tal huma­ni­ties. Au niveau de la recherche, plus de 40 pro­jets sont en cours, en col­la­bo­ra­tion avec des par­te­naires. Leur stra­té­gie consiste à être bien classé dans le sys­tème d’évaluation de la recherche bri­tan­nique (RAE).

Le CCH se posi­tionne à l’intersection des dis­ci­plines des huma­ni­tés et des tech­no­lo­gies numé­riques pour le déve­lop­pe­ment de pro­jets spé­ci­fiques. Ce dépar­te­ment ne se défi­nit donc pas comme une infra­struc­tures numé­rique, mais tra­vaille avec elles.

Leurs pro­jets : des éditions cri­tiques, de som­maires, de fac­si­mile, de la modé­li­sa­tion géo­spa­tiale, des pro­jets de visua­li­sa­tion 3D, des cata­logues, des modèles rela­tion­nels et ontologiques.

Ils tra­vaillent sur le prin­cipe que les pro­jets numé­riques sont chers à mener à bien : cela implique la stan­dar­di­sa­tion et la réuti­li­sa­tion des don­nées, mais aussi des modèles, des tech­niques et des outils.

Ils tra­vaillent beau­coup avec TEI, mais ce qui est sur­tout inté­res­sant, ce sont les ini­tia­tives de per­son­na­li­sa­tion de la TEI pour des usages par­ti­cu­liers et des com­mu­nau­tés par­ti­cu­lières, comme Epi­doc pour l’épigraphie. Cet exemple est inté­res­sant pour P. Spence car c’est une com­mu­nauté qui tra­vaille bien ensemble, com­mu­nique par blogs et wikis, et uti­lise les stan­dards en se les appropriant.

Ensuite, P. Spence pré­sente le pro­jet : Fine Rolls of Henry III. Dans ce pro­jet, l’encodage en TEI n’est pas suf­fi­sant. Ils sou­haitent en par­ti­cu­lier tra­vailler avec des listes d’autorité de per­sonnes et de lieux et déter­mi­ner des rela­tions entre les enti­tés. Cela les a conduit a tra­vailler avec du rdf asso­cié à l’encodage TEI. Le pro­jet repose sur une trans­for­ma­tion xslt du docu­ment TEI pour nour­rir une onto­lo­gie rdf. On découvre à cette occa­sion que tout un ensemble de nou­velles visua­li­sa­tions des rela­tions patro­nymes et topo­nymes (sur carte par exemple) deviennent pos­sibles et utiles pour les chercheurs.

Il pré­sente ensuite le Gas­con Rolls Pro­ject. Il s’agit d’un pro­jet de numé­ri­sa­tion de manus­crits de la chan­cel­le­rie anglaise du duché d’Aquitaine (XIV-​XV). Tout un tra­vail est en train d’être fait sur le work­flow pour les cher­cheurs : sur la manière d’encoder en TEI et de nour­rir paral­lè­le­ment une onto­lo­gie : ils uti­lisent EATS (Entity Autho­rity Tool Set), un outil déve­loppé par le New Zea­land elec­tro­nic text cen­ter. EATS uti­lise son propre modèle d’entités, mais les don­nées peuvent être expor­tées vers d’autres modèles.

De manière géné­rale, le CCH doit répondre à une demande de mutua­li­sa­tion de ses outils pour que d’autres équipes puissent les utiliser.

Le pro­jet TEXTvre (basé sur Text­grid) tente de répondre à cet objec­tif : il s’agit d’un envi­ron­ne­ment d’encodage plus géné­rique pour tous type de projets

Autre voie pos­sible : « Anglo-​saxon clus­ter » : pro­pose d’intégrer ou de mettre en rela­tion plu­sieurs (4) pro­jets de numé­ri­sa­tion qui ont été réa­li­sés de manière indé­pen­dante. L’idée est de mettre en rela­tion les enti­tés dans cha­cun d’eux et de voir les cor­res­pon­dances pos­sibles. Les ques­tions se posent de mettre en rela­tion les don­nées et/​ou les fonc­tion­na­li­tés. C’est en tout cas le point de départ d’un mou­ve­ment vers « un point d’entrée unique pour les diverses res­sources médié­vales numériques ».

En effet, on parle de digi­tal huma­ni­ties, de stan­dards comme TEI pour échan­ger des don­nées. Mais dans les huma­ni­tés, dans la pra­tique, on ne le fait pas vrai­ment. Il y a des rai­sons, de cultures dis­ci­pli­naires par exemple. Anglo-​saxon Pro­ject vise à avan­cer sur ce point. Cela devrait aussi pas­ser par la publi­ca­tion de réfé­ren­tiels, de gui­de­lines, etc. Un dia­logue est engagé avec l’initiative de la Char­ters Enco­ding Ini­tia­tive (une TEI pour l’édition diplomatique).

Conclu­sion : en ce moment au Royaume-​Uni il y a une pres­sion sur les huma­ni­tés pour être évaluées en terme d’ »impact ». C’est aussi une pres­sion pour qu’il y ait un retour vers le grand public. Même s’il faut résis­ter aux torts que cette injonc­tion pour­rait por­ter à la tra­di­tion de rigueur intel­lec­tuelle que porte la tra­di­tion des huma­ni­tés, il est pos­sible de faire quelque chose en ce sens.

La dis­cus­sion porte sur trois aspects :

  1. La ques­tion se pose du niveau de per­son­na­li­sa­tion per­ti­nent pour la TEI. Jusqu’à pré­sent par exemple, la CEI est plu­tôt dans une impasse, sans doute par volonté de trop grande généricité.
  2. L’aspect très inté­res­sant, c’est le déve­lop­pe­ment d’ontologies qui, contrai­re­ment aux index clas­siques, sont indé­pen­dants (mais nour­ris par) des docu­ments. Ces onto­lo­gies pro­mettent d’être des outils de recherche beau­coup plus puis­sants et c’est vrai que les pro­jets sont encore bal­bu­tiants dans le domaine. On en est au point où on sait faire des éditions élec­tro­niques en TEI. La construc­tion d’ontologies sur la base de listes d’autorités est sans doute le pro­chain défi.
  3. Une par­tie de la dis­cus­sion porte sur l’appropriation des méthodes et des outils par les cher­cheurs. De manière éton­nante, le CCH ne semble pas tra­vailler sur une base régu­lière avec Claire War­wick du Depart­ment of Infor­ma­tion Stu­dies à l” Uni­ver­sity Col­lege Lon­don et direc­trice de l’UCL Centre for Digi­tal Huma­ni­ties.
    Cette ques­tion ne semble donc pas au coeur des pré­oc­cu­pa­tions du CCH

Tools of change for publishing

Ground zero (by Marin Dacos, licence CC)

Ground zero (by Marin Dacos, licence CC)

Tools of change for publi­shing (New York, Février 2010)

Pour la deuxième année consé­cu­tive, me voici à New York, pour assis­ter à Tools of change for publi­shing (TOC), la grand-​messe sur l’édition et sur l’édition élec­tro­nique. C’est à Times Square que se pro­duit l’événement, au milieu des néons et au sein d’un palace au luxe tapageur…

Cette année, ce voyage d’études a été financé par Cap Digi­tal, par l’École des hautes études en sciences sociales (EHESS) et par le Centre pour l’édition élec­tro­nique ouverte (Cléo).

Comme l’année der­nière, je ten­te­rai de prendre quelques notes et de vous faire pro­fi­ter de ce que j’apprends outre-​Atlantique. Cette fois, j’ai la chance d’avoir un com­pa­gnon de jeu en la per­sonne d’Hubert Guillaud, qui blogue plus vite que son ombre, et qui va me per­mettre de le regar­der tapo­ter pen­dant les confé­rences… Il a déjà publié un compte-​rendu ce matin : Construire la pré­sence des auteurs en ligne.

Pour lire les billets rédi­gés à l’occasion de TOC 2010, c’est par ici.

Lire la suite

Retour sur 40 ans de relations entre sciences humaines et informatique

Digi­tal humanities

Pierre vient de publier sur L’édition élec­tro­nique ouverte le résumé, le sup­port de pré­sen­ta­tion et les notes prises lors du sémi­naire que nous ani­mons sur les Digi­tal huma­ni­ties à l’EHESS. Il y a même l’enregistrement audio. [EDIT] Euh… en fait, j’ai fait une fausse manoeuvre, et il fau­dra patien­ter un peu que nous réta­blis­sions le fichier audio avant de pou­voir l’écouter…[/EDIT]

Dans le cadre du sémi­naire Digi­tal Huma­ni­ties : les trans­for­ma­tions numé­riques du rap­port aux savoirs, nous avons reçu le 16 décembre der­nier Lou Bur­nard, qui est direc­teur de l’Information and sup­port group des Oxford Uni­ver­sity Com­pu­ting Ser­vices. Figure impor­tante de la com­mu­nauté TEI, il est co-​éditeur des Gui­de­lines for Elec­tro­nic Text Enco­ding and Inter­change et par­ti­cipe aux tra­vaux du Bri­tish Natio­nal Cor­pus. Il tra­vaille depuis cette année à temps par­tiel pour le TGE Adonis.

Résumé de la communication

Les sciences humaines sont en train de vivre un tour­nant majeur en inté­grant de manière de plus en plus étroite l’usage des tech­no­lo­gies numé­riques dans leurs pra­tiques de recherche. Cette évolu­tion est pour­tant en marche depuis plu­sieurs décen­nies, avec, dès les années 60, la réa­li­sa­tion de l’index Tho­mis­ti­cus par Roberto Busa. Dans son inter­ven­tion, Lou Bur­nard revient sur cette évolu­tion his­to­rique qu’il pro­pose d’analyser sui­vant une struc­tu­ra­tion en trois périodes : Lite­rary & lin­guis­tic com­pu­ting, Huma­ni­ties com­pu­ting et enfin Digi­tal huma­ni­ties. Ces trois moments peuvent être iden­ti­fiés comme trois pistes et posi­tion­ne­ments dif­fé­rents dans la manière d’explorer les rela­tions entre sciences humaines et informatique.

La suite sur L’édition élec­tro­nique ouverte.

Publications en accès libre en sciences humaines et sociales : les exemples de Revues​.org et de HAL-​SHS

Open access logo

Je suis invité demain à inter­ve­nir dans le col­loque sur « Les sciences humaines et le patri­moine cultu­rel à l’ère digi­tale » qu’organise l’Institut His­to­rique Alle­mand à Paris. Voici mon résumé et mon sup­port de présentation

Résumé

On dis­tingue habi­tuel­le­ment deux voies au sein du mou­ve­ment pour l’accès ouvert aux résul­tats de la recherche : la voie « or » (gold open access) qui concerne les publi­ca­tions — essen­tiel­le­ment les revues à comité de lec­ture, et la voie « verte » (green open access) qui désigne l’auto-archivage par les cher­cheurs eux-​mêmes des ver­sion pré-​prints de leurs articles. Deux inter­ro­ga­tions sont régu­liè­re­ment sou­le­vées à ce pro­pos :
1. Le mou­ve­ment pour l’accès ouvert trouve son ori­gine et s’est mas­si­ve­ment déve­loppé au sein de dis­ci­plines scien­ti­fiques par­ti­cu­lière (sciences phy­siques, mathé­ma­tiques, bio­lo­gie et méde­cine). Est-​ce qu’il ne résulte pas d’un mode de com­mu­ni­ca­tion scien­ti­fique propre à ces dis­ci­plines qui ne convien­drait pas à d’autres ? L’open access est-​il un mode de déve­lop­pe­ment sou­te­nable pour les sciences humaines et sociales qui ont leur culture scien­ti­fique propre ?
2. Un cer­tain nombre d’observateurs opposent les voies « or » et » verte » de l’accès ouvert, les consi­dé­rant comme deux modèles alter­na­tifs parmi les­quels il fau­dra choi­sir. Com­ment faire son choix, quels sont les inté­rêts et les incon­vé­nients de l’une et de l’autre ?
On mon­trera à par­tir d’une ana­lyse de deux exemples fran­çais : le por­tail de revues en ligne de sciences humaines et sociales Revues​.org (200 revues en ligne) et l’archive ouverte HAL-​SHS (20 000 dépôts en texte inté­gral) qu’il est pos­sible d’apporter des réponses viables, concrètes et en acte, à ces deux ques­tions : d’un côté les modèles d’accès ouvert « or » et « vert » sont com­pa­tibles avec les sciences humaines et sociales, sous condi­tion d’adaptations. De l’autre, les deux voies ne doivent pas être conçues comme concur­rentes mais com­plé­men­taires, parce qu’elles répondent à des besoins très différents.

Sup­port de présentation