La mécanique des fluides

3 septembre 2008
By


Writing

if:book signale une ini­tia­tive très inté­res­sante : la repu­bli­ca­tion en ligne, sous la forme d’un blog hébergé par Word​Press​.com, dujour­nal de George Orwell. Le 9 août 2008 a com­mencé la publi­ca­tion des notes (j’allais écrire « billets ») prises le 9 août 1938… C’est donc avec un léger dif­féré de soixante-​dix années, scru­pu­leu­se­ment res­pecté, que le car­net de George Orwell, figure lit­té­raire du XXe siècle, est publié en ligne. L’auteur de La ferme des ani­maux et de 1984, entre donc de plein pied dans le monde de l’édition électronique.

Pro­ces­sus dis­cret vs pro­ces­sus continu

Cette ini­tia­tive est inté­res­sante d’abord en rai­son de sa stra­té­gie édito­riale : ne pas publier le texte en un seul bloc, ou en quelques volumes, comme on l’aurait fait dans l’édition papier. Mais s’appuyer sur la nature liquide du numé­rique. On peut publier en goutte-​à-​goutte ou mas­si­ve­ment, en fonc­tion des besoins de la plan­ta­tion. Ainsi, le 28 août 1938, il y a exac­te­ment 70 ans, Orwell écrit : « La nuit der­nière, une heure de pluie. La jour­née d’hier a été chaude et cou­verte. Aujourd’hui, idem, avec quelques gouttes de pluie dans l’après-midi. La récolte du hou­blon com­men­cera dans une semaine envi­ron » [61]. La publication cherche donc à être particulièrement fidèle au processus d'écriture du carnet, et non à un processus discret de publication de celui-ci par volumes papier. J'utilise le terme discret- au sens mathématique. Dans ce sens, la publication numérique peut être considérée comme continue. Elle ne l'est pas seulement en raison de son rythme. Elle l'est plus globalement, me semble-t-il, par nature.

Une information pauvre ?

Considérons la structuration de l'information. Les porteurs de ce projet ont fait leur ce qui pourrait être une maxime du web : simple is beautifull. En effet, ils se sont conten­tés de tech­no­lo­gies basiques, disons low-​tech [62] pour faire simple : un CMS libre spécialisé dans les blogs (wordpress), un hébergement gratuit sur une plateforme industrielle et privée (wordpress.com), quelques liens hypertextes, quelques tags. Selon tout apparence, il s'agit d'une entreprise éditoriale rudimentaire d'un point de vue informationnel : chaque billet est décrit par un titre, il contient un texte édité dans un éditeur WYSIWYG (et non dans un éditeur XML en fonction d'une DTD très riche de type TEI) S'y ajoutent des rubriques, des tags et des commentaires rédigés par le public et par l'éditeur.

Naviguer n'est pas feuilleter

En réa­lité, le cor­pus est riche­ment décrit. Il l’est, d’abord, grâce aux notes de l’édition ori­gi­nale, entre­prise qui a duré 17 ans, menée par le Pro­fes­seur Peter Davi­son. Il l’est, ensuite, par un nou­veau tra­vail d’enrichissement pro­duit par l’éditeur (The Orwell Prize). Ainsi, les tags n’existaient pas dans l’édition ori­gi­nale en 20 volumes. Et, le 28 août 2008, les tags « hop-​picking » et « wea­ther » ont été asso­ciés au billet du jour. Des caté­go­ries sont égale­ment asso­ciées aux billets. Dans quelques mois, il sera donc pos­sible de par­cou­rir par navi­ga­tion ce cor­pus de façon inédite, sim­ple­ment parce qu’il est désor­mais indexé, à tra­vers un tra­vail édito­rial de longue haleine.

De plus, l’éditeur a inséré des liens hyper­textes à l’intérieur du texte. Le 25 août, les liens ajou­tés por­taient vers :

- Google maps,

- Ukmoths, un site spé­cia­lisé dans la des­crip­tion des papillons, et Owl­pages, un site spé­cia­lisé dans la des­crip­tion des hiboux,

- Wiki­pe­dia (ver­sion anglaise)

- une note sur la récolte du Hou­blon dans les mémoires d’Orwell, publiée sur le site http://​www​.theor​well​prize​.co​.uk

Et, comme tou­jours, le banal et déci­sif modèle de la conversation

Comme dans tout blog, il existe égale­ment la pos­si­bi­lité d’ajouter des com­men­taires. Ce sont pas moins de 23 com­men­taires, for­mant une conver­sa­tion, qui ont été ajou­tés au billet du 25 août. Les dis­cus­sions portent très pré­ci­sé­ment sur le billet. Nous igno­rons s’ils sont publiés a priori ou a pos­te­riori [63].

Il semble bien que nous soyons en pré­sence d’un tra­vail d’édition érudite, s’appuyant sur des res­sources de nature numé­rique diverses.

Tra­vail d’édition ou bri­co­lage technique ?

Les puristes s’inquièteront de l’hétérogénéité des liens, donc de leur pro­bable insta­bi­lité, puisque le web est un gigan­tesque cime­tière d’erreurs 404… Ils note­ront des liens vers des outils pour les­quels la cita­bi­lité, le main­tien du libre accès, la per­sis­tance de la qua­lité de l’information, peuvent être incer­tains. Enfin, ils avan­ce­ront qu’une pla­te­forme de blogs n’est pas une pla­te­forme d’édition élec­tro­nique. Que l’encodage XML n’est pas conforme à l’état de l’art de l’édition de sources… N’en jetons plus.

Tou­jours pas d’utilisation de Web​ci​ta​tion​.org à l’horizon …

Concer­nant l’instabilité de liens lan­cés vers le web, l’inquiétude est de mise… et je me demande s’il ne serait pas oppor­tun de leur pro­po­ser de s’appuyer sur des pro­jets tels que Web­cite qui sont des­ti­nés aux cher­cheurs qui veulent citer une res­source et en cap­tu­rer une image dura­ble­ment, via un ser­vice tiers en lequel on puisse avoir confiance.

La dyna­mique des couches

Je suis beau­coup moins inquiet en ce qui concerne le carac­tère pré­ten­dû­ment insuf­fi­sant de la séman­ti­sa­tion. Si les éditeurs du jour­nal d’Orwell par­viennent à tenir le niveau d’enrichissement par tags, caté­go­ries et liens hyper­textes dont ils font preuve actuel­le­ment, ils construi­ront un cor­pus hau­te­ment enri­chi. Les infor­ma­tions ins­crites dans le texte, mais pas enco­dées séman­ti­que­ment, comme la date de publi­ca­tion ori­gi­nale, par exemple, pour­ront être ajou­tées à l’avenir. Il fau­dra chan­ger de pla­te­forme ? Qu’à cela ne tienne ! Il fau­dra ré-​encoder le contenu ? Où est le pro­blème ? L’édition papier nous a habi­tués à une forme tex­tuelle et infor­ma­tion­nelle figée. L’information numé­rique est consti­tuée de couches, qui peuvent être ajou­tées à des époques suc­ces­sives. [64] C’est, si j’ai bien com­pris, plus ou moins le le sens de la redo­cu­men­ta­ri­sa­tion [65] défen­due par Roger T. Pédauque et par ses parents. Quoi qu’il en soit, il s’agit, me semble-​t-​il, d’un pro­ces­sus d’enrichissement infor­ma­tion­nel continu. Tou­jours inachevé, ce pro­ces­sus est consti­tu­tif du docu­ment numérique.

Au risque de l’accident industriel ?

Or, en ce domaine, l’accident indus­triel est tou­jours pos­sible. Car il ne suf­fit pas de décla­rer que le numé­rique est adapté à des enri­chis­se­ments pro­gres­sifs. Encore faut-​il que cela soit pos­sible dans la réa­lité et que les bud­gets n’explosent pas au pas­sage. Or, faudra-​t-​il jeter les pre­mières couches d’information, en rai­son de l’impossibilité de les récu­pé­rer sur une nou­velle pla­te­forme ? Faudra-​t-​il les aban­don­ner en rai­son de leur incom­pa­ti­bi­lité avec de nou­veaux besoins ? Faudra-​t-​il dépen­ser des sommes impor­tantes pour les appau­vrir, leur nature étant trop irré­gu­lière, voire confuse, pour être une base cor­recte de nou­veaux enri­chis­se­ments ? Une étude de géné­tique des textes, par exemple, pourra-​t-​elle se gref­fer sur les couches exis­tantes ou devra-​t-​elle repar­tir d’un docu­ment allégé ?

On peut tou­jours craindre ce type de dif­fi­culté, car il est dif­fi­cile de pré­voir les besoins du futur. Et parce que la ten­ta­tion d’une struc­tu­ra­tion de l’information « bri­co­lée » menace à chaque ins­tant. Ainsi lit-​on dans les com­men­taires du jour­nal d’Orwell des pro­po­si­tions d’utilisation de mises en forme locales, telles que l’adoption de polices ou de cou­leurs par­ti­cu­lières, pour dési­gner des zones par­ti­cu­lières du texte retrans­crit… On pour­rait citer nombre d’initiatives d’édition élec­tro­nique repré­sen­tant un tra­vail énorme et un bud­get consé­quent, et dont les résul­tats furent jetés aux oubliettes du numé­rique pour défaut de structuration.

Or, entre le palimp­seste indi­geste et celui qui flatte le palais en rai­son de la finesse de ses nuances et de la qua­lité de ses ingré­dients, il n’y a sou­vent que quelques octets de dif­fé­rence par docu­ment… La pru­dence s’impose.

La dyna­mique des usages et des for­mats ouverts

A l’inverse, on pour­rait citer de nom­breux exemples d’édition élec­tro­nique qui ont sur­vécu à l’érosion induite par l’écoulement, rapide, du temps numé­rique. Ces textes-​là ont sur­vécu car ils ont pu se com­por­ter comme des couches d’informations res­tées lisibles, exploi­tables et enri­chis­sables. En ce qui concerne l’édition élec­tro­nique du jour­nal d’Orwell, il est pos­sible que l’initiative ne soit pas des­ti­née à être aban­don­née dans les cime­tières de l’histoire. Pourquoi ?

D’une part, parce que ses pro­mo­teurs ont fait le pari des usages. Faire le choix d’une pla­te­forme publique et célèbre, facile d’accès, rapide à ali­men­ter et où les com­men­taires sont aisés, c’est en effet faire le choix des usages de lec­ture et d’annotation. C’est-à-dire qu’ils ont choisi de rendre le texte lar­ge­ment public. Ils l’ont publié, au sens noble.

D’autre part, et sur­tout, parce que les éditeurs ont fait le choix d’une pla­te­forme ouverte, dans laquelle il est pos­sible de rapa­trier à tout moment la tota­lité du contenu, sans appau­vris­se­ment, sans alté­ra­tion, sans perte donc, mais aussi sans bar­rière, sans douane, sans cer­bère. Word​Press​.com joue la carte de l’ouverture des don­nées et des for­mats, au plus grand béné­fice des auteurs des car­nets publiés sur cette pla­te­forme. Tous ne peuvent pas en dire autant…

Tags: , ,

5 Responses to La mécanique des fluides

  1. Got on 4 septembre 2008 at 0 h 07 min

    Quelle ques­tion dif­fi­cile à résoudre que tu exposes ici ? Faut-​il pri­vi­lé­gier la rapi­dité de mise en place, la faci­lité d’utilisation, le carac­tère nova­teur de la publi­ca­tion ou la struc­tu­ra­tion de l’information, la pro­blé­ma­tique de conser­va­tion, de sim­pli­cité de ré-​utilisation et de récupération… ?

    J’ai tout d’abord pra­ti­qué le pre­mier modèle (celui choisi par ce pro­jet) avant de me rabattre sur le second et de le défendre bec et ongles. Avec un peu de recul, je dirais aujourd’hui qu’il n’y a pas un choix meilleur que l’autre, ils pré­sentent tous les deux des avan­tages et des incon­vé­nients et que cela dépend du contexte, des moyens et de l’ambition du projet.

    Si, dès le départ, j’avais choisi le second modèle, je ne serais jamais par­venu au résul­tat escompté. Le pre­mier modèle te laisse une sou­plesse, te per­met d’innover rapi­de­ment et faci­le­ment. Le second modèle relève d’une logique que je qua­li­fie­rais, si tu le per­mets, d’industriel. Il est donc plus dif­fi­cile à manoeu­vrer ou à mettre en place des choses très ori­gi­nales, même si ce n’est pas impos­sible. Or, tu le sais comme moi, à par­tir du moment où on met en place plu­sieurs éditions élec­tro­niques sur un même site, il faut en pas­ser par la mise en place d’une plate-​forme-​logiciel-​application-​usine à gaz (rayez les men­tions inutiles ;-) ), car la main­te­nance de dif­fé­rentes plates-​formes est rapi­de­ment ingé­rable ou au prix d’effort que nous ne pou­vons rare­ment nous offrir. Dans ces cas-​là, on a ten­dance à faire atten­tion à la struc­tu­ra­tion de l’information, aux pro­blé­ma­tiques de cita­bi­lité, aux res­pects strictes des stan­dards…, ce qui ne signi­fie pas pour autant tom­ber dans un délire de struc­tu­ra­tion. On peut faire des choses très simples en TEI :-)

    Bref, les deux modèles doivent exis­ter (il y en a cer­tai­ne­ment d’autres), parce que, tout sim­ple­ment, les éditions Gal­li­mard ne font pas la même chose que les éditions de la Dille­tante ou encore moins que l’Ecole des loi­sirs, pour­quoi en serait-​il dif­fé­rent pour l’édition élec­tro­nique ? Ca devien­drait rapi­de­ment triste à mourir :-)

  2. Hubert Guillaud on 4 septembre 2008 at 8 h 12 min

    Comme il y a dif­fé­rentes façons de lire, il y a dif­fé­rentes façons de publier (même élec­tro­ni­que­ment). Il n’y a pas 2 modèles, mais une mul­ti­tude, qui per­mettent cha­cune de tou­cher des publics, des lec­teurs et des lec­tures différentes.

    Merci en tout cas Marin de cette très intel­li­gente ana­lyse d’un pro­cédé d’édition élec­tro­nique qui paraît certes simples, mais qui a plus d’atout qu’il n’en paraît.

  3. Clément Laberge on 4 septembre 2008 at 10 h 26 min

    Merci Marin pour ce texte vrai­ment très inté­res­sant par toutes les les rami­fi­ca­tions qu’il offre.

    J’ai for­mulé un com­men­taire sous forme de témoi­gnage, que j’aurais peut-​être dû publier ici au lieu de sur Lafeuille, mais qu’importe, le voici :

    http://​lafeuille​.homo​-nume​ri​cus​.net…

  4. Stéphane Pouyllau on 7 septembre 2008 at 6 h 49 min

    Mon expé­rience m’a per­mis de consta­ter une chose : la ten­ta­tion « d’une struc­tu­ra­tion de l’information “bri­co­lée” » est la plu­part du temps lié à deux phénomènes :

    1) La ten­ta­tion de repro­duire dans le monde du numé­rique les tra­di­tions de l’édition papier. Le meilleur exemple est le mode « page à page » dans les sites web (j’ai eu à accé­der, il y a quelques années, à ce type de demande). Plus loin, il y a la ques­tion des appa­reils cri­tiques, qui reste très « tra­di­tion­nelles » (un seul niveau est envi­sagé) qui entraine donc peu de recherches pour struc­tu­rer plus en avant l’information. Ceci est d’autant plus vrai que la publi­ca­tion élec­tro­nique (de sources dans mon domaine) reste très majo­ri­tai­re­ment « comme sur du papier ».

    2) La ques­tion des métier : les métiers de l’édition clas­sique sont encore (trop) éloi­gnés de ceux dont la mis­sion est la struc­tu­ra­tion de l’information : les docu­men­ta­listes, ces der­niers sont encore trop tourné vers le signa­le­ment et le simple biblio­gra­phique. Dans les labo­ra­toires SHS, les ser­vices d’édition sont encore for­te­ment tour­nés vers le papier, quand le numé­rique appa­rait il est encore sou­vent « en plus », en « sur­charge » et la struc­tu­ra­tion de l’information est alors secon­daire car seule la « forme » compte effectivement.

    Je rejoints Got, mais pour moi, l’une des clés de l’équilibre est la mise en place d’une chaine de com­pé­tences métiers (cher­cheurs + docu­men­ta­liste + ingé­nieurs en digi­tal huma­ni­ties) entrai­nant un tra­vail d’équipe transversal.

  5. Marin Dacos on 8 septembre 2008 at 13 h 03 min

    Merci pour ton commentaire.

    Concer­nant ton point 1. Je suis bien d’accord avec toi. On peut, en effet, être sou­mis à des contraintes pas­séistes, qui obligent à sur-​structurer les conte­nus, pour émuler des com­por­te­ments ana­lo­giques, sans pro­po­ser de véri­table valeur ajou­tée. En revanche, la com­plexité des docu­ments et leur coût va en aug­men­tant radi­ca­le­ment. La cita­bi­lité élec­tro­nique en est géné­ra­le­ment affec­tée. Enfin, bien sou­vent, les pos­si­bi­li­tés d’usages ont été tel­le­ment pré­pro­gram­mées, enca­drées, pré­pen­sées en fonc­tion d’un glo­rieux passé, que l’usage lui-​même est rendu délicat.

    Concer­nant ton point 2 et ta conclu­sion. Entiè­re­ment d’accord sur la ques­tion de la trans­ver­sa­lité. La pro­fes­sion­na­li­sa­tion et la recon­nais­sance des métiers vont de pair. Je dirais qu’il fau­drait que le monde de la recherche recon­naisse les métiers de l’édition, et que le monde de l’édition recon­naisse les métiers de l’édition élec­tro­nique, de la struc­tu­ra­tion de l’information et des usages du web. Pour cela, il faut aussi que les métiers de l’information scien­ti­fique soient accueillants envers les cher­cheurs et envers les éditeurs. S’il n’est pas abso­lu­ment néces­saire de dupli­quer l’univers du papier sur le réseau, il est sans aucun doute désas­treux d’oublier les com­pé­tences et l’énorme tra­vail qui se situe en amont de l’édition élec­tro­nique. Bref, du passé, ne fai­sons pas table rase. Et conve­nons ensemble qu’il n’est pas, pour autant, un hori­zon indé­pas­sable. J’accumule les bana­li­tés, mais l’histoire des nains juchés sur les épaules de géants n’est pas com­plè­te­ment obsolète…

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*


Notifiez-moi des commentaires à venir via email. Vous pouvez aussi vous abonner sans commenter.

Enter your email address to subscribe to this blog and receive notifications of new posts by email.

Join 5 other subscribers

Twitter de Marin

Twitter de Pierre