Welcome to Magazine Premium

You can change this text in the options panel in the admin

There are tons of ways to configure Magazine Premium... The possibilities are endless!

Member Login

Lost your password?

La mécanique des fluides

3 septembre 2008


Writing

if:book signale une initiative très intéressante : la republication en ligne, sous la forme d’un blog hébergé par Wordpress.com, dujournal de George Orwell. Le 9 août 2008 a commencé la publication des notes (j’allais écrire « billets ») prises le 9 août 1938… C’est donc avec un léger différé de soixante-dix années, scrupuleusement respecté, que le carnet de George Orwell, figure littéraire du XXe siècle, est publié en ligne. L’auteur de La ferme des animaux et de 1984, entre donc de plein pied dans le monde de l’édition électronique.

Processus discret vs processus continu

Cette initiative est intéressante d’abord en raison de sa stratégie éditoriale : ne pas publier le texte en un seul bloc, ou en quelques volumes, comme on l’aurait fait dans l’édition papier. Mais s’appuyer sur la nature liquide du numérique. On peut publier en goutte-à-goutte ou massivement, en fonction des besoins de la plantation. Ainsi, le 28 août 1938, il y a exactement 70 ans, Orwell écrit : « La nuit dernière, une heure de pluie. La journée d’hier a été chaude et couverte. Aujourd’hui, idem, avec quelques gouttes de pluie dans l’après-midi. La récolte du houblon commencera dans une semaine environ » [61]. La publication cherche donc à être particulièrement fidèle au processus d’écriture du carnet, et non à un processus discret de publication de celui-ci par volumes papier. J’utilise le terme discret- au sens mathématique. Dans ce sens, la publication numérique peut être considérée comme continue. Elle ne l’est pas seulement en raison de son rythme. Elle l’est plus globalement, me semble-t-il, par nature.

Une information pauvre ?

Considérons la structuration de l’information. Les porteurs de ce projet ont fait leur ce qui pourrait être une maxime du web : simple is beautifull. En effet, ils se sont contentés de technologies basiques, disons low-tech [62] pour faire simple : un CMS libre spécialisé dans les blogs (wordpress), un hébergement gratuit sur une plateforme industrielle et privée (wordpress.com), quelques liens hypertextes, quelques tags. Selon tout apparence, il s’agit d’une entreprise éditoriale rudimentaire d’un point de vue informationnel : chaque billet est décrit par un titre, il contient un texte édité dans un éditeur WYSIWYG (et non dans un éditeur XML en fonction d’une DTD très riche de type TEI) S’y ajoutent des rubriques, des tags et des commentaires rédigés par le public et par l’éditeur.

Naviguer n’est pas feuilleter

En réalité, le corpus est richement décrit. Il l’est, d’abord, grâce aux notes de l’édition originale, entreprise qui a duré 17 ans, menée par le Professeur Peter Davison. Il l’est, ensuite, par un nouveau travail d’enrichissement produit par l’éditeur (The Orwell Prize). Ainsi, les tags n’existaient pas dans l’édition originale en 20 volumes. Et, le 28 août 2008, les tags « hop-picking » et « weather » ont été associés au billet du jour. Des catégories sont également associées aux billets. Dans quelques mois, il sera donc possible de parcourir par navigation ce corpus de façon inédite, simplement parce qu’il est désormais indexé, à travers un travail éditorial de longue haleine.

De plus, l’éditeur a inséré des liens hypertextes à l’intérieur du texte. Le 25 août, les liens ajoutés portaient vers :

- Google maps,

- Ukmoths, un site spécialisé dans la description des papillons, et Owlpages, un site spécialisé dans la description des hiboux,

- Wikipedia (version anglaise)

- une note sur la récolte du Houblon dans les mémoires d’Orwell, publiée sur le site http://www.theorwellprize.co.uk

Et, comme toujours, le banal et décisif modèle de la conversation

Comme dans tout blog, il existe également la possibilité d’ajouter des commentaires. Ce sont pas moins de 23 commentaires, formant une conversation, qui ont été ajoutés au billet du 25 août. Les discussions portent très précisément sur le billet. Nous ignorons s’ils sont publiés a priori ou a posteriori [63].

Il semble bien que nous soyons en présence d’un travail d’édition érudite, s’appuyant sur des ressources de nature numérique diverses.

Travail d’édition ou bricolage technique ?

Les puristes s’inquièteront de l’hétérogénéité des liens, donc de leur probable instabilité, puisque le web est un gigantesque cimetière d’erreurs 404… Ils noteront des liens vers des outils pour lesquels la citabilité, le maintien du libre accès, la persistance de la qualité de l’information, peuvent être incertains. Enfin, ils avanceront qu’une plateforme de blogs n’est pas une plateforme d’édition électronique. Que l’encodage XML n’est pas conforme à l’état de l’art de l’édition de sources… N’en jetons plus.

Toujours pas d’utilisation de Webcitation.org à l’horizon …

Concernant l’instabilité de liens lancés vers le web, l’inquiétude est de mise… et je me demande s’il ne serait pas opportun de leur proposer de s’appuyer sur des projets tels que Webcite qui sont destinés aux chercheurs qui veulent citer une ressource et en capturer une image durablement, via un service tiers en lequel on puisse avoir confiance.

La dynamique des couches

Je suis beaucoup moins inquiet en ce qui concerne le caractère prétendûment insuffisant de la sémantisation. Si les éditeurs du journal d’Orwell parviennent à tenir le niveau d’enrichissement par tags, catégories et liens hypertextes dont ils font preuve actuellement, ils construiront un corpus hautement enrichi. Les informations inscrites dans le texte, mais pas encodées sémantiquement, comme la date de publication originale, par exemple, pourront être ajoutées à l’avenir. Il faudra changer de plateforme ? Qu’à cela ne tienne ! Il faudra ré-encoder le contenu ? Où est le problème ? L’édition papier nous a habitués à une forme textuelle et informationnelle figée. L’information numérique est constituée de couches, qui peuvent être ajoutées à des époques successives. [64] C’est, si j’ai bien compris, plus ou moins le le sens de la redocumentarisation [65] défendue par Roger T. Pédauque et par ses parents. Quoi qu’il en soit, il s’agit, me semble-t-il, d’un processus d’enrichissement informationnel continu. Toujours inachevé, ce processus est constitutif du document numérique.

Au risque de l’accident industriel ?

Or, en ce domaine, l’accident industriel est toujours possible. Car il ne suffit pas de déclarer que le numérique est adapté à des enrichissements progressifs. Encore faut-il que cela soit possible dans la réalité et que les budgets n’explosent pas au passage. Or, faudra-t-il jeter les premières couches d’information, en raison de l’impossibilité de les récupérer sur une nouvelle plateforme ? Faudra-t-il les abandonner en raison de leur incompatibilité avec de nouveaux besoins ? Faudra-t-il dépenser des sommes importantes pour les appauvrir, leur nature étant trop irrégulière, voire confuse, pour être une base correcte de nouveaux enrichissements ? Une étude de génétique des textes, par exemple, pourra-t-elle se greffer sur les couches existantes ou devra-t-elle repartir d’un document allégé ?

On peut toujours craindre ce type de difficulté, car il est difficile de prévoir les besoins du futur. Et parce que la tentation d’une structuration de l’information « bricolée » menace à chaque instant. Ainsi lit-on dans les commentaires du journal d’Orwell des propositions d’utilisation de mises en forme locales, telles que l’adoption de polices ou de couleurs particulières, pour désigner des zones particulières du texte retranscrit… On pourrait citer nombre d’initiatives d’édition électronique représentant un travail énorme et un budget conséquent, et dont les résultats furent jetés aux oubliettes du numérique pour défaut de structuration.

Or, entre le palimpseste indigeste et celui qui flatte le palais en raison de la finesse de ses nuances et de la qualité de ses ingrédients, il n’y a souvent que quelques octets de différence par document… La prudence s’impose.

La dynamique des usages et des formats ouverts

A l’inverse, on pourrait citer de nombreux exemples d’édition électronique qui ont survécu à l’érosion induite par l’écoulement, rapide, du temps numérique. Ces textes-là ont survécu car ils ont pu se comporter comme des couches d’informations restées lisibles, exploitables et enrichissables. En ce qui concerne l’édition électronique du journal d’Orwell, il est possible que l’initiative ne soit pas destinée à être abandonnée dans les cimetières de l’histoire. Pourquoi ?

D’une part, parce que ses promoteurs ont fait le pari des usages. Faire le choix d’une plateforme publique et célèbre, facile d’accès, rapide à alimenter et où les commentaires sont aisés, c’est en effet faire le choix des usages de lecture et d’annotation. C’est-à-dire qu’ils ont choisi de rendre le texte largement public. Ils l’ont publié, au sens noble.

D’autre part, et surtout, parce que les éditeurs ont fait le choix d’une plateforme ouverte, dans laquelle il est possible de rapatrier à tout moment la totalité du contenu, sans appauvrissement, sans altération, sans perte donc, mais aussi sans barrière, sans douane, sans cerbère. Wordpress.com joue la carte de l’ouverture des données et des formats, au plus grand bénéfice des auteurs des carnets publiés sur cette plateforme. Tous ne peuvent pas en dire autant…

5 Responses to “ La mécanique des fluides ”

  1. Got on 4 septembre 2008 at 0 h 07 min

    Quelle question difficile à résoudre que tu exposes ici ? Faut-il privilégier la rapidité de mise en place, la facilité d’utilisation, le caractère novateur de la publication ou la structuration de l’information, la problématique de conservation, de simplicité de ré-utilisation et de récupération… ?

    J’ai tout d’abord pratiqué le premier modèle (celui choisi par ce projet) avant de me rabattre sur le second et de le défendre bec et ongles. Avec un peu de recul, je dirais aujourd’hui qu’il n’y a pas un choix meilleur que l’autre, ils présentent tous les deux des avantages et des inconvénients et que cela dépend du contexte, des moyens et de l’ambition du projet.

    Si, dès le départ, j’avais choisi le second modèle, je ne serais jamais parvenu au résultat escompté. Le premier modèle te laisse une souplesse, te permet d’innover rapidement et facilement. Le second modèle relève d’une logique que je qualifierais, si tu le permets, d’industriel. Il est donc plus difficile à manoeuvrer ou à mettre en place des choses très originales, même si ce n’est pas impossible. Or, tu le sais comme moi, à partir du moment où on met en place plusieurs éditions électroniques sur un même site, il faut en passer par la mise en place d’une plate-forme-logiciel-application-usine à gaz (rayez les mentions inutiles ;-) ), car la maintenance de différentes plates-formes est rapidement ingérable ou au prix d’effort que nous ne pouvons rarement nous offrir. Dans ces cas-là, on a tendance à faire attention à la structuration de l’information, aux problématiques de citabilité, aux respects strictes des standards…, ce qui ne signifie pas pour autant tomber dans un délire de structuration. On peut faire des choses très simples en TEI :-)

    Bref, les deux modèles doivent exister (il y en a certainement d’autres), parce que, tout simplement, les éditions Gallimard ne font pas la même chose que les éditions de la Dilletante ou encore moins que l’Ecole des loisirs, pourquoi en serait-il différent pour l’édition électronique ? Ca deviendrait rapidement triste à mourir :-)

  2. Clément Laberge on 4 septembre 2008 at 10 h 26 min

    Merci Marin pour ce texte vraiment très intéressant par toutes les les ramifications qu’il offre.

    J’ai formulé un commentaire sous forme de témoignage, que j’aurais peut-être dû publier ici au lieu de sur Lafeuille, mais qu’importe, le voici :

    http://lafeuille.homo-numericus.net...

  3. Stéphane Pouyllau on 7 septembre 2008 at 6 h 49 min

    Mon expérience m’a permis de constater une chose : la tentation « d’une structuration de l’information ‘bricolée’ » est la plupart du temps lié à deux phénomènes :

    1) La tentation de reproduire dans le monde du numérique les traditions de l’édition papier. Le meilleur exemple est le mode « page à page » dans les sites web (j’ai eu à accéder, il y a quelques années, à ce type de demande). Plus loin, il y a la question des appareils critiques, qui reste très « traditionnelles » (un seul niveau est envisagé) qui entraine donc peu de recherches pour structurer plus en avant l’information. Ceci est d’autant plus vrai que la publication électronique (de sources dans mon domaine) reste très majoritairement « comme sur du papier ».

    2) La question des métier : les métiers de l’édition classique sont encore (trop) éloignés de ceux dont la mission est la structuration de l’information : les documentalistes, ces derniers sont encore trop tourné vers le signalement et le simple bibliographique. Dans les laboratoires SHS, les services d’édition sont encore fortement tournés vers le papier, quand le numérique apparait il est encore souvent « en plus », en « surcharge » et la structuration de l’information est alors secondaire car seule la « forme » compte effectivement.

    Je rejoints Got, mais pour moi, l’une des clés de l’équilibre est la mise en place d’une chaine de compétences métiers (chercheurs + documentaliste + ingénieurs en digital humanities) entrainant un travail d’équipe transversal.

  4. Hubert Guillaud on 4 septembre 2008 at 8 h 12 min

    Comme il y a différentes façons de lire, il y a différentes façons de publier (même électroniquement). Il n’y a pas 2 modèles, mais une multitude, qui permettent chacune de toucher des publics, des lecteurs et des lectures différentes.

    Merci en tout cas Marin de cette très intelligente analyse d’un procédé d’édition électronique qui paraît certes simples, mais qui a plus d’atout qu’il n’en paraît.

  5. Marin Dacos on 8 septembre 2008 at 13 h 03 min

    Merci pour ton commentaire.

    Concernant ton point 1. Je suis bien d’accord avec toi. On peut, en effet, être soumis à des contraintes passéistes, qui obligent à sur-structurer les contenus, pour émuler des comportements analogiques, sans proposer de véritable valeur ajoutée. En revanche, la complexité des documents et leur coût va en augmentant radicalement. La citabilité électronique en est généralement affectée. Enfin, bien souvent, les possibilités d’usages ont été tellement préprogrammées, encadrées, prépensées en fonction d’un glorieux passé, que l’usage lui-même est rendu délicat.

    Concernant ton point 2 et ta conclusion. Entièrement d’accord sur la question de la transversalité. La professionnalisation et la reconnaissance des métiers vont de pair. Je dirais qu’il faudrait que le monde de la recherche reconnaisse les métiers de l’édition, et que le monde de l’édition reconnaisse les métiers de l’édition électronique, de la structuration de l’information et des usages du web. Pour cela, il faut aussi que les métiers de l’information scientifique soient accueillants envers les chercheurs et envers les éditeurs. S’il n’est pas absolument nécessaire de dupliquer l’univers du papier sur le réseau, il est sans aucun doute désastreux d’oublier les compétences et l’énorme travail qui se situe en amont de l’édition électronique. Bref, du passé, ne faisons pas table rase. Et convenons ensemble qu’il n’est pas, pour autant, un horizon indépassable. J’accumule les banalités, mais l’histoire des nains juchés sur les épaules de géants n’est pas complètement obsolète…

Leave a Reply



Categories