Archives du mot-clé Google

Google Index as world heritage

Pre­sen­ta­tion at Lift 09, 18 – 20/​06/​2009, Marseille

Hello eve­ry­body. I have got 5 minutes to trig­ger a revo­lu­tion, right now, and right here, in Mar­seille ! Not easy ! But I’ll do my best.

Goo­glo­gra­phy

Ok. To begin, here’s a small Goo­glo­gra­phy ; this is the result of a search on ‘Google” key­word on Ama​zon​.com.

After rea­ding all theses books and maga­zine, it’s clear that Google scares most of us.

Is Google Evil ?

So the ques­tion is : Is Google evil ?
Because, for many people, Google repre­sents a threat to inno­va­tion, pri­vacy, right to obli­vion, plu­ra­lism, com­pe­ti­tion, the book, the press, culture… and even intel­li­gence. So, appa­rently, the ans­wer is : yes, it is.

Google is Evil

yet

Can’t help using it…

Yet we use more and more ser­vices offe­red by Google :

-Google search to find infor­ma­tion

- Google map to find our way

- Google calen­dar to remind our rendez-​vous

- Gmail and Google talk to com­mu­ni­cate

- Blog­ger to blog

- Picasa to store images

- Google docs to write

- Google books to read

- Google trans­late to read in other lan­guages, and so on,

- not tal­king of Google Adsense and Adwords.

All in all, we can’t help using it.

We can not do without Google and its index, for pre­ci­sely its abi­lity to build rela­tion­ships in a conti­nuous mass of infor­ma­tion that far exceeds our cog­ni­tive capa­city. Google is now the indis­pen­sable Sibylla of our lives, and right now we can­not stop that. So to speak about our rela­tion­ships with Google, I would say that it is a mat­ter of love and hate

Google & us : Love and hate

We love and hate Google alto­ge­ther, as we love and hate our­selves, because Google index is part of us. How that ? First, because our life is “googlized”.

Our life is Googlized

Every moment of our life is lin­ked in a way or ano­ther with Google ; such as, in this example, even our car acci­dents are recor­ded in Google street view. But if our life is goo­gli­zed, it means also that Google is, in some way “enli­ve­ned” by us.

Gin­dex is fed by our lives

And in fact, Google index is fed with our lives. it is fed with

-our words

- our links

- our deci­sions

- our images

- memo­ries

- choices

- and taste !

So, in a way, Google index is also our index, because eve­ry­thing that is inside of it, belongs to us.

So my dear fel­low goo­gli­zen, my dear fel­low humans, Let’s unite to
Reclaim the Google index !

Reclaim the Google index

Because it is our index. At least partly, because the content is ours.
And I won’t deny that it is partly Google Inc. pro­perty too, as the manu­fac­tu­rer and ope­ra­tor of the index. But it’s partly ours as well, and that is a very impor­tant point to make.

The­re­fore, may be we can begin to consi­der the Google index as a com­mon good sha­red bet­ween Google and all the mankind.

Gin­dex as a com­mon good

It is a lit­tle bit like this bus. Ima­gine Gin­dex is the bus, we are the users inside, on top, eve­ryw­here, and Google is the dri­ver. (and by the way, nobody knows where we go).

May be we should now begin to consi­der it as a com­mon good of man­kind, just like this bus is a com­mon good for these people. If we do that ; if you agree with me so far, then we need a gover­nance device for this com­mon index. And it seems to me, that UNESCO World heri­tage is an inter­es­ting lead to explore.

Google as World heritage

This is a pre­sen­ta­tion of World heri­tage from UNESCO web­site. It reads :
« Heri­tage is our legacy from the past, what we live with today, and what we pass on to future gene­ra­tions. What makes the concept of World Heri­tage excep­tio­nal is its uni­ver­sal appli­ca­tion. World Heri­tage sites belong to all the peoples of the world, irres­pec­tive of the ter­ri­tory on which they are located. »

Well, this is a per­fect defi­ni­tion for Google index, don’t you think ?
In fact, it is only if you think about the word “site” with a dif­ferent mea­ning
Not as a phy­si­cal site, but as a cybers­pace, an inter­net “site”. So when we think about World heri­tage today, we think to this :

Today

And may be, tomor­row, when we’ll think about World heri­tage, we’ll think to that :

« Tomor­row »

(this is a Google data­cen­ter in Nether­lands). That’s a huge pro­gress, isn’t it !

In fact, the buil­ding is not impor­tant ; it’s what is inside the buil­ding, or more accu­ra­tely inside and elsew­here in the cybers­pace that is impor­tant.
And I think we des­pe­ra­tely need to get back our power and control back on this pecu­liar cybers­pace “site”, the Google index.

« Thank you ! »

(Spe­cial thanks to Marin for coa­ching and live blog­ging, and to Hubert for chee­ring and invi­ta­tion to Lift) !

Comment veilles-​tu ?


La masse d’information que nous devons trai­ter chaque jour est tou­jours plus impor­tante. Face au risque d’infobésité, nous sommes tous contraints de mettre en place des stra­té­gies de trai­te­ment de l’information au moyen d’outils plus ou moins per­fec­tion­nés. La défi­ni­tion de telles stra­té­gies repose sur la défi­ni­tion d’un équi­libre entre deux prin­cipes oppo­sés mais non contradictoires :

-la recherche de sources d’informations tou­jours plus nom­breuses et diver­si­fiées, afin de ne pas man­quer les inno­va­tions qui appa­raissent constam­ment dans la plu­part des champs d’activité (la société de l’information est une société de l’innovation)

-le fil­trage tou­jours plus sévère de l’information col­lec­tée pour ne pas perdre de temps à devoir trai­ter de l’information non per­ti­nente ou redondante.

La lit­té­ra­ture sur le sujet est assez sou­vent déce­vante parce qu’elle s’intéresse ou bien aux outils, ou bien aux prin­cipes géné­raux. Il est en revanche bien dif­fi­cile de trou­ver des conseils pra­tiques pour mettre en œuvre une stra­té­gie de veille mobi­li­sant les outils évoqués et res­pec­tant les prin­cipes géné­raux fai­sant l’objet de recom­man­da­tions. La rai­son en est évidente : il revient à cha­cun de défi­nir sa stra­té­gie en fonc­tion de ses objec­tifs par­ti­cu­liers. Défi­nir une stra­té­gie de veille effi­cace relève de la méca­nique de pré­ci­sion et demande une bonne connais­sance, non seule­ment des outils à dis­po­si­tion et du domaine sur lequel on tra­vaille, mais aussi de ses propres habi­tudes intel­lec­tuelles, ce qui est le plus difficile.

Rien n’empêche cepen­dant d’échanger sur nos pra­tiques de veille, sur nos stra­té­gies concrètes, c’est à dire pas seule­ment quels outils nous uti­li­sons, mais com­ment nous les uti­li­sons. Et pour échan­ger, pour­quoi ne pas déve­lop­per une chaîne de blogs per­met­tant de com­pa­rer les pra­tiques de cha­cun ? Je com­mence donc par expo­ser ma stra­té­gie de veille et je deman­de­rai en fin de billet à 5 blo­gueurs d’en faire de même. Je ne par­le­rai pas seule­ment de ma pra­tique de veille à l’instant , mais aussi des évolu­tions dans cette pratique.

Les outils

Car il faut bien com­men­cer par là, mal­gré tout. Etant assez gad­ge­to­phile, je crois bien avoir testé la plu­part des outils parus sur le mar­ché au cours des der­nières années ; j’ai bien dit testé ; pas uti­lisé. Pour me tenir au cou­rant, j’utilise en par­ti­cu­lier l’excellent Outils Froids qui est une réfé­rence en la matière. En gros, pour effec­tuer une veille à peu près effi­cace, il faut uti­li­ser trois types d’outils com­plé­men­taires : les agré­ga­teurs de flux RSS, les signets et biblio­gra­phies par­ta­gées, les réseaux sociaux.

Côté agré­ga­teurs

Après avoir expé­ri­menté les logi­ciels ins­tal­lés en local (RSSowl entre autres, puis le ges­tion­naire de RSS de Thun­der­bird), je me suis porté vers Blo­glines, sur les conseils de Véro­nique et Jean-​Christophe, que j’ai uti­lisé pen­dant des années. J’ai pour­tant fini par aban­don­ner cet outil au pro­fit de Google Rea­der pour une rai­son simple : la faci­lité avec laquelle cet outil per­met de sélec­tion­ner des items (“s”), de les par­ta­ger avec les autres (Shift+“s”) et de les taguer (“l”+tag) et de par­ta­ger sa liste d’items tagués avec d’autres. Ces fonc­tion­na­li­tés existent sans doute aujourd’hui dans Blo­glines, mais Google Rea­der a eu un temps d’avance sur son concurrent.

En ce qui concerne les signets par­ta­gés, je reste fidèle à Deli­cious sans trop aller voir ailleurs. Le prin­ci­pal inté­rêt d’un ser­vice de signets par­ta­gés ne réside pas dans la sophis­ti­ca­tion des fonc­tion­na­li­tés qu’il met à dis­po­si­tion je pense, mais dans l’importance de sa base uti­li­sa­teurs. Deli­cious donc : c’est rapide, c’est simple, c’est mains­tream.

Mon uti­li­sa­tion des réseaux sociaux pour la veille est beau­coup plus récente. Je suis sur Face­book et la plu­part de mes « amis » sont des contacts pro­fes­sion­nels (mais néan­moins amis sans guille­mets pour la plu­part). Gar­der un œil sur les traces de vie qu’ils laissent sur cette pla­te­forme m’est donc utile. Comme ils sont aussi sur d’autres pla­te­formes, j’utilise aussi Friend­feed pour les suivre. J’avoue ne pas y pas­ser des heures. J’ai récu­péré le fil RSS de mes “amis” Friend­feed dans Google rea­der qui m’annonce plu­sieurs cen­taines de traces pro­duites par jour. Je regarde de temps en temps.

Place à la stra­té­gie maintenant

Je crois assez peu à l’efficacité d’un tra­vail de veille qui ne serait pas du tout lié à une quel­conque pro­duc­tion. Autre­ment dit, le tra­vail de trai­te­ment d’une masse très impor­tante d’informations doit être orien­tée par un objec­tif opé­ra­tion­nel concret ; veiller, ce n’est pas se tenir au cou­rant ; c’est sélec­tion­ner, capi­ta­li­ser, agré­ger puis syn­thé­ti­ser l’information pour en faire quelque chose. De mon côté, l’out­put de ma veille, c’est Homo Nume­ri­cus. Les lec­teurs de ce maga­zine en ligne savent qu’il est de publi­ca­tion irré­gu­lière ; c’est vrai aussi de la veille qui le pré­pare ; il y a tou­jours une dis­tance plus ou moins grande entre les objec­tifs affi­chés et la réalité…

Pour pré­pa­rer mes textes dans Homo Nume­ri­cus, j’applique ce que je consi­dère être une stra­té­gie des tamis successifs :

Pre­mier tamis

Dans Google rea­der, je par­cours très vite ma liste « all items » agré­geant les der­nières publi­ca­tion dans les 200 flux et quelques aux­quels je suis abonné. J’essaie d’aller très vite. Je suis quand même en mode de visua­li­sa­tion « déployé » et non en mode liste, car les titres seuls ne me per­mettent pas tou­jours de juger de l’intérêt d’un article.

Dans ces 200 flux, j’en ai quelques uns qui sont auto­ma­tiques : des flux issus de recherche de mots clés sur Google news (« infor­ma­tique, inter­net », « cyber* », etc), le flux de mes « amis » sur Friend­feed, le flux de mon « net­work » dans Deli­cious. A ce niveau mon tra­vail consiste pour l’essentiel à sélec­tion­ner, par­ta­ger et taguer les articles qui me semblent dignes d’attention. C’est un pre­mier tamis ; je suis donc large, en mar­quant aussi des infor­ma­tions pure­ment fac­tuelles, de détail. Cette sim­pli­cité du pre­mier tamis est toute récente. Pen­dant long­temps, j’ai cher­ché à clas­ser mes flux : dans des dos­siers thé­ma­tiques d’abord (poli­tique, écono­mie, usages, tech­nos), puis par type de source (presse, blogs, com­mu­ni­ca­tion ins­ti­tu­tion­nelle), puis les deux. Je me suis rendu compte que ce clas­se­ment ne me ser­vait à rien. J’ai ensuite créé un niveau de pré­se­lec­tion, un dos­sier « A suivre », avec une tren­taine de sources que je consi­dé­rais comme plus impor­tantes que les autres. Résul­tat : je ne lisais plus que ces sources. Fina­le­ment, j’ai décidé d’abandonner tout prin­cipe de clas­se­ment sur mes sources et de le déve­lop­per plus fine­ment sur les articles que je sélectionne.

Second tamis

Comme en géné­ral, je n’arrive pas à tout par­cou­rir sur autant de sources, je regarde pério­di­que­ment et sys­té­ma­ti­que­ment un cer­tain nombre de flux par­ti­cu­liers de publi­ca­tions qui sont très proches de mes pré­oc­cu­pa­tions et/​ou de très bonne qua­lité : Inter­net Actu, La Feuille, bien sûr, OA news, Read­Wri­te­Web, la rubrique techno du New York Times par exemple. Là, il s’agit de ne rien lais­ser pas­ser. Depuis peu, je fais de même avec les listes de par­tage d’un cer­tain nombre de mes contacts dans Google rea­der. Cette liste est très utile pour moi, et je regrette qu’un plus grand nombre de per­sonnes ne l’utilise pas. Lorsque cela m’intéresse, je sélec­tionne, par­tage, tague.

Troi­sième tamis

Je reprends ma liste d’items sélec­tion­nés. La fonc­tion Trends de Google rea­der me dit que sur 2700 items par­cou­rus, j’en ai sélec­tionné une cen­taine, donc un peu moins de …heu, je laisse les matheux faire le cal­cul. Je regarde à tête repo­sée cette liste d’items sélec­tion­nés, qui est aussi ma liste d’items par­ta­gés, et j’essaie de voir si des ten­dances se dégagent : quel sujet est en train de mon­ter ? de quoi parle-​t-​on ? qu’est-ce qui fait l’objet de débats intéressants ?

Qua­trième tamis

A par­tir de quelques réponses à ces ques­tions, je décide d’une brève dans Homo Nume­ri­cus, dans laquelle j’exploite quelques une des réfé­rences que j’ai pu trou­ver. Dans la plu­part des cas, en cours d’écriture, je fais une boucle de rétro­ac­tion : je reviens dans le moteur de recherche du rea­der et je lance une requête sur le sujet que je suis en train de trai­ter sur tous les items de mes flux. Cette recherche me per­met sou­vent de déga­ger une pro­fon­deur his­to­rique du sujet que je n’ai pas tou­jours en pre­mière approche. Car le moteur retient tout ce qui a été syn­di­qué et me res­sort sou­vent des articles vieux de plu­sieurs années. Ainsi, les articles que je n’ai pas eu le temps de lire ne sont pas tota­le­ment per­dus. Il me servent éven­tuel­le­ment a pos­te­riori pour ali­men­ter un cor­pus de veille dans lequel je viens pui­ser régulièrement.

C’est d’ailleurs la force de Google d’offrir la puis­sance de son moteur de recherche sur des ser­vices comme Gmail et Google Rea­der : il s’agit bien de ser­vices de trai­te­ment de flux, mais tout l’intérêt consiste à pou­voir sto­cker aussi le flux et consti­tuer un cor­pus cher­chable, tota­le­ment per­son­na­lisé et qui gran­dit avec le temps.

Bran­che­ment du percolateur

Dans tous mes textes sur Homo Nume­ri­cus, j’essaie de rendre plus expli­cites mes réfé­rences et mes liens. Pour le faire de manière plus effi­cace, j’utilise Zotero (où n’entrent donc que les réfé­rences qui font l’objet d’une cita­tion effec­tive dans mes textes) qui m’aide à gérer et for­ma­ter des réfé­rences. Cela m’intéresse de pro­cé­der ainsi, parce que je sais que mes brèves dans Homo Nume­ri­cus me four­nissent des maté­riaux pour l’écriture d’articles plus longs, plus aca­dé­miques dans les­quels je repren­drai les mêmes réfé­rences, même s’il s’agit de billets de blogs ou d’articles de jour­naux. Sans être arrivé à le mettre en pra­tique réel­le­ment jusqu’à pré­sent, j’essaie d’ailleurs de ren­for­cer cet aspect de per­co­la­tion et de construc­tion pro­gres­sive de l’information depuis le pre­mier acte de sélec­tion de l’information jusqu’à l’écriture de dis­cours longs et construits pour des publi­ca­tions for­melles. Ce n’est pas évident, mais c’est à cela que je tra­vaille, avec l’aide d’Homo Nume­ri­cus qui devrait consti­tuer une bonne part de la colonne ver­té­brale du per­co­la­teur à idées.

Le per­co­la­teur a quelques tuyaux secon­daires qui viennent l’alimenter de manière annexe : je suis abonné à quelques listes de dif­fu­sion, mais le moins pos­sible. L’envahissement du mail est si impor­tant que je pré­fère ne pas y ajou­ter en ajou­tant dans ma boîte des mil­liers de mes­sages qui ne me sont pas per­son­nel­le­ment des­ti­nés. Je suis aussi d’un oeil les Twitt de mes contacts, via un gad­get dans mon Gmail. Au pas­sage, inutile de s’abonner au mien, je ne poste rien sur Twit­ter. Lorsque je repère, par ces moyens des nou­velles inté­res­santes, je les ajoute manuel­le­ment sous forme de note dans Google Rea­der. Ces notes viennent alors s’ajouter au cor­pus glo­bal et je les sélectionne.

L’art du recyclage

Le secret d’un trai­te­ment effi­cace de l’information, il me semble, c’est de réus­sir à réuti­li­ser n fois la même infor­ma­tion. C’est ce que je m’efforce de faire. On a vu qu’une même infor­ma­tion peut être uti­li­sée deux fois, grâce au couple Google Reader-​Zotero : à la fois pour l’écriture de brèves dans Homo Nume­ri­cus, et pour l’écriture de textes plus longs sous forme de réfé­rences biblio­gra­phiques. Ces infor­ma­tions sont uti­li­sées une troi­sième fois via mon flux Friend­feed que j’ai bran­ché sur mon compte Face­book. Ainsi, toute infor­ma­tion par­ta­gée dans Google Rea­der passe dans Friend­feed et atter­rit dans mon pro­fil Face­book. Enfin, j’ai mis au point une petite astuce qui me per­met d’alimenter auto­ma­ti­que­ment Homo Nume­ri­cus en nou­velles syn­di­quées par ce moyen : lorsque je sélec­tionne et par­tage une infor­ma­tion dans Google Rea­der, je la tague. Le pre­mier de mes tags cor­res­pond à une des quatre rubriques d’Homo Nume­ri­cus : poli­tique, écono­mie, usages ou tech­no­lo­gies. J’ai par­tagé le flux RSS de cha­cun de ces tags et bran­ché ce flux sur cha­cune des rubriques d’Homo Nume­ri­cus. Si vous allez sur la page de pré­sen­ta­tion de ces rubriques, vous ver­rez ces infor­ma­tions appa­raître dans le bloc « Nou­velles syn­di­quées ». Astu­cieux non ? Plus récem­ment, j’ai essayé de faire plus sub­til en par­ta­geant les flux de cha­cun des tags par­ti­cu­liers par les­quels je décris les infor­ma­tions que je sélec­tionne : « édition élec­tro­nique », « copy­right », « pri­vacy », etc. Dans Homo Nume­ri­cus, je tague de la même manière les brèves que j’écris, et j’ai mis en place un sys­tème, grâce à Spip, qui établit une cor­res­pon­dance entre les deux. C’est encore incom­plet et pas vrai­ment opé­ra­tion­nel mais ça va venir.

Fina­le­ment, un cer­tain nombre d’informations que je relève dans ma veille quo­ti­dienne sont très poin­tus et concernent plus par­ti­cu­liè­re­ment le domaine de l’édition élec­tro­nique scien­ti­fique qui est mon coeur d’activité pro­fes­sion­nelle. Ces infor­ma­tions sont taguées « pro » et je dirige le flux RSS généré par ce tag sur notre wiki en intranet.

A qui le tour ?

Bon voilà, j’ai fait le tour de ma machine infer­nale. Peut-​être quelques uns d’entre vous auront pu y pui­ser quelques idées. Je suis pre­neur de toutes sug­ges­tions sus­cep­tible de l’améliorer. Si Marin avait écrit ce billet, il nous aurait fait un superbe schéma met­tant en évidence tous les tuyaux qui se branchent dans tous les sens. Eh bien jus­te­ment, c’est à lui en pre­mier que je trans­mets la ques­tion : com­ment veilles-​tu ? Je la pose aussi à d’autres per­sonnes donc j’admire la capa­cité à déni­cher des infor­ma­tions inté­res­santes : Hubert bien sûr (à moins que ce soit un secret pro­fes­sion­nel), André, Fran­çois, Véro­nique, Sil­vère, Jean-​Christophe, Gau­tier, Oli­vier…com­ment ? ça ne fait pas 5 ? Je vous l’avais dit, c’est vous les matheux.

P.S. : n’hésitez pas à venir signa­ler ici en com­men­taire le billet où vous décri­vez votre propre pra­tique de veille. Et pour ceux qui n’ont pas de blog, vous pou­vez évoquer vos pra­tiques direc­te­ment en commentaire.

Annexes

Ma liste de par­tage sur Google Reader

http://​www​.google​.fr/​r​e​a​d​e​r​/​s​h​a​r​ed/…

Mon compte Delicious

http://​deli​cious​.com/​p​i​o​trr

Mon pro­fil Facebook

http://​www​.new​.face​book​.com/​h​o​m​e​.ph…

Mon fil Friendfeed

http://​friend​feed​.com/​p​i​o​trr


Cré­dit photo : « Bins », par Slim­mer Jim­mer, sur Fli­ckr, en CC by-​nc-​nd

Chronologie de l’édition électronique (2)


Voici, comme pro­mis, la deuxième par­tie de ma chro­no­lo­gie sur l’édition élec­tro­nique, qui doit beau­coup à celle de Marie Lebert, même si j’ai fait des ajouts et des retraits.

Les pro­jets éditoriaux

1971 — Guten­berg project

1993 — ABU, la biblio­thèque universelle

1995 — Le Monde diplo­ma­tique est le pre­mier pério­dique imprimé fran­çais à se doter d’un site web.

1995 — Ama​zon​.com, librai­rie en ligne.

1996 — Zazie­web, site sur l’actualité du livre.

1996 — Cyli­bris, pion­nier fran­co­phone de l’édition élec­tro­nique commerciale.

1996 — Inter­net archive, des­tiné à archi­ver le web.

1997 — Gal­lica, biblio­thèque numé­rique de la Biblio­thèque natio­nale de France.

1998 — Les éditions 00h00 sont le pre­mier éditeur au monde à vendre des livres numériques.

2000 — Numi­log, pre­mière librai­rie fran­co­phone à vendre exclu­si­ve­ment des livres numériques

2000 — Le lyber, lancé par les éditions de l’Eclat.

2000 — Lan­ce­ment du Mil­lion book pro­ject, dans le but de numé­ri­ser un mil­lion de livres.

2000 — Ste­phen King tente de publier en ligne un livre cha­pitre après chapitre.

2001 — Wiki­pe­dia, ency­clo­pé­die col­la­bo­ra­tive en ligne.

2001 — Inter­net Way­back Machine, qui per­met de consul­ter des pho­to­gra­phies de pages web dans le passé (Inter­net archive).

2002 — Book​share​.org, biblio­thèque numé­rique payante pour per­sonnes aveugles et malvoyantes.

2003 — PLos, Public Library of Science, des­tiné à la créa­tion de revues scien­ti­fiques en libre accès.

[EDIT] 2003 — Pro­jet Sour­ce­berg. Rapi­de­ment renommé Wiki­source.[/​EDIT]

2003 — MIT Open­Cour­se­Ware, ensemble de cours du Mas­sa­chu­setts Ins­ti­tute of Tech­no­logy en libre accès.

2003 — CSS Zen Gar­den, site démon­trant la puis­sance de la sépa­ra­tion de la forme et du fond grâce à CSS.

2004 — Google Print, pro­jet de biblio­thèque numé­rique mon­diale de Google.

2005 — Open Content Alliance (OCA), pro­jet de biblio­thèque numé­rique mon­diale asso­ciant de nom­breux acteurs (dont Yahoo ! et Inter­net archives).

2006 — Google Book Search rem­place Google Print et per­met le télé­char­ge­ment des oeuvres du domaine public (jusque-​là ni impres­sion ni télé­char­ge­ment n’étaient possibles).

2006 — Live Search Books, pro­jet de biblio­thèque numé­rique mon­diale de Microsoft.

2006 — Open-​Access Text Archive, biblio­thèque numé­rique dédiée aux textes (Inter­net Archive).

2008 — Knol, a unit of know­ledge, ency­clo­pé­die en ligne de Google.

2008 — Aux USA, accord dit de « set­tle­ment » dans l’affaire « The Authors Guild, Inc., et alii vs. Google Inc. »

2008 — En France, lan­ce­ment conjoint du Sony Rea­der par Sony, Hachette et la Fnac. Gal­li­mard annonce se lan­cer dans les ebooks.

2008 — Euro­peana, biblio­thèque numé­rique européenne.

Ques­tions

Est-​ce que ça tient la route ?

Je n’ai pas encore trouvé la date de créa­tion de Safari Books. Je l’ajouterai pro­ba­ble­ment dès que j’aurai l’information. http://​www​.safa​ri​book​son​line​.com

Annotations en ligne. Quand G. tisse sa toile

Nar­vic signale la nais­sance de Google SearchWiki.

Search­Wiki : per­son­na­li­sa­tion et anno­ta­tion des résul­tats de recherche

C’est un événe­ment qui n’a, pour l’instant, guère fait de bruit, ou a même été consi­déré comme un gad­get. Je pense, au contraire, qu’il pour­rait prendre une impor­tance capi­tale. Nar­vic le décrit ainsi :

Qu’est-ce que Search­Wiki ? C’est une manière de per­son­na­li­ser les résul­tats de recherche four­nis par Google. Il faut pos­sé­der un compte per­son­nel Google (Gmail) pour y avoir accès et il faut être connecté. (…) A par­tir de là, les pages de résul­tats de recherche four­nis par Google changent d’aspect. De toutes nou­velles fonc­tions appa­raissent (…). La pre­mière se maté­ria­lise par l’apparition de nou­veaux bou­tons à côté du nom de chaque site dans la liste des résul­tats : une flèche vers le haut et une croix. La flèche per­met de faire mon­ter ce résul­tat en tête de la page de recherche. La croix per­met de le sup­pri­mer. Un nou­veau lien, en bas de page, per­met égale­ment d’ajouter un résul­tat qui n’aurait pas été retenu par Google. Il s’agit donc bien de per­son­na­li­ser les pages de résul­tats : l’algorithme de Google vous four­nit un résul­tat de recherche, à vous ensuite de le modi­fier à votre guise. Google conserve en mémoire vos modi­fi­ca­tions, et si vous effec­tuez la même recherche à l’avenir, il vous pré­sen­tera la ver­sion que vous avez modi­fiée vous-​mêmes.

Il est égale­ment pos­sible d’annoter une page, en lui ajou­tant un commentaire.

De plus en plus d’informations sur les pages web

Il est pro­bable que cela soit passé inaperçu en France parce que le ser­vice n’est pour l’instant pro­posé que sur la ver­sion « .com » de Google. Il y a une autre rai­son : pour l’instant, ce ser­vice est pure­ment per­son­nel et privé. Il suf­fit de croire Google. On peut aussi pen­ser qu’il s’agit d’une pre­mière étape.

Ima­gi­nons une deuxième étape, au cours de laquelle Google uti­li­se­rait les inter­ven­tions de dizaines de mil­lions d’utilisateurs pour com­plé­ter son algo­rithme. Il y a déjà long­temps que Google a intro­duit, sans sus­ci­ter de com­men­taires par­ti­cu­liers, une mesure des usages des inter­nautes uti­li­sant son moteur. Au début, souvenez-​vous, quand on cli­quait sur un résul­tat de recherche, le lien nous menait direc­te­ment vers le site pro­posé. Désor­mais, nous fai­sons un petit détour par une autre page de Google, qui, très dis­crè­te­ment, per­met de mesu­rer les usages. Cela donne une for­mi­dable machine à géné­rer des sta­tis­tiques. Ainsi naquit Google trends. Même stra­té­gie avec Google ana­ly­tics, qui apporte un ser­vice gra­tuit de mesures d’usage… et four­nit des don­nées pré­cieuses à Google sur l’état du web. Il n’élabore pas que des courbes de fré­quen­ta­tion. Il ali­mente une base de connais­sances per­met­tant de mieux connaître les pra­tiques du web ; d’identifier l’émergence de nou­velles pra­tiques, les anti­ci­per, éven­tuel­le­ment les orienter.

Résul­tats et publi­ci­tés de plus en plus contextuels

Google Search Wiki pro­longe et affine cette ten­dance, en sto­ckant des infor­ma­tions d’appréciations de sites web, qui s’assimilent à des votes (bais­ser ou mon­ter le score d’une page dans un résul­tat, sup­pri­mer une page, ajou­ter un com­men­taire). Il sera plus facile de pro­po­ser de la publi­cité contex­tuelle, selon le modèle écono­mique mis en place, avec suc­cès, par Gmail. De la publi­cité contex­tuelle non pas seule­ment à la requête, mais à l’ensemble du pro­fil de l’internaute.

Il sera plus facile, ainsi, de conti­nuer à amé­lio­rer l’algorithme de Google. Quoi qu’on en dise, il n’est pas au bout de son évolu­tion et doit s’améliorer, en par­ti­cu­lier en ce qui concerne les moteurs spé­cia­li­sés construits par l’ogre de Moun­tain View (Google scho­lar est loin du compte, par exemple). Mais aussi, et sur­tout, en ce qui concerne la per­son­na­li­sa­tion des résul­tats. La nou­velle fron­tière des moteurs de recherche n’est-elle pas la per­son­na­li­sa­tion des résul­tats de recherche, en fonc­tion de profils-​types d’internautes ? L’algorithme de Google est, pour l’instant, géné­ral. Il donne à M. Durand, jeune ingé­nieur des Mines à Tou­louse, les mêmes résul­tats qu’à Mme Dupont, retrai­tée de l’agriculture habi­tant dans le Can­tal, indé­pen­dam­ment de leurs affi­ni­tés, de leurs goûts, de leurs habitudes.

Or, quelle est la meilleure façon pour construire une typo­lo­gie des types d’internautes que de col­lec­ter leur avis sur les résul­tats, à l’aide de Search­Wiki ? Asso­ciables aux don­nées très riches col­lec­tées par Gmail, ces infor­ma­tions per­met­tront d’aller très loin dans le profil-​typage des inter­nautes. A l’aide de ces nou­velles don­nées, le pro­fi­lage semble à por­tée d’algorithme. Le nou­veau pro­gramme Google friend connect va dans le même sens, en établis­sant des connexions entre les inter­nautes, sur la base de l’identification de leurs goûts en matière de navigation.


Google friend connect

http://​www​.google​.com/​f​r​i​e​n​d​c​o​n​n​e​ct/

Le mar­ché des méta­don­nées : Google invente le Surweb

Ce n’est pas tout. Ima­gi­nons à pré­sent une troi­sième étape. Ima­gi­nons que les com­men­taires que les uti­li­sa­teurs atta­che­ront à des pages web via Google search­Wiki soient ren­dus publics. Alors, le web sera doté du plus vaste sys­tème d’annotation ayant jamais existé, car s’appuyant sur une base d’utilisateurs gigan­tesque. Cette base d’annotation des pages web consti­tue poten­tiel­le­ment une sur­couche infor­ma­tion­nelle posée sur le web. Ce qui consti­tue un post-​it, à l’échelle de l’usage de l’internaute anno­teur, peut en effet rapi­de­ment deve­nir une trame de post-​it, utile au sein d’un réseau de type Google friend­con­nect. Une fonc­tion sociale appré­ciable, concur­rente de Deli­cious ou CiteU­like, dis­po­sant de l’avantage déci­sif d’être affi­chable et éditable dès les résul­tats du moteur de recherches.

La fonc­tion sociale inci­tera, sans doute, les uti­li­sa­teurs à rendre leurs don­nées publiques. Cer­tains se conten­te­ront d’ouvrir leurs anno­ta­tions à leur réseau social. Beau­coup pour­raient être plus « géné­reux ». Et la trame de post-​it s’élargirait au point de deve­nir un filet. Une toile.

Ainsi, Google serait en mesure de pro­po­ser une fonc­tion tueuse, sus­cep­tible de réduire l’intérêt du web, au pro­fit des conte­nus sto­ckés ou affi­chés par Google. Avec Google news, Google fait déjà ce tra­vail d’avaleur de fré­quen­ta­tion, car l’utilisateur pressé peut sou­vent se conten­ter de méta­don­nées décri­vant la res­source qui sont affi­chées sur le site d’actualités de Google. Pour­quoi ? Parce qu’elles sont de plus en plus édito­ria­li­sées au niveau du moteur, c’est-à-dire clas­sées et hié­rar­chi­sées. L’évolution du moteur de recherche vers un moteur de recherches édito­ria­lisé semble se confir­mer, notam­ment à tra­vers l’évolution récente de Google blog search. Ce der­nier était aupa­ra­vant un « simple » moteur de recherches sur les blogs. Il est désor­mais édito­ria­lisé, à la mode de Google news, du moins dans la ver­sion anglo­phone. L’ancien rêve des « por­tails », édito­ria­li­sa­tion et cen­tra­li­sant l’information, semble rede­ve­nir actuel. Yahoo a essuyé les plâtres. Google ramasse la mise.

Dans les résul­tats de Google eux-​même, l’introduction rela­ti­ve­ment récente de la struc­ture des sites sous leur titre a amé­lioré l’accès à des res­sources pro­fondes des sites. Elle a ren­forcé la posi­tion de Google comme four­nis­seur de méta­don­nées struc­tu­relles. En offrant de tels rac­cour­cis, Google apporte un ser­vice d’accès rapide à l’information. Mais il court-​circuite égale­ment une par­tie des clics dans les sites web indexés, donc, poten­tiel­le­ment, une par­tie des reve­nus publicitaires.

Sur Google maps, le pro­ces­sus est simi­laire. Google rapa­trie la liste des hôtels de New-​York et l’affiche sur une carte. Il indique les rues embou­teillées en ce moment. Il ajoute des com­men­taires sur les hôtels, extraites de Tri​pad​vi​sor​.com. Ce type de site a inté­rêt à four­nir ces don­nées à Google, car cela lui apporte beau­coup de tra­fic. Mais essayez une requête « Hôtels New-​York ». Vous ver­rez égale­ment qu’il n’est plus vrai­ment néces­saire d’aller jusqu’à Tri­pad­vi­sor pour savoir à quoi s’en tenir concer­nant l’hôtel Hudson…



Gmaps col­lecte et affiche beau­coup de métadonnées

Gweb

Google crée donc petit à petit des ser­vices très utiles aux inter­nautes, qui se nour­rissent de conte­nus four­nis par les sites d’actualités (Google news), par les biblio­thèques (Google books), par les inter­nautes (Google connect, Google search­Wiki, Gmail), par les sites tou­ris­tiques (Google maps), par le web dans son ensemble. Le poten­tiel de Search­Wiki est très impor­tant. Il pour­rait concer­ner des mil­liards d’annotations. Asso­cié à Google Friend­Con­nect, il pour­rait per­mettre la construc­tion d’un réseau social sur le web, asso­ciant don­nées per­son­nelles (Face­book, Lin­ke­dIn) et car­to­gra­phies per­son­nelles du web. Pro­po­ser une toile sur la toile, et sur mesure s’il-vous-plaît. Est-​ce que cette Gtoile pro­duira de l’ombre à la Toile elle-​même, ou contribuera-​t-​elle à pour­suivre sa crois­sance, sa struc­tu­ra­tion et sa personnalisation ?