12
2008
Narvic signale la naissance de Google SearchWiki.
SearchWiki : personnalisation et annotation des résultats de recherche
C’est un événement qui n’a, pour l’instant, guère fait de bruit, ou a même été considéré comme un gadget. Je pense, au contraire, qu’il pourrait prendre une importance capitale. Narvic le décrit ainsi :
Qu’est-ce que SearchWiki ? C’est une manière de personnaliser les résultats de recherche fournis par Google. Il faut posséder un compte personnel Google (Gmail) pour y avoir accès et il faut être connecté. (...) A partir de là, les pages de résultats de recherche fournis par Google changent d’aspect. De toutes nouvelles fonctions apparaissent (...). La première se matérialise par l’apparition de nouveaux boutons à côté du nom de chaque site dans la liste des résultats : une flèche vers le haut et une croix. La flèche permet de faire monter ce résultat en tête de la page de recherche. La croix permet de le supprimer. Un nouveau lien, en bas de page, permet également d’ajouter un résultat qui n’aurait pas été retenu par Google. Il s’agit donc bien de personnaliser les pages de résultats : l’algorithme de Google vous fournit un résultat de recherche, à vous ensuite de le modifier à votre guise. Google conserve en mémoire vos modifications, et si vous effectuez la même recherche à l’avenir, il vous présentera la version que vous avez modifiée vous-mêmes.
Il est également possible d’annoter une page, en lui ajoutant un commentaire.
De plus en plus d’informations sur les pages web
Il est probable que cela soit passé inaperçu en France parce que le service n’est pour l’instant proposé que sur la version « .com » de Google. Il y a une autre raison : pour l’instant, ce service est purement personnel et privé. Il suffit de croire Google. On peut aussi penser qu’il s’agit d’une première étape.
Imaginons une deuxième étape, au cours de laquelle Google utiliserait les interventions de dizaines de millions d’utilisateurs pour compléter son algorithme. Il y a déjà longtemps que Google a introduit, sans susciter de commentaires particuliers, une mesure des usages des internautes utilisant son moteur. Au début, souvenez-vous, quand on cliquait sur un résultat de recherche, le lien nous menait directement vers le site proposé. Désormais, nous faisons un petit détour par une autre page de Google, qui, très discrètement, permet de mesurer les usages. Cela donne une formidable machine à générer des statistiques. Ainsi naquit Google trends. Même stratégie avec Google analytics, qui apporte un service gratuit de mesures d’usage... et fournit des données précieuses à Google sur l’état du web. Il n’élabore pas que des courbes de fréquentation. Il alimente une base de connaissances permettant de mieux connaître les pratiques du web ; d’identifier l’émergence de nouvelles pratiques, les anticiper, éventuellement les orienter.
Résultats et publicités de plus en plus contextuels
Google Search Wiki prolonge et affine cette tendance, en stockant des informations d’appréciations de sites web, qui s’assimilent à des votes (baisser ou monter le score d’une page dans un résultat, supprimer une page, ajouter un commentaire). Il sera plus facile de proposer de la publicité contextuelle, selon le modèle économique mis en place, avec succès, par Gmail. De la publicité contextuelle non pas seulement à la requête, mais à l’ensemble du profil de l’internaute.
Il sera plus facile, ainsi, de continuer à améliorer l’algorithme de Google. Quoi qu’on en dise, il n’est pas au bout de son évolution et doit s’améliorer, en particulier en ce qui concerne les moteurs spécialisés construits par l’ogre de Mountain View (Google scholar est loin du compte, par exemple). Mais aussi, et surtout, en ce qui concerne la personnalisation des résultats. La nouvelle frontière des moteurs de recherche n’est-elle pas la personnalisation des résultats de recherche, en fonction de profils-types d’internautes ? L’algorithme de Google est, pour l’instant, général. Il donne à M. Durand, jeune ingénieur des Mines à Toulouse, les mêmes résultats qu’à Mme Dupont, retraitée de l’agriculture habitant dans le Cantal, indépendamment de leurs affinités, de leurs goûts, de leurs habitudes.
Or, quelle est la meilleure façon pour construire une typologie des types d’internautes que de collecter leur avis sur les résultats, à l’aide de SearchWiki ? Associables aux données très riches collectées par Gmail, ces informations permettront d’aller très loin dans le profil-typage des internautes. A l’aide de ces nouvelles données, le profilage semble à portée d’algorithme. Le nouveau programme Google friend connect va dans le même sens, en établissant des connexions entre les internautes, sur la base de l’identification de leurs goûts en matière de navigation.

http://www.google.com/friendconnect/
Le marché des métadonnées : Google invente le Surweb
Ce n’est pas tout. Imaginons à présent une troisième étape. Imaginons que les commentaires que les utilisateurs attacheront à des pages web via Google searchWiki soient rendus publics. Alors, le web sera doté du plus vaste système d’annotation ayant jamais existé, car s’appuyant sur une base d’utilisateurs gigantesque. Cette base d’annotation des pages web constitue potentiellement une surcouche informationnelle posée sur le web. Ce qui constitue un post-it, à l’échelle de l’usage de l’internaute annoteur, peut en effet rapidement devenir une trame de post-it, utile au sein d’un réseau de type Google friendconnect. Une fonction sociale appréciable, concurrente de Delicious ou CiteUlike, disposant de l’avantage décisif d’être affichable et éditable dès les résultats du moteur de recherches.
La fonction sociale incitera, sans doute, les utilisateurs à rendre leurs données publiques. Certains se contenteront d’ouvrir leurs annotations à leur réseau social. Beaucoup pourraient être plus "généreux". Et la trame de post-it s’élargirait au point de devenir un filet. Une toile.
Ainsi, Google serait en mesure de proposer une fonction tueuse, susceptible de réduire l’intérêt du web, au profit des contenus stockés ou affichés par Google. Avec Google news, Google fait déjà ce travail d’avaleur de fréquentation, car l’utilisateur pressé peut souvent se contenter de métadonnées décrivant la ressource qui sont affichées sur le site d’actualités de Google. Pourquoi ? Parce qu’elles sont de plus en plus éditorialisées au niveau du moteur, c’est-à-dire classées et hiérarchisées. L’évolution du moteur de recherche vers un moteur de recherches éditorialisé semble se confirmer, notamment à travers l’évolution récente de Google blog search. Ce dernier était auparavant un "simple" moteur de recherches sur les blogs. Il est désormais éditorialisé, à la mode de Google news, du moins dans la version anglophone. L’ancien rêve des "portails", éditorialisation et centralisant l’information, semble redevenir actuel. Yahoo a essuyé les plâtres. Google ramasse la mise.
Dans les résultats de Google eux-même, l’introduction relativement récente de la structure des sites sous leur titre a amélioré l’accès à des ressources profondes des sites. Elle a renforcé la position de Google comme fournisseur de métadonnées structurelles. En offrant de tels raccourcis, Google apporte un service d’accès rapide à l’information. Mais il court-circuite également une partie des clics dans les sites web indexés, donc, potentiellement, une partie des revenus publicitaires.
Sur Google maps, le processus est similaire. Google rapatrie la liste des hôtels de New-York et l’affiche sur une carte. Il indique les rues embouteillées en ce moment. Il ajoute des commentaires sur les hôtels, extraites de Tripadvisor.com. Ce type de site a intérêt à fournir ces données à Google, car cela lui apporte beaucoup de trafic. Mais essayez une requête "Hôtels New-York". Vous verrez également qu’il n’est plus vraiment nécessaire d’aller jusqu’à Tripadvisor pour savoir à quoi s’en tenir concernant l’hôtel Hudson...
Gmaps collecte et affiche beaucoup de métadonnées
Gweb
Google crée donc petit à petit des services très utiles aux internautes, qui se nourrissent de contenus fournis par les sites d’actualités (Google news), par les bibliothèques (Google books), par les internautes (Google connect, Google searchWiki, Gmail), par les sites touristiques (Google maps), par le web dans son ensemble. Le potentiel de SearchWiki est très important. Il pourrait concerner des milliards d’annotations. Associé à Google FriendConnect, il pourrait permettre la construction d’un réseau social sur le web, associant données personnelles (Facebook, LinkedIn) et cartographies personnelles du web. Proposer une toile sur la toile, et sur mesure s’il-vous-plaît. Est-ce que cette Gtoile produira de l’ombre à la Toile elle-même, ou contribuera-t-elle à poursuivre sa croissance, sa structuration et sa personnalisation ?
15 décembre 2008 06:38, par Clément Laberge
Merci Marin pour ce texte qui constitue une synthèse remarquable des enjeux associés aux développements de Google.
Pas de grande théorie, juste du concret, exprimé simplement. Grand merci.
Je ferai circuler.
15 décembre 2008 07:33, par Clément Laberge
Marin... je viens de passer une petite demi-heure à explorer SearchWiki... et j’ai le regret (ou le plaisir) de te dire que les étapes deux et trois de ton raisonnement sont vraisemblablement déjà franchies.
Il est en effet tout à fait possible de voir l’ensemble des actions et des annotations de tous les utilisateurs de SearchWiki...
Regarde :
15 décembre 2008 13:24, par Xavier Cazin
Tout à fait d’accord pour dire qu’au moment ou Google réduit (un peu) la voilure pour cause de crise financière, cette nouvelle interface au nom bizarre de SearchWiki est tout sauf anecdotique, pour toutes les raisons que vous mentionnez.
Là où je suis moins d’accord, c’est quand vous dites :
Ainsi, Google serait en mesure de proposer une fonction tueuse, susceptible de réduire l’intérêt du web, au profit des contenus stockés ou affichés par Google.
Google n’aura jamais intérêt à réduire l’intérêt du Web. Au contraire, et c’est ça qui le rend fascinant, son objectif est plutôt démiurgique, en ce qu’il se donne les moyens de modifier notre utilisation du Web, pour se rendre incontournable, et ainsi renforcer sa puissance.
Selon moi, ce test d’interface, car ce n’est qu’un test — si ça ne prend pas, il leur faudra trouver autre chose — est révélateur d’un objectif beaucoup plus ambitieux, et là oui, on pourra enfin appeler ça Web 3.0 : en combinant la connaissance des goûts de chacun, précisés par les mots-clés entrés dans la boîte de recherche, et des systèmes de mesure de la réputation de type Knol et/ou Gmail (si j’échange toujours sur les mêmes sujets avec telle personne, c’est que je lui fais confiance sur ce sujet), ils sont en train non seulement de faire évoluer radicalement leur moteur de recherche, mais surtout de lui inventer un carburant révolutionnaire et ultime : la confiance que nous faisons à autrui sur tel ou tel sujet.
En effet, pour pouvoir me servir des résultats pertinents, il ne s’agira plus de savoir combien d’êtres humains trouvent telle ressource intéressante, mais de trouver suffisamment d’avis positifs dans mon cercle de confiance pour pouvoir pondérer cette ressource. La pertinence des résultats sera telle que je serai prêt à payer pour ça !
Une manière possible de collecter ces avis est effectivement SearchWiki, mais personnellement je ne trouve pas cette interface de saisie assez gratifiante pour le cobaye. On verra bien. En tout cas, lorsqu’on garde ces enjeux en tête, les mouvements apparemment désordonnés de Google et de Yahoo ! prennent soudain plus de sens. Oui les gars, vous pouvez recommencer à acheter des actions :-)
15 décembre 2008 14:51, par Marin Dacos
@Clément : J’ai testé la fonctionnalité la semaine dernière, et je n’ai pas vu les autres notes. Aujourd’hui, je vois en bas de page "See all notes for this SearchWiki". Et en effet... Sur la requête "Le Monde", on trouve aujourd’hui six commentaires, rédigés par des petits malins qui essaient. http://www.google.com/search?hl=en&q=lemonde&btnG=Google+Search&swm=2
@Xavier Cazin : merci pour ces nuances, qui me semblent utiles. Ma formulation est en effet excessive. Google n’a pas intérêt et n’est pas en mesure de remplacer le web. Je voulais insister sur la captation d’une partie des revenus publicitaires et sur la notion de surcouche web via les métadonnées mises en valeur par le moteur. D’accord, également, pour dire qu’il n’est pas certain que SearchWiki soit l’application décisive qui permettra à Google d’obtenir les informations et les usages qu’il souhaiter développer. Il faut attendre, pour voir si ça prend. Comme pour Knol, d’ailleurs, qui ne semble pas très captivant pour l’instant, mais dont beaucoup d’observateurs avaient fait, il y a six mois, le tueur de Wikipedia. Le développement récent de Google connect vous semble-t-il plus prometteur ?
15 décembre 2008 15:44, par Jerome Eteve
Merci pour cette analyse du modele google. Comme toute media, google cherche bien evidemment a connaitre de plus en plus son audience pour s’y adapter, et pour cela il faut bien dire qu’ils sont tres fort. Cependant l’ogre en question n’est pas infaillible comme en temoigne la longue liste des services abandonnes : http://googlesystem.blogspot.com/20...
Parmi quelques services exotiques, on trouve ’Google Webquotes (2002) - read comments about a web page’, ce qui rappelle un peu ce searchwiki (apres tout, commenter ca veut aussi dire noter, voter ou tout ce qu’on voudra). Ca ne serait donc pas la premiere fois que google essaie de nous faire participer a l’amelioration de son algorithme.
Personnellement, j’utilise le searchwiki pour ’pousser’ vers le haut des resultats que je connais par avance, mais pour lesquels je suis un peu trop feneant pour taper les bons mots cles.
Le probleme se pose pour les recherches dont on ne connais pas le resultat par avance. Je vois mal les utilisateurs (moi en premier et notre mme dupont) visiter plusieurs liens, et revenir en arriere sur leur page de recherche juste pour voter pour la page qu’ils ont trouvee la plus pertinente.
Pour la recherche sociale, j’utilise delicious qui lui ne prend en compte que les votes (les bookmark) des utilisateurs du site (public sans doute plus ’technique’).
Si l’ambition de google est de transformer une part significative des internautes lambda en annotateurs gratuits avec un service a l’ergonomie simplissime mais a la dynamique contre nature, je leur souhaite bien du courage.
Personnellement, je vote pour la solution ’nieme gadget de google’ :D
15 décembre 2008 17:11, par Béat
Je ne comprends pas bien l’intérêt d’avoir des résultats de recherche affichant préférentiellement ce qu’on a déjà trouvé par le passé... Si je fais une recherche, c’est bien pour trouver du nouveau et pas pour ressasser ce que je connais déjà ! Pour ne rien rater, je tiens absolument à être servi par l’algorithme le plus « large » possible, le même que pour M. Durand et Mme Dupont. Mais j’ai sûrement tout faux ;-)
16 décembre 2008 04:34, par Jerome
@beat :
Un des interets, c’est par exemple de savoir qu’une page existe, mais de ne pas connaitre son url (ce qui est tres humain). La solution du bookmark n’est pas toujours adaptee.
Par exemple : si vous cherchez ’html img’, google affiche plusieur sites de reference. Le searchwiki est bien pratique pour selectionner son prefere.
16 décembre 2008 01:27, par Xavier Cazin
@Marin : On voit bien avec Google Connect et Open Social que Google prend les réseaux sociaux au sérieux. Mais non, rien qui me séduise là-dedans personnellement (certainement pas autant que leur moteur de recherche, ou gmail, ou google maps ont pu me séduire par exemple). Cela dit, je ne suis pas pressé, et j’aimerais assez que le prochain qui me séduise sur ce terrain ne soit pas Google, mais un nouveau venu !
16 décembre 2008 06:23, par Béat
@Jerome
Ouais bon... Il est vrai qu’on ne peut pas bookmarquer tout ce qu’on lit. L’historique du navigateur peut se rendre utile dans beaucoup de cas. Et au-delà d’une semaine - délai par défaut de mon navigateur - c’est peut-être déjà ma propre mémoire qui n’aura pas retenu le truc intéressant à aller revisiter ;-).
Tout cela me semble être une énième (et vaine ?) tentative de conserver des quantités de savoirs, confus et mal assimilés, qui dépassent la capacité de nos pauvres cerveaux submergés d’informations.
C’est toute la ruse de Google que de nous faire croire que cela nous est utile, alors que ça l’est bien plus pour eux !
18 décembre 2008 12:25, par piotrr
Pour ma part, j’aurais tendance à avoir une interprétation moins conquérante et plus défensive concernant Google. Cette inititative comme Google Friend connect me semblent constituer des tentatives de riposte à la concurrence des réseaux sociaux comme Facebook et Myspace. Par ce que, d’une part, ces plateformes sont une horreur pour Google : elles entretiennent un trafic Web avec une circulation interne aux palteformes qui ne passe jamais par Google ! Donc Google qui a construit son modèle économique sur le web (un espace informationnel ouvert, quasiment infini, très hétérogène, multi-acteurs et infiniment bordélique) a des soucis à se faire lorsque des plateformes de réseaux sociaux captent une partie croissante du trafic et le retiennent prisonnier à l’intérieur de leur sphère et par ailleurs, il n’a pas véritablement réussi ou voulu construire une plateforme concurrente comme Orkut.
Donc, quel est le modèle alternatif pour lui ? Plutôt que tenter de définir son propre espace séparé, il tente de parasiter les contenus existants en s’appuyant sur sa base utilisateurs. Que ce soit directement sur les sites, avec Friend Connect, ou via son moteur de recherche. On peut donc voir les choses autrement : il est évident que Google cherche à nous faire rester le plus possible sur ses interfaces, c’est la logique publicitaire qui le veut ; mais on voit bien en même temps qu’il ne cherche pas à créer un espace séparé du web, mais plutôt à favoriser la circulation entre ses différents services qui sont greffés sur le web. On peut essayer d’y réfléchir et de comparer cette stratégie à celle de Facebook par exemple. Mais en tout cas, cela me confirme bien dans l’idée que Google est un acteur véritablement Web au sens de world wide web, alors que les plateformes sont des acteurs post-web en ce sens qu’elles cherchent à recréer des espaces de réseau qui leur sont propres.
13 janvier 2009 01:32, par Clem
Excellent article et très bons commentaires. Je pense que la pondération d’un critère de "crédibilité sociale" est importante et manque un peu du ranking très mécanique de Google. Après, il est clair que cela fait tjs plus de données dans une seule et même entreprise... Mais, tant que Google ne rachète pas PayPal voire même Visa, il manquera l’aspect "concret" de l’acte d’achat et le croisement de base de données, même vastes, ne permettrait de que d’avoir des approximations des comportements réels des users.... Salut à tous Clement - http://www.toutlecontenu.com

Marin Dacos