Accueil > MULTIMEDIA > Recherche communautaire : Yahoo avance ses pions

Recherche communautaire : Yahoo avance ses pions

vendredi 1er avril 2005, par Hassiba

En rachetant le site Flickr, Yahoo a mis la main sur une technologie de référencement en ligne basée sur la contribution communautaire. Appliquée à la recherche sur le Net, elle pourrait bouleverser le "balisage" des pages web.

En rachetant le site Flickr le 22 mars, le portail américain n’a pas seulement intégré un nouveau service de partage de photos à son offre. Car Flickr est le pionnier d’une nouvelle méthode permettant de cataloguer internet en s’appuyant sur l’esprit communautaire. Certains pensent qu’elle pourrait bien révolutionner la recherche sur le web et pourrait ainsi offrir à Yahoo de nouveaux outils concurrentiels pour s’attaquer à Google, s’il parvient à élargir l’utilisation de cette technologie.

Le coup de génie de Flickr a été de s’adjoindre la contribution d’un grand nombre de volontaires non supervisés pour classer les fichiers un par un, à l’aide de métadonnées de recherche. N’importe qui peut "baliser" des fichiers avec des descriptions personnelles pour aider tout un chacun à les trouver plus facilement. Par exemple, pour créer un moyen facile de trouver une photo numérique du projet artistique de Christo à Central Park, il suffit d’insérer les balises "New York", "art" et "orange". Quiconque effectuera ensuite une recherche avec ces mots-clés retrouvera la photo parmi les résultats.

« Le plus intéressant dans tout cela, c’est la démocratisation de l’information », commente Bob Rosenschein, P-DG de GuruNet, un moteur de recherche qui se décrit comme moteur de réponses. « Les contributeurs manquent de rigueur, de mesure et de précision, mais ce sont des personnes qui parlent de vrais sujets. À cet égard, ils présentent un intérêt statistique incroyable lorsqu’ils s’y mettent. C’est la sagesse du peuple. Nous n’avons encore rien vu en matière d’applications... »

Faire appel à la communauté pour "baliser" l’internet
Ce postulat, plus compliqué qu’il n’y paraît, aura des conséquences phénoménales pour la gestion des informations, si l’on en croit ses adeptes, à condition que toutes les conditions soient bien réunies. Outre Flickr, des communautés comme Wikipedia, Del.icio.us et d’autres comptent un nombre important de volontaires qui se penchent sur l’avenir du "balisage libre", comme l’appellent certains.

Étant donné les milliards de fichiers disponibles sur le web, le balisage a longtemps été considéré comme irréalisable. Flickr a contourné le problème en recrutant des milliers d’utilisateurs prêts à participer à l’effort bénévolement. Sa structure repose sur une communauté qui permet à ses membres de découvrir, plus ou moins au hasard, des photos intéressantes dans les collections d’autres personnes.

Dépourvu d’une entité centrale de rédacteurs pour en contrôler l’index, son réseau peut également offrir une plongée insolite dans les mœurs culturelles. Par exemple, les utilisateurs trouveront une collection de photos de Central Park prises par des New-Yorkais amateurs plutôt que par des professionnels.

L’intérêt manifesté envers le balisage survient à un moment de grande expérimentation en matière de recherche, de distribution du contenu et de développement sur internet. Pour éviter de se retrouver sur la touche, les entreprises de tous horizons tentent de trouver les moyens de satisfaire les nouveaux appétits de consommation des informations en ligne.

Retour aux sources pour Yahoo
L’une des plus grandes équations à résoudre consiste à trouver des informations dans la montagne de données en ligne qui ne cesse de croître. La création de métadonnées, ou balises, pour décrire les fichiers est depuis longtemps considérée comme une solution pour traquer divers fichiers sur le web, les PC et les intranets. Elle reste toutefois un objectif difficile à atteindre, et expliquerait en quoi la création de services ou de communautés représente une solution attractive pour répondre au désir des internautes.

Le cocréateur du format RSS (Really Simple Syndication), R.V. Guha considère que la philosophie du balisage libre consiste à dire : « Nous ne forçons personne à utiliser les mêmes balises. De cette manière, le système peut croître, s’enrichir et susciter un phénomène émergent auquel ses créateurs n’ont pas pensé. »

Dans un sens, avec Flickr, Yahoo retourne à ses racines. En 1995, ses fondateurs ont en effet imaginé le site comme un moyen de garder la trace de leurs pages web préférées et ont fini par créer un gigantesque annuaire hiérarchique du web. Cela ne fait que deux ans que le portail a mis son annuaire entre parenthèses au profit de la technologie de recherche pure. Avec cette acquisition, l’entreprise investit dans une technologie qui permet aux utilisateurs de créer des annuaires personnalisés.

Yahoo n’a d’aillleurs pas caché que la photographie numérique était secondaire dans sa décision de racheter Flickr. « Le plus important, c’est la technologie et l’équipe fondatrice de Flickr », déclare Joanna Stevens, sa porte-parole. Ajoutant que « ses points forts sont complémentaires des objectifs de Yahoo pour créer des services de prochaine génération ».

Comment développer le réseau
Une grande partie de la recherche sur le web tire ses origines des annuaires. Le projet Open Directory, par exemple, lancé au milieu des années 1990, recherchait des rédacteurs bénévoles pour contrôler la classification et la hiérarchie des nouvelles pages web. Mais à mesure que ce projet "open source" a pris de l’importance, il est devenu difficile d’obliger tout le monde à appliquer les mêmes balises.

Netscape et Excite font partie des entreprises qui ont exploré le balisage libre dès les débuts d’internet. Elles ont testé des services qui permettaient aux internautes d’annoter des sites web et de les stocker sur un emplacement central, par exemple. Ces projets n’ont toutefois pas été au bout de leur développement, car il leur manquait la masse critique, rappelle R.V. Guha, actuellement chercheur dans les laboratoires Almaden d’IBM. « Aujourd’hui, les internautes sont suffisamment nombreux et la plupart d’entre eux sont des utilisateurs avertis du web, si bien que la masse critique existe pour ce genre de choses. »

Par opposition à l’altruisme du projet Open Directory, Flickr et Del.icio.us, gestionnaire de signets web, font appel au caractère individualiste des internautes. Avec Del.icio.us, ils balisent des pages web pour créer leur propre dossier personnalisé en vue d’y revenir ultérieurement. Ils sont encouragés à baliser leurs fichiers proprement pour conserver un semblant d’organisation. Le site utilise également des associations linguistiques pour recommander les pages web mises en signet par d’autres utilisateurs.

Constituer ses propres annuaires par des balises web
« Chaque fois que vous naviguez dans une montagne de données, la seule recherche ne suffit pas. Pour explorer ces données, il vous faut bien plus de dimensions », affirme son fondateur Joshua Schachter. « Les balises offrent davantage d’intérêt pour naviguer sans limite. »

L’exploitation de l’intelligence de groupe pour créer et gérer les balises pourrait ouvrir la voie à des applications inconnues et surprenantes. Si quiconque peut ajouter ses propres balises personnelles à n’importe quoi et que suffisamment de personnes le font, des modèles complètement nouveaux de recherche et d’utilisation de l’information verront le jour. Par exemple, les lecteurs de flux RSS qui trient aujourd’hui les articles par éditeur pourraient à l’avenir trier les articles en fonction de milliers de sujets spécifiques choisis par leur soin.

Alors que des actions plus traditionnelles pour classer les articles sont en cours sur des sites tels que Topix et Moreover, le balisage libre pourrait donner naissance à des catégories spontanées qu’aucun individu n’imaginerait seul. Entre autres choses, il devrait permettre d’être plus réactif à la manière dont les gens recherchent des informations et de suivre de plus près le rythme d’évolution des tendances.

Le spam est l’ennemi du système communautaire
Mais attention, il existe une faille potentielle : le spam. Si des individus cherchent à détourner les balises à des fins personnelles, par exemple en marquant des fichiers de manière trompeuse, le système pourrait s’effondrer. Avant de se rétablir de lui-même, étant donné qu’un internaute seul ou même un petit groupe d’internautes ne pourra s’opposer bien longtemps à la volonté du plus grand nombre.

Ces communautés font également face à un autre défi : la nécessité de normaliser une taxinomie, afin d’assurer la cohérence entre les langages utilisés par les internautes pour décrire leurs fichiers.

Pour Peter Merholz, l’un des fondateurs d’Adaptive Path, spécialiste de l’expérience utilisateur, le côté positif de Flickr et des autres "folksonomies" (ou classification du contenu par les gens) réside dans cette classification mondiale de l’information. « Flickr est utile parce que ses créateurs ont compris l’opportunité qu’offre le web pour connecter les individus entre eux. C’est cette même raison qui pousse eBay à exploiter la puissance du réseau. »

Les futures applications du balisage libre pourraient inclure la recherche au sein des dépêches d’information, des blogs, du web et des entreprises.

Faciliter la recherche sur le web grâce à l’"effet réseau"
« L’avenir des folksonomies implique le maillage de ces classifications générées par l’utilisateur avec des classifications plus standardisées, comme le Library of Congress ou le Getty Thesaurus of Geographic Names. Vous pourriez alors relier les données afin de multiplier les associations de ce genre », ajoute Peter Merholz.

Le balisage libre devrait faciliter la recherche sur le web de deux façons. Si Yahoo ou Google arrivaient à convaincre les internautes d’annoter les pages web visitées ou celles qui remontent dans les résultats de recherche, ils pourraient obtenir un guide de notation très utile pour offrir de meilleurs résultats la fois suivante.

L’utilisation du balisage libre pour la recherche permettrait, en outre, d’encourager la loyauté des visiteurs, convoitée par tous les fournisseurs. Comme le font remarquer de nombreux chercheurs, le coût pour changer de moteur de recherche n’est rien comparé aux technologies de messagerie instantanée, à la messagerie électronique ou aux applications qui portent en elles ce qu’on appelle "l’effet réseau". C’est pourquoi tous les grands moteurs de recherche introduisent de nouveaux outils téléchargeables pour la recherche sur PC.

« Tout le point est de savoir si l’une de ces technologies capables d’améliorer la recherche est également capable de susciter cet effet réseau... Le cas échéant, les utilisateurs ne pourront s’en passer », souligne R.V. Guha. « La question clé est donc la suivante : Flickr peut-il apporter cet effet réseau à Yahoo Recherche ? »

Par Stefanie Olsen,
CNET News.com