Il y a plus d'un an maintenant, je vous proposais un billet pour mettre en évidence les 2 modes principaux d'indexation de l'information sur le web : indexation algorithmique / indexation sociale. Je vous propose de faire un point d'étape pour analyser l'évolution de ces modes d'indexation.
1 - Indexation sociale = Humains
Indexation sociale : contenus indexés et hiérarchisés par un groupe illimité de personnes.
Depuis un an, la courbe d'adoption des médias sociaux connait une forte croissance. Selon une étude de Nielsen publiée en Décembre 2009, les consommateurs passent en moyenne 5 heures et demi sur les médias sociaux (Facebook, blog, Youtube, etc.) soit une augmentation de 82% par rapport à l'année précédente sur la même période (source : Social Times).
Une étude publiée par Pew Internet Research Center, nous révèle que 75% des consommateurs américains d'informations en ligne ont accès à l'information par l'intermédiaire de l'e-mail et des réseaux sociaux. Alors que 52% participent activement à la consommation « collective » d'infos en partageant des liens avec leurs amis / followers / etc. (source : Le Figaro)
Les médias sociaux sont en train de s'ancrer dans le paysage informationnel des internautes. Un lieu où l'on consomme de l'information filtrée par son réseau (pertinence perçue), mis à jour en temps réel (à la recherche du scoop) et où on entretient le lien social (discussions entre amis).
C'est donc tout naturellement que les médias sociaux deviennent des sources de trafic de premier choix pour les portails d'informations. En effet, selon un rapport publié par Compete Inc, 15% du trafic de Yahoo, MSN et AOL en Décembre 2009 était généré via Facebook (13%) et MySpace (2%) (source : All Facebook).
Mais il ne s'agit pas là de la seule conséquence, l'émergence de ces nouveaux usages entraîne de grands bouleversements dans l'industrie de l'information. Par exemple, Frédéric Filloux expliquait dans son rapport sur l'AFP - et dévoilé sur backchich info - que « l'agence ne détenait plus le monopole de l'information dite « chaude ». De plus en plus les réseaux sociaux la devancent. ». Effectivement de nombreuses fois les scoops sont apparus dans les médias sociaux : les photos du crash dans l'Hudson River sur Twitter (Twitter first off the mark with Hudson plane crash coverage) , La mort de Mickael Jackson (Michaël Jackson, révélateur d'une nouvelle hiérarchisation de l'information).
Beaucoup d'exemples pourraient être cités ici pour illustrer le fait que les médias sociaux entraînent des bouleversements majeurs dans l'industrie de l'information mais là n'est pas mon objectif. Comme je le disais précédemment, cet article a pour finalité d'analyser l'évolution de ces 2 modes indexations. Passons donc à l'indexation algorithmique.
2 - Indexation algorithmique = moteur de recherche
Indexation algorithmique : indexation par l'intermédiaire de programme paramétré par un groupe d'utilisateurs restreint.
Revenons en arrière, il y a quelques années les documents web étaient indexés dans les annuaires eux même découpés en rubriques, et là les moteurs de recherche sont arrivés. Nous pouvions désormais accéder aux contenus web en tapant des mots clés.
Sous l'impulsion de la démocratisation de l'accès au web, des milliards de pages ont été indexées par les moteurs de recherche. Alors qu'au début nos requêtes comprenaient qu'un à deux mots clés, elles en comptent aujourd'hui 3 ou 4 (source : Most Searchers Use Three or More Keywords)
Le comportement de l'utilisateur s'adapte pendant que des entreprises comme Google enregistrent des bénéfices records par la vente de liens sponsorisés.
Mais la firme de Mountain View n'est pas dupe, ils savent bien que leur succès financier est dépendant de la pertinence des informations. Il faut donc trouver des solutions pour simplifier l'accès de l'information, c'est donc le temps des grands travaux :
- Recherche universelle (mis en place) : indexation des blogs, des vidéos, des images, etc.
- Recherche personnalisée (mis en place) : Résultats hiérarchisés en fonction de l'historique de l'utilisateur.
- Google caféine (en cours) : Accélérer l'indexation des pages web, vers des résultats en temps réel.
- Google social search (en cours) : Intégrer les publications (Twitter, MySpace, Facebook, etc.) de vos amis dans les résultats de recherche.
Mais en terme de chiffres ça donne quoi ? Dans un rapport, ComScore nous indiquait que 89 708 MM de recherches ont été effectuées en Décembre 2008 alors que sur la même période en 2009, ils ont enregistrés 131 354 MM soit une progression de 46% en un an. (Source : ComScore)
3 - Indexation sociale vs Indexation algorithmique :
On se rend compte finalement que ces deux modes d'accès à l'information cohabitent et font partie intégrante du paysage informationnel. Chacun ont leurs avantages et leurs inconvénients.
La pertinence du contenu :
Quand on compare deux systèmes d'indexation, on les évalue notamment en fonction de la pertinence des informations présentées. Sur ce terrain, les moteurs de recherche ont une avance importante. En effet, le principal défaut des médias sociaux est le bruit généré par les utilisateurs : des infos en doublons, des infos qui nous intéressent pas, etc. En témoigne cette étude de Forrester :
La fraîcheur du contenu :
Sur ce point l'indexation sociale sort gagnante ! Les plateformes sociale comme Twitter et Facebook resteront pendant longtemps les meilleures sources pour l'information dite « chaude » indexer en temps réel. Les moteurs de recherche travaillent de leur côté pour réduire au maximum le délai d'indexation, notamment avec l'arrivée de Google Caféine.
La diversité des contenus :
Comme le signalait Frederic Montagnon dans son article "Lorsque la recommandation sociale restructure Internet", la diversité des informations disponibles est un facteur de qualité. Sur ce point, les moteurs de recherche comme Google ont encore des efforts à faire. Souvent, les résultats nous présente les même sites à l'image de wikipédia qui est présent sur une grande majorité des requêtes. Les médias sociaux (et donc l'indexation sociale) offrent plus de diversité.
Conclusion :
La qualité de l'indexation serait donc dépendante de la pertinence des informations présentées, de la fraîcheur et de la diversité ? Oui mais pas seulement, Brynn Evans - PhD student in Cognitive Science at UC San Diego - met en avant les futurs défis de l'indexation dans son article 3 Flavors of Social Search: What to Expect. D'après lui il sera nécessaire de prendre en compte la notion de contexte : Comprendre dans quel contexte se fait une recherche, dans quel contexte un lien est partagé, etc. pour présenter des résultats adaptés.
Partager cet article :Link to original post