Des enjeux d’aujourd’hui aux moteurs de demain








télécharger 163.89 Kb.
titreDes enjeux d’aujourd’hui aux moteurs de demain
page3/13
date de publication27.03.2017
taille163.89 Kb.
typeBibliographie
ar.21-bal.com > économie > Bibliographie
1   2   3   4   5   6   7   8   9   ...   13

1.2. Algorithmes sous le moteur.



Les algorithmes d’indexation et de classement constituent le cœur technologique des moteurs de recherche. Celui de Google, baptisé « Pagerank » constitua à l’époque de sa mise en œuvre une véritable (r)évolution technologique, aujourd’hui copiée par l’ensemble des acteurs majeurs du secteur. L’heure est à la convergence des algorithmes de pertinence même si, comme nous le verrons plus loin, les tentatives de diversification et de différentiation sur ce secteur technologique restent importantes. Rappelons d’abord que le PageRank est inspiré des indicateurs scientométriques définis par Eugène Garfield (GARF, 1972) pour l’évaluation des publications scientifiques. En lieu et place du nombre de citations d’un article scientifique dans la bibliographie d’autres articles, la pertinence d’une page web est définie à partir du nombre et de la pertinence des pages qui la citent (backlinks). C’est une mesure quantitative qui est utilisée pour construire des métriques qualitatives. Le « coup de génie » des fondateurs de Google fut de parvenir à transposer ce mode opératoire depuis un corpus très spécifique et normé et disposant de puissants filtres éditoriaux en amont (publications et édition scientifique) vers un corpus ouvert, non filtré et généraliste : le web.

Contrairement à une première idée reçue, le brevet du Pagerank originel déposé à l’époque ou Serguei Brin et Larry Page étaient étudiants à l’université de Stanford, est public10 et l’ensemble des documents originaux publiés par ses inventeurs est disponible (BRIN, 1998a, 1998b, 1999). On dispose également d’un grand nombre d’analyses extérieures décrivant et analysant son fonctionnement (LANG, 2003). Le fonctionnement du PageRank originel est donc connu, ce qui permit aux autres acteurs de s’en inspirer et de faire de l’analyse des backlinks l’un des tous premiers critères pour l’affichage de leurs listes de résultats et la constitution de leur base d’index. En revanche, la domination technologique de Google est liée à la difficulté d’évaluer le poids exact de l’indicateur relationnel dans l’algorithme de pertinence. Dans un billet en date du 20 Mai 2008 sur le blog officiel de Google11, on apprend que pour l’année 2007 le Pagerank a connu plus de 450 modifications ! Un enrichissement naturellement confidentiel mais qui passe notamment par la prise en compte de logiques qualitatives en amont (nature et sémantique des backlinks), par de puissantes procédures de filtrages en aval (permettant d’atténuer les usages détournés12), et par une infrastructure technique permettant de travailler à une échelle statistique et computationnelle hors-norme13.

Fièvre algorithmique


Les algorithmes de l’ensemble des moteurs sont de la même manière en permanence modifiés. De plus, certains types de contenus peuvent nécessiter une algorithmie dédiée. C’est notamment le cas de l’indexation image pour laquelle Google vient de publier une approche différente de celles couramment utilisées : le VisualRank (JING, 2008). L’indexation image est un secteur stratégique essentiel pour le futur de la recherche d’information, particulièrement dans la tendance actuelle d’une recherche globalisée et universelle14.

Complexité algorithmique objectivée ou panoptique subjectif ?


Quand nous consultons une page de résultat de Google ou de tout autre moteur, nous ne disposons pas simplement du résultat d’un croisement combinatoire binaire entre des pages répondant à la requête et d’autres n’y répondant pas ou moins (matching). Nous disposons d’une vue sur le monde (watching) dont la neutralité est clairement absente. Derrière la liste de ces résultats se donnent à lire des principes de classification et d’organisation de l’information et des connaissances : l’affichage lisible d’une liste de résultats, est le résultat de l’itération de principes non plus seulement implicites (comme les plans de classement ou les langages documentaires utilisés dans les bibliothèques) mais invisibles et surtout dynamiques, le classement de la liste répondant à la requête étant susceptible d’évoluer en interaction avec le nombre et le type de requêtes ainsi qu’en interaction avec le renforcement (ou l’effacement) des liens pointant vers les pages présentées dans la page de résultat (ERTZ, 2004).

L’autre grande « nouveauté » qu’apportent les moteurs de recherche au mode de circulation, d’organisation et d’accès habituel aux connaissances est l’assujetissement à des logiques marchandes dans lesquelles la publicité EST du contenu15.
1   2   3   4   5   6   7   8   9   ...   13

similaire:

Des enjeux d’aujourd’hui aux moteurs de demain iconC ommuniqué de Presse
«Bâtiment Basse Consommation» démontrant la parfaite maitrise par les Architecteurs de ce type de construction pour répondre aux...

Des enjeux d’aujourd’hui aux moteurs de demain iconQuelles questions concernant l’environnement, la politique et la...

Des enjeux d’aujourd’hui aux moteurs de demain iconAtelier 5: En quoi la protection et la promotion de la diversité...
«mieux» vivre. Ainsi les acquis d’aujourd’hui constituent le patrimoine de demain. Le développement industriel et économique qui...

Des enjeux d’aujourd’hui aux moteurs de demain iconDrupal est un cms aux multiples facettes. Conçu à l’origine pour...

Des enjeux d’aujourd’hui aux moteurs de demain iconQuelle source dans les exercices
«Nos villes d’un cœur brûlant», nous sommes invités à contempler la ville d’aujourd’hui comme elle est; dans «Les mots de Dieu pour...

Des enjeux d’aujourd’hui aux moteurs de demain iconComprendre les enjeux de demain pour une ville durable

Des enjeux d’aujourd’hui aux moteurs de demain iconFour Seasons, en collaboration avec Visionary Partners, ressuscite...
«The Surf Club fourmille d’histoires fascinantes, et aujourd’hui nous réinventons le passé nostalgique de Miami et son fameux «beach...

Des enjeux d’aujourd’hui aux moteurs de demain iconRémunérer des unités d’œuvre définies et dont on peut comparer le...
«Notre Père», nous sommes disposés à vous verser, chaque mois, plusieurs millions d’euros. IL suffirait de remplacer simplement la...

Des enjeux d’aujourd’hui aux moteurs de demain iconIl faut savoir que l’étymologie du mot «trésor» n’a pas du tout la...
«trésor» n’a pas du tout la même signification qu’aujourd’hui. Le mot «trésor», en Grec ancien «θησαυρός», est en Grèce Antique un...

Des enjeux d’aujourd’hui aux moteurs de demain iconRapport de stage licence une réflexion sur les réformes du droit...
«Toute réforme de la procédure consiste aujourd’hui, à accélérer la marche du procès» écrivait le doyen hebraud (1)








Tous droits réservés. Copyright © 2016
contacts
ar.21-bal.com