Rapport de la Mission conduite par








télécharger 4.72 Mb.
titreRapport de la Mission conduite par
page6/137
date de publication27.03.2017
taille4.72 Mb.
typeRapport
ar.21-bal.com > économie > Rapport
1   2   3   4   5   6   7   8   9   ...   137

1.2.1.3Des outils pour trouver l'information pertinente

1.2.1.3.1Internet représente aujourd'hui la nouvelle encyclopédie universelle

"notre civilisation a produit plus d'informations en 30 ans que pendant les 5000 années précédentes. Et le phénomène va se reproduire dans les 3 années à venir" Jacques Péping, les Echos Janvier 2001

Selon une étude de l'université de Berkeley les documents imprimés ne représenteraient plus que 0,003% du total des informations produites dans le monde

Les disques durs des ordinateurs comme les clés USB voient leur capacité doubler tous les ans, des entreprises comme EMC ou Network Appliance offrent un hébergement dans des "fermes de données" (data farms) pour les entreprises et la mise en réseau de milliers d'ordinateurs (data grids) permet d'offrir à bon compte des capacités de stockage considérables

Le simple stockage représente aujourd'hui près de 40% des budgets informatiques

Après le Kilooctet (Ko=mille octets), le Mégaoctet (Mo=million d'octets) et le Gigaoctet (Go=milliard d'octets) le Téraoctet (To=mille milliard d'octets), qui sont quasiment rentrés dans le vocabulaire courrant, il va falloir apprendre à utiliser le Pétaoctet (Po=million de milliard) d'octets, l'Exaoctet (Eo=milliard de milliard d'octets), le Zettaoctet (Zo=mille milliard de milliard d'octets) et le Yottaoctet (Yo=million de milliard de milliard d'octets). Ensuite il faudra inventer de nouveaux préfixes…. D'après l'université de Berkeley, tous les mots prononcés depuis le début de l'humanité représenteraient 5Eo www.sims.berkeley.edu/how-much-info

Devant un tel volume se pose tout de suite la question "comment trouver l'information pertinente?" sinon cette abondance ne serait qu'une nuisance
1.2.1.3.2Annuaires et moteurs de recherche : trouver une information parmi des milliards de documents. Le phénomène Google, l'émergence d'exalead

On estimait déjà en 2001 le nombre de documents publiées par les entreprises, les chercheurs, les institutions ou les particuliers à 1.300 milliards (ceci comprend en particulier toutes les bases de données) dont 2,5 Milliards accessibles par une recherche sur le Web et s'accroissent de 7 millions par jour

En 2005 c’est près de 10 milliards de pages qui sont référencées par le moteur de recherche le plus populaire : Google www.google.com

S'il est aisé de trouver un document dont vous connaissez l'adresse et, en suivant les "liens", de naviguer d'un document à l'autre à la recherche d'information, ce type de "navigation" au hasard sur le Web trouve rapidement ses limites:

Une des innovations majeures qui ont concouru au développement du Web sont les "Moteur de Recherche" et les annuaires

Ces outils puissants et conviviaux, permettent d'exploiter cette masse d'information considérable et il n'est pas exclu de trouver une aiguille dans une botte de foin parmi les millards de documents qu'ils analysent et indexent (par exemple des informations juridiques, technologiques, commerciales,…)

Les recherches se font

  • soit à partir de mots présents dans les pages (visibles ou non) ou de mots clefs signalés lors du référencement: ce sont les moteurs de recherche travaillant avec de gigantesques bases d'index (certains développent une forme d'intelligence artificielle, les moteurs sémantiques par exemple, et font des recherches sur des "concepts" en les recherchant dans de nombreuses langues). D'autres permettent également des recherches par "approximations successives" en vous guidant pour affiner votre quête comme Exalead

  • soit à partir de classements thématiques (ce sont des annuaires qui font appel à un classement manuel et donc à un jugement qualitatif) Annu@ire-bis www.annuaire-bis.com essaie d'en tenir une liste à jour

" The Internet Archive Wayback Machine "Il est possible grace http://web.archive.org/web de "remonter le temps" et de retrouver des pages qui ont été effacées, modifiées ou qui ont disparu

Des "métamoteurs" font travailler en parallèle plusieurs moteurs et font une synthèse des résultats

Des "portails" (comme Yahoo!) associent annuaire, moteur de recherche (ils sous-traitent souvent le moteur à des entreprises comme Inktomi, Overture, Exalead ou Google) et offrent de nombreux services

Exalead : www.exalead.com un moteur français considéré sur le strict plan technique comme le meilleur du monde

Un récent sondage de Business-Week met le moteur français, Exalead en 3ème position en terme de notoriété après Google et Yahoo ! www.businessweek.com/technology/bestof/work_search.htm

Un benchmark réalisé par un expert américain Phil Bradley www.philb.com/compare.htm qui ne prend en compte que la qualité des fonctionnalités du moteur, le place même en première position (23 points) avec devant Yahoo! (21 points) AltaVista (18 points), Google (16 points) et MSN Search (16 points)

Par ailleurs les logiciels de traduction automatique, quoique encore perfectibles (on devrait plutôt parler d'outils de compréhension voir page 18), permettent de ne pas limiter sa recherche aux sites dont on comprend la langue

Ces moteurs sont utilisés plusieurs centaines de millions de fois par jour

Les plus visités sont de la catégorie "portail" ont pour nom Yahoo! www.yahoo.com, Excite www.excite.com, Infoseek www.infoseek.com, Lycos www.lycos.com, HotBot www.hotbot.com ou Alta Vista www.altavista.com,

Dans la catégorie "métamoteurs Parmi les plus connus : MetaCrawler www.metacrawler.com Mega Francité http://mega.francite.com, SavvySearch www.savvysearch.com, Fast Search www.alltheweb.com

Notons également Kartoo, www.kartoo.com, qui présente les résultats de ses recherche sous forme graphique à partir d'une analyse sémantique des sites trouvés, permettant une recherche intuitive, par approximations successives extrêmement intéressante

Google : http://google.com a partir de 2002 ce moteur s'est complètement détaché du lot: en 2003 il représentait déjà 75% du trafic généré par les moteurs de recherche mondiaux.

En 2005 il compte 3 000 collaborateurs,il référence près de 10 milliards de pages et 1,2 milliards d'images et travaille en 88 langues. Il représente 60% du marché des moteurs de recherche en France www.google.fr/intl/fr/press/metrics.html .

Son chiffre d'affaire est de 1,26 milliard de dollars pour le premier semestre 2005 et son bénéfice de 370M$

Sa valorisation atteint 85 milliards de $ fin 2005

Ce moteur peut être interrogé non seulement à partir de PC de bureau mais aussi de multiples plates-formes sans fil telles que les téléphones WAP ou i-mode

Google est en fait dérivé de "googol", un terme mathématique pour l'équivalent du chiffre 1 suivi de 100 zéros, censé symboliser la formidable exhaustivité du moteur

Google a commencé sous la forme d'une thèse de recherche conduite par deux étudiants en doctorat de l'Université de Stanford (Californie), Larry Page et Sergey Brin, alors âgés respectivement de 24 et 23 ans seulement : ils ont développé la Technologie PageRank qui permet de mesurer l'importance des pages Web. Ce classement est effectué grâce à la résolution d'une équation de 500 millions de variables et de plus de 8  milliards de termes" Google interprète un lien d'une page A vers une page B comme un "vote" de la page A pour la page B et évalue ensuite l'importance d'une page en fonction du nombre de votes qu'elle reçoit".

Google en outre, s'appuyant sur le gigantesque trafic qu'il génère et les plantureux revenus générés par la publicité voir page 138 a développé et continue a développer un nombre considérable de services et commence à attaquer frontalement eBay (Google Base), Paypal (google Purchase), Microsoft (Open Office), …

Google est même aujourd'hui utilisé comme "who's who" : si vous voulez une information sur une personne (…ou sur vous même)

En octobre 2001, d'après le site Canadien Cyberpresse, le détective Patterson Jorgensen s'est contenté pour retrouver un homme recherché depuis 30 ans par le FBI de taper son nom sur Google pour retrouver sa trace

Vous pouvez l'utiliser simplement comme correcteur d'orthographe ou comme calculatrice

Le "cache" de Google : même si une page a été modifiée ou effacée, Google en garde une copie que vous pouvez ainsi retrouver

A partir de 2003 Google a développé un grand nombre de nouveaux service innovants et gratuits … et plus récemment de services concurrents des leaders des autres secteurs du web

2003 Froogle comparateur de prix

Google News une revue de presse automatisée : ce service n'est pas sans poser des problèmes de propriété intellectuelle et de revenus pour les journaux.

Google Local technologie de recherche géolocalisée

2004

Gmail service de mail avec de gigantesques volumes d’archivage (1 Go)

Google AdSense génère vos publicités sur des sites de particuliers (comme des blogs ou pages personnelles qu'il rémunère pour cela), sites qui correspondent aux thématiques que vous avez choisies

Google AdSense diffuse automatiquement des annonces textuelles et illustrées, ciblées précisément sur le contenu du site qui l'a installé. Et si celui-ci a ajouté la fonctionnalité "Google Recherche" sur le Web, AdSense diffuse également des annonces ciblées sur ses pages de résultats

Keyhole pour la cartographie 3D

2005

Google Earth offre une vue satellite de la terre entière avec des incrustations d’information (routes, points remarquables). Il a déjà permis des découvertes archéologiques par des archéologues amateurs …

Google Alert www.google.com/alerts vous envoie un mail lorsuqu'une nouvelle page correspondant aux critères que vous définissez apparait

Google Desktop en français www.google.fr/intl/fr/press/desktopsearch_fr.html un outil de recherche gratuit pour rechercher sur vos disques durs

Google Picasa www.google.fr/intl/fr/press/picasa_fr.html gestionnaire gratuit de photos pour aider les utilisateurs à organiser, monter retravailler retrouver et partager leurs prises de vue. Ils peuvent aussi créer des CD photos, des albums personnalisés, des fonds d’écran…

et 2006 voit l'arrivée d'un nouveau bouquet de services :

Google SMS permet d'envoyer une requête sur le moteur via SMS : il donne accès à des numéros de téléphone et adresses figurant dans les annuaires en utilisant la technologie de recherche géolocalisée (Google Local). Le service s'appuie également sur le comparateur de prix Froogle et sur un dictionnaire en ligne. Pour avoir accès au comparateur de prix, l'utilisateur mobile doit taper au choix le mot "prix" ou la lettre "f" sur son téléphone. Pour obtenir une définition, il suffit d'entrer le mot suivi de "définir". Enfin, en tapant la lettre "g" dans le message court, l'utilisateur peut également obtenir des pages Web, tout comme lors de recherches sur Internet

une alliance avec Sun pour un acces gratuit depuis Google de la suite de logiciel libre OpenOffice qui est une concurrence frontale avec Microsoft www.zdnet.fr/actualites/internet/0,39020774,39271933,00.htm?xtor=1

Google purchase (nom de code "Google Wallet" )outil de paiement http://Purchase.Google.com qui a pour objectif d'être un "paypal killer"

Google Base http://base.google.com, nouveau concept de publication en ligne qui relève le challenge de eBay voir page 165 pour la vente de particulier à particulier : un peu vite assimilé à un site de petites annonces semble plus ambitieux. En effetle service devrait accueillir aussi bien des annonces d'évènements, des ventes de biens d'occasion ou encore la publication d'essais scientifiques là où eBay se limite à la vente de biens "physiques", Google Base pourrait ainsi permettre à ses utilisateurs de vendre du contenu à valeur ajoutée mais également de collecter des fonds en rapport avec un évènement (participation aux frais, vente de billets, ...) www.futura-sciences.com/news-google-base-quand-lance-sa-place-marche-eBay_7488.php.

My Search History www.google.com/searchhistory/login offre la possibilité d'archiver les resultants de vos recherché … et à Google de mieux connaître vos préoccupations

le projet Google Print, qui n’est pas sans poser de délicats problèmes de droits d’auteur se propose de numériser la totalité des livres écrits dans le monde

GoogleNet le lancement de projets dans le WIFIsécurisé par le logiciel "Secure Access" http://wifi.google.com/download.html et des déclarations dans le domaine de la téléphonie IP et de la Télévision laisse imaginer des développements que la puissance financière de l’entreprise met à sa portée (Atelier groupe BNP Paribas- 21/09/2005)

D’autres moteurs plus spécialisés, prenant acte du fait que les moteurs généralistes ont du mal à suivre l'explosion du nombre de sites et n'en référencent plus qu'une partie, permettent de meilleurs résultats dans certains domaines

La recherche d'adresses avec Voilà www.adressemail.voilà.fr Yahoo! Annuaires http://fr.people.yahoo.com Lycos WhoWhere http://french.whowhere.lycos.com,

La recherche d'emploi Keljob.com www.keljob.com

La recherche de logiciels avec Filez.com www.filez.com,

La recherche d'hébergeur www.abchebergement.com

La gastronomie avec Gourmetsecker www.gourmetsecker.com , EatinParis www.eatinparis.com

Le monde agricole Web-agri http://www.Web-agri.com

Ou une région Click'in! Auvergne http://clickin.gdebussac.fr , Nantes www.cybernantes.com ,la façade atlantique www.alouest.net , Breizhoo www.breizhoo.com pour la Bretagne

Certains moteurs permettent également de rechercher de la musique comme http://mp3search.lycos.com ,

Notify http://cs.uni-bonn.de/info5/index-ge.html de Michael Clausen reconnait les morceaux de musique en une fraction de seconde : lorsqu'on lui donne une breve serie de note, le programme parcourt une enorme banque de donnees de plus de 12 000 morceaux et retrouve la melodie recherchee. A l'avenir, le programme devrait meme pouvoir reconnaitre une melodie qui serait chantonnee ou sifflee dans un micro. Frank Kurth, un collaborateur du professeur Clausen, travaille sur une variante de ce appelee "audentify" qui devrait par exemple non seulement reconnaitre un morceau de musique classique comme etant "Les quatre saisons de Vivaldi" mais en plus savoir qu'il s'agit de la version du 15 mars jouee dans la salle Beethoven a Bonn et non pas a la philharmoni de Berlin Source : Herve Loquais, Handelsblatt 7.05.2001

voire même des image ou vidéo avec LTU Technologies (ex-lookthatup) www.ltutech.com (recherche d'objet sur eBay, d'images illicites, Media Finder http://image.altavista.com ou www.compaq.com/speechbot

L'Inria a développé Surfimage qui permet de retrouver les images qui "ressemblent" le plus au modèle proposé www-rocq.inria.fr/cgi-bin/imedia/surfimage.cgi qui sera développé par la start-up Elucid Technologie

Ya-Hooka www.yahooka.com est spécialisé dans le cannabis (le Monde 16/5/00)

pour un panorama complet et à jour sur les moteurs, avec banc d'essai, classement par catégorie,… voir www.lapasserelle.com/sm/formation_veille.html www.abondance.com, www.searchengines.net, www.beaucoup.com, www.search.com, http://searchenginewatch.com http://solutions.journaldunet.com/dossiers/moteurs/sommaire.shtml ou

http://solutions.journaldunet.com/0411/041105_panorama_moteurs.shtml

de logiciels spécialisés dans l' intelligence économique compétitive permettent, comme nous le verrons plus loin, des recherches beaucoup plus élaborées voir page 183
1.2.1.3.3La recherche à travers les newsgroup

Par ailleurs il ne faut pas oublier que les newsgroup sont une source de compétences immense pour vous aider dans votre recherche :

Deja News www.dejanews.com vous permet de repérer les newsgroup traitant du sujet qui vous intéresse et les internautes qui se sont exprimé dessus

Reference www.reference.com cherche également dans les listes de diffusion

Citons également Voilà News www.news.voilà.fr et AltaVista www.altavista.com (section usenet)

Une fois un internaute identifié vous pouvez connaître la totalité des ses contributions dans les forums (fonction "author posting history" de Deja News et fonctions équivalentes pour les autres): cette puissance des outils de recherche conduit en général les participants à utiliser des pseudonymes
1.2.1.3.4La recherche dans les banques de données

L'exploitation des banques de données est maintenant également techniquement possible: des passerelles logicielles permettent d'utiliser l'existant sans surcoûts importants (ce qui ne signifie pas bien entendu que les propriétaires de banques de données ne permettront pour autant un accès gratuit…)

Lexis-Nexis (filiale de Reed-Elsevier) qui dispose sur son site de 1,8 Milliards de documents, est le dernier grand site à basculer l'ensemble de ses bases sur le web, depuis 2000 tous ont suivi cette voie afin d'être en mesure de délivrer automatiquement l'information pertinente en fonction des profils d'intérêt des clients

Avec le nouveau standard XML les messages intégrent de plus en plus souvent une description de la structure de la base, permettant ainsi un accès direct aux informations

Ces banques, très nombreuses nécessitant des abonnements et posant des problèmes de propriété intellectuelle, des intermédiairessont apparus (Qwam www.qwam.com qui recence 25.000 bases accessibles seulement sur abonnement, Screaming media http://www.screamingmedia.com,…), qui vous permettent un accès simple par un abonnement unique à toutes ces ressources (le "web invisible")
1.2.1.3.5L'exploitation des flux d'information

Toute action sur l'internet laisse des traces qui peuvent être exploitées : analyse des connections à votre site (fichier des "logs", exploitation des programmes "espions" que vous avez placé sur les ordinateurs de vos visiteurs, "spyware" dont les plus connus (et les moins criticables) sont les cookies

Des scanners ou sniffers permettent en outre par l'analyse des requêtes émises sur le réseau, de suivre l'activité d'autres acteurs du net: c'est un puissant outil d'intelligence économique dont l'usage est à la limite de la déontologie mais qu'il vaut mieux connaître pour savoir en tenir compte

Des logiciels permettant de traiter des masses considérables de données permettent d'exploiter ces informations

Il n'échappera à personne que ceci pose des problèmes éthiques et juridiques voir page 145145 et page 336 en exploitant l'information spatiale sous-jacente aux contenus ou aux données existantes.
1.2.1.3.6L’organisation spatiale des informations : les "SIG" (Systèmes d’Information Géographique)

Une étude sur la Région PACA 4 à montré que 70% des données stockées par les collectivitées locales et territoriales de la région possédaient une composante spatiale.

L'approche spatiale de l'information est, non seulment plus intuitive, mais enrichit également de manière considérable les possibilité d'analyse de l'information comme la réponse à des interrogations: "je recherche une parcelle de terrain constructible de 1000 m² pour 150 000 à 200 000 Euros" pour favoriser les transactions foncières, (Cf http://sitn.ne.ch), ou "je recherche sur cette commune à croiser certaines données de l'INSEE (répartition par âge et sexe de la population) et l'implantation des médecins généralistes pour pouvoir implanter mon cabinet", "je recherche en Région Rhône-Alpes l'ensemble des entreprises spécialisées dans l'impression Off-Set afin de trouver un fournisseur potentiel", ... L'ensemble de ces exemples sont actuellment envisageables avec les technologies et les données existantes
1   2   3   4   5   6   7   8   9   ...   137

similaire:

Rapport de la Mission conduite par iconRapport de la Mission conduite par

Rapport de la Mission conduite par iconRapport de la Mission conduite par

Rapport de la Mission conduite par iconRapport de mission : a l’issue de la mission qui m’est confiée, et...

Rapport de la Mission conduite par iconRapport de la Mission conduite par
«jeunes pousses» et l’émergence des «Business Angels». Comme tout phénomène brutal une telle croissance ne pouvait se produire "à-coups"...

Rapport de la Mission conduite par icon1. Rapport moral
«les arbres des Graviers» conduite par Alain Bonneton (et moi pour l’Epine Montain et les paysagistes). Bonne participation

Rapport de la Mission conduite par iconRapport de mission

Rapport de la Mission conduite par iconRapport de Mission

Rapport de la Mission conduite par iconRapport de mission 16 février 6 mars 2016
«piller» par les taxes de l'administration. Le comité sera composé des 4 masters (Sanu, président, Madhu, Ramesh, secrétaire, Shilpakar),...

Rapport de la Mission conduite par iconLa mission d'une maîtrise d'œuvre est de
«mission de base» fait l'objet d'un contrat unique et comporte au minimum les éléments de mission esq, aps, apd, pro, act, det, visa,...

Rapport de la Mission conduite par iconCe rapport de mission doit être lu conjointement avec le document suivant








Tous droits réservés. Copyright © 2016
contacts
ar.21-bal.com