Bibliographie Glossaire








télécharger 239.31 Kb.
titreBibliographie Glossaire
page1/4
date de publication07.02.2018
taille239.31 Kb.
typeBibliographie
ar.21-bal.com > documents > Bibliographie
  1   2   3   4




Le routage de mails


Réalisé par : Nathalie ALIDOR et Mélanie CHEVALIER
Dirigé par : Monsieur SMAILI





Projet bibliographique

Master 2 Information Numérique en Entreprise

UFR Maths-Informatique


Sommaire


Introduction


Présentation générale du routage de mails 5

A.Le concept 5

B.Les problèmes scientifiques liés au routage de mails 5

Les prémices du routage de mails 6

A.Lutte anti-spam 6

B.Textmining 7

Les logiciels de routage de mails existants sur le marché 10

A. Eptica Email Management 10

B.AKIO Software 12

C. MailRelation 14

D. Classement final des logiciels par rapport au routage automatique 17

Les entreprises utilisant actuellement le routage de mails 21

A. Meetic, site de rencontres sur Internet 21

B. ViaMichelin 21

C. ANPE 22

D. Service-public.fr 23

E. RATP 24

F. Breizh Mobile 25

G. JOUPI 25

H. Bilan des outils utilisés par les entreprises 27

V. Sondage auprès d’autres entreprises 28

A. Construction du questionnaire 28

B. Déroulement de l’administration du questionnaire 28

C. Résultats et analyse 28


Conclusion
Bibliographie
Glossaire




Introduction



Abréviation d'"Interconnected Networks", Internet désigne l'ensemble des réseaux mondiaux interconnectés.

Le concept d'Internet (réseau des réseaux) date de 1973 et la date officielle de naissance souvent retenue est le 1er janvier 1983, jour où l’ARPANET (Advanced Research Projects Agency NETwork) de 1969 est passé du protocole NCP au TCP/IP.

Son succès est fulgurant et incontestable si on jette un coup d'œil sur les statistiques de 2004 :

- le nombre de machines connectées excède largement 3 millions.

- plus de 30 millions d'utilisateurs joignables par le courrier électronique.

                   

De ce fait, on assiste actuellement à une utilisation accrue des messageries électroniques, que ce soit au niveau professionnel ou personnel. En effet, dans le domaine professionnel, les employés d’une même entreprise dialoguent essentiellement par mail. Par exemple, pour la gestion des projets, chaque intervenant envoie des mails d’avancement du projet. Les comptes-rendu à partager sont également envoyés par mail. Dans un tout autre contexte professionnel, les entreprises ayant beaucoup de relations avec leurs clients utilisent les mails pour dialoguer avec ces derniers.

Il apparaît alors indispensable de mettre au point une solution pour alléger de manière intelligente le temps de traitement de ces messages.

Le mail entrant est aujourd’hui considéré comme un élément à part entière de la stratégie de relation client. Les entreprises ont alors dû apprendre à s’organiser pour mieux gérer ce canal alors qu’il n’y a pas longtemps c’était le webmaster qui recevait les questions des internautes en provenance du site web et qui les redistribuait ensuite en interne. Submergées par les questions, certaines sociétés ont même parfois retiré de leur site leur adresse de contact par mail. Il est vrai qu’au-delà de 50 mails reçus par jour la définition d’une organisation en interne s’impose.

C’est pourquoi, depuis quelques années le routage de mails fait l’objet de recherches.
L’étude de cette problématique pourra s’organiser en cinq parties.

Premièrement, nous présenterons le principe du routage de mails. Nous en viendrons alors à étudier les prémices du routage de mails. Nous dresserons l’étude des logiciels de routage de mails existants sur le marché, avant de s’intéresser aux entreprises qui en utilisent. Enfin, nous évoquerons les résultats d’un sondage effectué auprès d’entreprises.


Présentation générale du routage de mails


    1. Le concept

Le principe du routage de mails étudié ici l'opération qui consiste à router les mails automatiquement en fonction de leur contenu.

Ainsi, de manière théorique, le routage de mails peut paraître simple. Un mail est reçu sur une boîte électronique. Une analyse est alors effectuée sur ce mail par le logiciel de routage, dans lequel des paramètres ont été pré-configurés, suivant les besoins de l’entreprise qui désire router ses mails. L’analyse porte alors sur le contenu du mail. Les mots qu’il contient peuvent être catalogués par thème.

Par ailleurs, suivant les choix exprimés à la configuration et pour un thème donné, le mail est soit :

- traité par une réponse automatique,

- routé vers une personne spécialisée dans le domaine en question,

- routé vers un dossier spécialisé dans le domaine, en attente d’être traité rapidement.
Le schéma ci-après permet de visualiser plus concrètement le principe du routage de mails.


Envoi

d’un mail

Réception du mail


Le principe expliqué ci-dessus semble logique et donc facile à mettre en place. Cependant, des recherches sont actuellement menées pour réussir à analyser, de la manière la plus intelligente, les mails et ceci afin de choisir le routage le plus adéquat.

De plus, la mise au point de ce routage est difficile à cause notamment des problèmes scientifiques rencontrés.



    1. Les problèmes scientifiques liés au routage de mails

Le routage de mails pose différents problèmes scientifiques.

En effet, pour router un mail, il faut pouvoir identifier le thème ou sujet de celui-ci. Or aujourd’hui, les méthodes dont l’objectif est d’établir des statistiques (présence d’un même mot dans un texte) ne sont pas bien adaptées à ce type de texte.

Par exemple, à la différence des journaux, qui sont écrits à l’aide d’outils permettant une correction automatique et relus par une tierce personne, les mails ne sont jamais ni relus ni corrigés. Ainsi, certains mots peuvent être bruités c’est-à-dire mal orthographiés ou avec des fautes de frappe.

Compter les occurrences de mots pour les classifier ensuite est alors impossible. Cela représente un des problèmes les plus importants liés au routage de mails.

Les prémices du routage de mails

Dans cette partie, nous allons aborder deux points que nous considérons essentiels avant d’effectuer un routage de mails.


    1. Lutte anti-spam

La lutte anti-spam n’est ni une technique de fouille de données ni un principe de routage de mails. C’est tout simplement une technique de filtrage.

Cependant, on peut l’associer au routage de mails par le fait qu’il peut être considéré comme une partie préliminaire au routage de mails. En effet, un chef de projet ou une personne chargée des relations clients reçoit déjà énormément de messages par jour (pouvant aller jusqu’à 200 mails par jour). Or, en plus des mails professionnels reçus peuvent se greffer des spams, c’est-à-dire la réception non sollicitée de messages électroniques.

Partons d’un exemple chiffré, si une personne reçoit une dizaine de spams dans la journée, elle perd vingt minutes de son temps pour les traiter. Le temps perdu est proportionnel au nombre de spams reçus et peut engendrer une baisse de la productivité. C’est pourquoi la lutte anti-spam peut servir d’analyse préliminaire.

Grâce au filtrage des spams et donc à leur routage vers la « corbeille », le logiciel de routage automatique de mails pourrait concentrer son analyse sur le contenu des mails professionnels importants.
La meilleure approche pour éradiquer les spams réside dans l’utilisation de filtre.
Il existe trois générations de filtre :

  • Les filtres sur émetteur : leur premier instinct est de bloquer la réception des messages en provenance de certaines adresses mails sources, noms de domaine et adresses IP. Pour cela, on crée une liste noire. Cependant, les spammeurs s’adaptent vite à ces filtres et apprennent à contrefaire leurs adresses et à diffuser leurs messages à partir de serveurs innocents.

  • Les filtres sur en-tête : ces filtres fonctionnent de manière assez proche des filtres sur émetteur et les deux sont d’ailleurs souvent combinés. Dans le cas des filtres sur en-tête, l’enveloppe du message est analysée. On y retrouve alors tous les tampons apposés sur le message lors de son parcours sur Internet ainsi que tous les en-têtes d’origine.

  • Les filtres sur contenu : face aux inconvénients des 2 filtres présentés ci-dessus, les développeurs se sont rapidement intéressés au contenu des messages. Tous ceux qui ont l’occasion de lire des Spam constatent rapidement un air de famille, qui permet aux humains de classifier ces messages en n’en lisant que l’objet. A partir de telles observations ; une nouvelle catégorie de filtres est apparue, fondée sur l’analyse du contenu des messages. Par contenu, on entend les en-têtes, souvent cachés lors de la lecture des mails, l’émetteur et les destinataires, l’objet et le corps du message. Sont également concernés les balises HTML, les scripts, etc.

Il existe trois types de filtres sur contenu :

- Les filtres heuristiques 

ils utilisent les règles qui président à la saisie des en-têtes, corps de message, URL, etc. Chaque règle est comparée à des valeurs, et un coefficient de spamicité est affecté à chaque test. Une fois l’ensemble du message vérifié, un score pondéré indique la probabilité que le message soit du Spam. Dans le cas du filtre SpamAssaisin, certains coefficients sont positifs et expriment une probabilité de présence de Spam. D’autres sont négatifs et suggèrent un message légitime. Ce principe se rapproche du bonus-malus utilisé par les assureurs.

- Les filtres sur empreinte 

l’idée de ces filtres est de centraliser dans une base de données les Spams reçus par les internautes du monde entier et de créer, à partir de chaque Spam, une empreinte fondée sur un algorithme de type SHA (Secure Hash Algorithm). Le message est soumis à une fonction de hachage qui produit une empreinte d’une vingtaine de caractères. L’empreinte du nouveau mail reçu est calculée et comparée à celles qui se trouvent dans la base de données centralisée.

- Les filtres sémantiques 

ils ne se contentent pas d’analyser le corps et le sujet des messages mais scrutent également les en-têtes, cachés par la plupart des clients de messagerie, et le code HTML, le cas échéant.
On peut alors dire que si on associe ce concept à un routage de mails efficace, le traitement et l’analyse des mails pourraient être optimisés.
Après avoir vu les techniques de la lutte anti-spam, il est intéressant d’évoquer une autre technique : le textmining.



    1. Textmining

    1. Définition

Le textmining est une analyse multidimensionnelle des données textuelles qui vise à analyser et découvrir des connaissances et des relations à partir de documents disponibles. Une des spécificités du textmining est que les documents sont écrits pour des lectures par l’homme. Le textmining est une extension des techniques traditionnelles du datamining* à des données non structurées. Sa particularité réside dans les étapes de préparation des données qui permettent de passer du texte à la forme puis de la forme au nombre.

Les applications principales du textmining sont l’analyse de variables textuelles et l’affectation automatique de documents (CV, mails…) à des groupes d’appartenance.

C’est en ce point que le textmining nous paraît utile sur le thème du routage de mails. Ainsi le textmining peut être associé au routage de mails pour effectuer la fouille de données du contenu des messages.


  1. Les objectifs

Le textmining répond à plusieurs attentes qui sont :

    • quantifier un texte pour en extraire les structures signifiantes les plus fortes,

    • établir des liens entre les termes et les documents,

    • analyser les documents en leur associant des informations quantitatives et qualitatives structurées,

    • établir des règles de classification automatique de documents.



  1. Les étapes d’un projet de textmining



1

2

3

4

5

Nous allons développer ici les étapes importantes qui peuvent être associées au routage de mails.
1. Identification des unités textuelles 

Cette procédure indispensable se déroule en plusieurs étapes aboutissant à la réorganisation du texte en unités appelées formes graphiques.





Contenu

Exemple

Normalisation 

ramener le contenu des fichiers texte à une suite de caractères standards et éliminer les annotations qui pourraient fausser l’analyse.

le sigle S.N.C.F doit être débarrassé du point qui découperait en quatre occurrences au lieu d’une seule SNCF.

Segmentation

dépouiller le texte en occurrence de formes graphiques à partir de caractères délimiteurs (. ,  ; _ etc)

soit le corpus AB, BA2-AB C BA1

Il y a 2 occurrences de AB, 1 BA2, 1 BA1, 1C.

Lemmatisation 

regrouper l’ensemble des flexions d’une même unité de langue (formes verbales à l’infinitif, pluriels en singulier…). Cette étape n’est pas obligatoire car elle nécessite l’utilisation d’un dictionnaire et crée des ambiguïtés.

il a donné, les données. On regroupe en un seul lemme, le verbe « donner ».

Numérisation

retenir un numéro d’ordre associé à toutes les occurrences de chacune des formes graphiques




Segments répétés

repérer les suites de formes graphiques (en général deux à trois formes) se répétant plusieurs fois dans le corpus

le segment répété « entrepôt de données » est doté d’un sens général non déductible à partir des trois formes « entrepôt », « de », « données ».
  1   2   3   4

similaire:

Bibliographie Glossaire icon8. Bibliographie Glossaire de tous les termes atm

Bibliographie Glossaire iconNouvelle Opel Astra : glossaire des équipements et des innovations

Bibliographie Glossaire iconJacquou le Croquant À mon ami Alcide Dusolier Pour tous les mots...

Bibliographie Glossaire iconRéunion de travail du 3 octobre 2007 : Christine Berthaud, Nathalie...

Bibliographie Glossaire iconBibliographie Ce document, la bibliographie détaillée et les données...

Bibliographie Glossaire iconBibliographie Bibliographie relative à la ville de Casablanca
«Variations spatiales du privé et du public à travers les exemples de Ben M'sik et de Hay Moulay Rachid à Casablanca»

Bibliographie Glossaire iconPetit glossaire momentané du succès
«N’importe qui peut sympathiser avec les souffrances d’un ami. Sympathiser avec ses succès exige une nature très délicate». Après...

Bibliographie Glossaire iconBibliographie

Bibliographie Glossaire iconBibliographie

Bibliographie Glossaire iconBibliographie








Tous droits réservés. Copyright © 2016
contacts
ar.21-bal.com