Thèse présentée pour l’obtention du grade de Docteur








télécharger 1.09 Mb.
titreThèse présentée pour l’obtention du grade de Docteur
page14/35
date de publication20.03.2018
taille1.09 Mb.
typeThèse
ar.21-bal.com > histoire > Thèse
1   ...   10   11   12   13   14   15   16   17   ...   35

3.3Apport à la recherche




La plupart des distributeurs, lorsqu’ils exploitent des bases de données (data mining), le font encore en 2006 dans le paradigme d’une distribution de masse. Le marketing direct devient ainsi possible dans ce secteur.

Que ce soit dans l’élaboration des outils de gestion de la relation-client (CRM et centres d’appel), dans le marketing direct (modèle B to C, personnalisation, fidélisation), dans la gestion des connaissances (cartographie des connaissances critiques, connaissance-client), l’association des Systèmes d’Information avec le paradigme de complexité semble donner de nouvelles voies à la recherche en Sciences de Gestion, chemins qui s'éloignent de ce paradigme.

Les recherches publiées dans ce contexte montrent que la segmentation et l’usage d’algorithmes prédictifs appartiennent à des représentations cartésiennes et constructivistes qui sont peu adaptées aux systèmes complexes.

Les auteurs montrent que la gestion de tels systèmes, comme les grandes entreprises, requiert l’intégration des Systèmes d’Information, de leurs flux et des échanges qu'ils permettent dans leur modèle.

Les algorithmes descriptifs d’analyses statistiques sont décrits dans la littérature comme inutilisables par les services marketing s’ils ne sont pas orientés vers le client.
Les interrelations et rétroactions, l’auto-organisation, les effets de cumul échappent à ces outils s’ils ne sont pas intégrés aux modèles systémiques.

Les recherches en modélisation systémique combinent des travaux théoriques et empiriques sur la gestion des connaissances appliquées aux nouvelles stratégies des entreprises. Elles semblent apporter aux distributeurs de nouveaux outils à un moment de doute sur la pérennité du modèle utilisé depuis l’apparition du secteur de la grande distribution.

4Modélisation




4.1Data mining et Algorithmes




Le marché des logiciels de gestion des entreprises est soumis à une vive concurrence. Chaque fournisseur essaie d’apporter des avantages concurrentiels à ses développements pour se démarquer des autres acteurs du marché en attribuant à ses produits des performances supérieures. Ces capacités techniques sont vendues par les ingénieurs d’affaires des sociétés d’informatique à leurs homologues informaticiens des sociétés clientes, souvent décideurs prépondérants des investissements dans ce domaine. Ils partagent non seulement un langage commun, mais aussi des représentations, voire des croyances communes au sujet des possibilités des Systèmes d’Information.
La place grandissante des projets de data mining, en cherchant à améliorer la connaissance sur les clients à partir des informations stockées dans la base de données, aboutit à une représentation de ce processus [Van Berten, 2005] représenté Figure 15.
La Figure 15 schématise la place et la fonction des outils algorithmiques.



PROCESSUS de DATA MINING


10000101 01011101 10011011 11010100

10000101 01011101 10011011 11010100

10000101 01011101 10011011 11010100

data1

variable1

MODELE DESCRIPTIF




GROUPES HOMOGENES

clients, produits, transactions

octets


variable2

Base de données

datan

algorithme

variablen

STATISTIQUES

PROBABILITES

data2

EXPLICATION D’UNE VARIABLE

OU DES RELATIONS ENTRE VARIABLES



MODELE PREDICTIF


Figure 15 Le processus de data mining
La recherche des corrélations entre données peut s’avérer très simple et être donc accessible à tous les acteurs de l’organisation, mais elle peut se révéler également extrêmement complexe nécessitant des compétences en statistiques difficiles à mettre à la disposition des services de gestion opérationnelle.
Pour éviter ces difficultés, la sélection des variables doit rester simple et limitée pour que les algorithmes soient facilement utilisables.
Valoriser la relation qu’une enseigne va entretenir avec ses clients devient une nécessité. Le but premier est de fidéliser ce client car il est souvent admis qu’un client fidélisé fait partie de l’actif de la société. Lorsque cela se traduit dans la réalité en millions de clients, la fidélité à la marque, que ce soit pour un produit ou pour un distributeur, a une valeur réelle. Cette clientèle stable, dont le coefficient moyen de renouvellement est connu fait alors “partie des actifs”, même si cette notion n’est pas valorisée au bilan comptable.
Les études d’image et de notoriété des marques vont dans le même sens. Donner une estimation de la valeur d’une marque équivaut à traduire ce concept d’actif client (asset value of the customer) dans la réalité économique des organisations.
Dans cette approche, l’hypermarché n’est plus le dernier maillon de la chaîne de la valeur mais un acteur important des actes de dépenses quotidiennes des consommateurs, c’est-à-dire un fournisseur de produits et de services dont le modèle d’entreprise est orienté vers le client et qui apporte de la valeur par la connaissance qu’il possède sur ce dernier.
La Gestion de la relation-client, déjà abordée, vient de l’évolution de ce paradigme qui n’ignore plus le Client au profit d’un marché de masse, mais le considère comme une vraie entité individualisable et porteuse de valeur.

C’est là une évolution considérable de la représentation qu’ont les distributeurs du marché mais surtout d’eux-mêmes. Il s’agit de passer d’une activité n’ajoutant qu’une faible valeur (voire pas de valeur du tout) aux produits lors de leur diffusion, à la création d’un "portefeuille" de clients fidèles.

La matérialisation de cette fidélité virtuelle utilise un support d’information entre le distributeur et le client qui peut être par exemple la carte de fidélité ou un code personnel d’accès à des services en ligne.
Améliorer la connaissance des clients, leur nombre, leur fidélité et leur profitabilité nécessite également de bien connaître leurs besoins exprimés ou implicites. Les variables ainsi collectées au niveau des foyers ou des individus peuvent faire entrer les distributeurs qui utilisent ces bases de données dans un nouveau modèle d’entreprise qui n’est plus celui du marché de distribution de masse.
Cet objectif d’entreprise ne peut être satisfait que si les informations collectées sur les clients sont exactes, précises et utilisées à bon escient.

La relation-client étant au cœur du modèle, le choix des connaissances élémentaires pour la développer oriente le recueil des variables utilisables. Cette manipulation va permettre de développer des connaissances sur chaque client.

Ce choix des variables dépend aussi des types d’algorithmes disponibles auprès des sociétés de service et de développement de logiciels.
Les distributeurs sont tributaires des fournisseurs de logiciels pour leur gestion des bases clients. Ces moyens informatiques, dont l'interface vers l'utilisateur est de plus en plus simple à utiliser, devraient leur permettre de gérer directement leurs propres fichiers clients, plutôt que d’en sous-traiter la gestion à des sociétés tierces. Les projets de data mining dans la distribution s’orientent vers la tenue et l’usage en interne de ces bases de clients pour fournir aux responsables opérationnels des modèles utiles à leurs pratiques.
Parmi les algorithmes brièvement introduits au chapitre 3 certains sont particulièrement adaptés au secteur de la distribution.

4.1.1Capacités des algorithmes de segmentation




Avec les algorithmes des centres mobiles, la base de données peut être divisée en groupes, mais il serait utile de savoir combien de groupes nettement séparés existent dans la base de données.

L’idéal serait de représenter en deux dimensions un nombre restreint de clusters le plus possible éloignés les uns des autres et regroupant des individus qui se ressemblent beaucoup.

On voit à l’évidence que la question est difficile pour la grande distribution où les variables doivent décrire des millions de personnes qui vont acheter des centaines de milliers de produits différents. Les logiciels de data mining vont déterminer, sur la base de ces algorithmes, des clusters dont le nombre doit être fixé par les contraintes managériales. Dans la grande distribution, il est théoriquement possible, étant donné le grand nombre de variables définissant chaque client, d'avoir autant de clusters que de personnes à y regrouper. Le nombre des actions de marketing direct qu'une enseigne peut gérer fixe donc la limite des clusters à obtenir.
Le statisticien doit alors obligatoirement établir une requête pertinente, guidée par les capacités de traitement ultérieur des résultats par les praticiens.

Les auteurs sont partagés sur les applications possibles à différents domaines. Si certains sont réservés et déclarent que “la clusterisation est une méthode non seulement subjective mais qui donne en plus des solutions sans pertinence”[Fitzpatrick, 2001], d’autres intègrent ces causes d’approximation. Ils partent d’emblée d’un domaine de définition volontairement subjectif, dont le degré d’approximation est connu, mais dont le résultat reste utilisable (Cf. §5.4.2).
De plus, bien que l’intérêt en termes statistiques soit réel, cela ne signifie pas que les clusters les plus gros sont les plus riches en informations pertinentes pour la connaissance-client. Il ne manque pas d’exemples où des grands succès marketing proviennent de niches qui auraient échappé à toute étude statistique, aussi élaborés qu’eussent pu être les algorithmes utilisés.

4.1.2Variables client, algorithmes et grande distribution




Pour mieux visualiser la place relative de ces trois éléments, la Figure 16 ci-dessous a été construite à partir des entretiens réalisés chez Carrefour et de la participation à un séminaire offert par IBM France. On y représente un processus chronologique de data mining avec au départ :


  • la base de données clients qui contient les informations récupérées sur le formulaire de demande de carte de fidélité et le résultats de son analyse statistique (segmentation, tableau de bord).

  • les études de marché réalisées par les panélistes et les agences d'enquêtes.


Le schéma de l'engrenage représente le traitement algorithmique des données précédentes. Il provient d'un document récupéré lors d'un séminaire organisé par IBM en 2004 lors de la promotion de sa base de donnée DB2 auprès de responsables informatiques et de chercheurs. Les participants ont été initiés à l'utilisation des algorithmes de data mining. Cette formation insista sur les fonctionnalités de l'outil OLAP (On Line Analytical Processing), sensé aider la prise de décision à partir des clusters générés par les algorithmes.

La flèche dirigée vers le bas représente l'utilisation par le marketing mix des tableaux produits avec l'outil OLAP après traitement par data mining des bases.

Les autres flèches orientent vers le but à atteindre sans indiquer les voies à emprunter pour y parvenir.

Cette figure pose le problème de l'usage du data mining en termes chronologiques et topographiques : quand et où doit-on utliser le data mining?




PROCESSUS de DATA MINING


segmentation

  • Gros clients

  • Bons clients

  • Réguliers

  • Occasionnels



Base de données clients




tableau de bord

  • TB magasins

  • TB direction

  • TB pour client




database

ALGORITHMES


NOM AGE + sit.famille

ADRESSE TEL EMAIL

PROFESSION CAT.SOC.PRO.

ENFANT AGE SEXE

HABITAT

CARTES CONCURRENCE

CENTRES INTERET x 12

AUTRES SERVICES








Panélistes +

Agences


FIDELITE

CA




EXPOSITION AUX PROMOTIONS

CAMPAGNE DE COMMUNICATION

ATTRACTION VERS MAGASIN

CHOIX MEDIA

SAISONNALITE

POINTS DE VENTE



Prévisions

Marketing Mix

prix, produit >>marques

emplacement magasin


promotion>>catalogues

personnes, processus



Figure 16 Data mining et Distribution

4.1.3Champ d’application




Les outils algorithmiques ainsi classés, les conclusions des auteurs sur ce sujet concordent sur l’inadaptation partielle ou totale de la plupart d’entre eux à l’exploitation des connaissances assemblées sur les clients.

Les algorithmes sont des outils descriptifs et prédictifs puissants et efficaces qui intègrent, après un traitement préparatoire des données, tous les cas possibles, ne laissant pas ou peu de place au hasard à condition que les systèmes étudiés soient simples et que les variables aient un comportement linéaire, c’est-à-dire prévisible.

Ce n’est évidemment pas le cas des clients qui fréquentent les hypermarchés. Ces outils analytiques se révèlent erronés lorsqu’un cas non prévu se présente et les met en défaut. La limite est la même que celle donnée par Popper [1995] à la méthode inductive. L'induction, à la base des algorithmes de data mining, les élimine des outils uniques de l'extraction de connaissances. Ils ne peuvent servir qu'en combinaison avec d'autres outils.
Les systèmes complexes comme le secteur de la distribution sont riches en interactions qui génèrent des situations nouvelles imprévisibles, qui se prêtent mal à une simplification par segmentation. Pour essayer de conserver l’usage des outils algorithmiques en gestion, il faudrait supprimer ceux dont la complexité est exponentielle. Cela déplacerait le problème, le ramenant à justifier le choix des algorithmes ou, en pratique, à éliminer les problèmes de complexité trop grande, ou encore à préparer (avec d’autres algorithmes !) l’information avant de la traiter.


1   ...   10   11   12   13   14   15   16   17   ...   35

similaire:

Thèse présentée pour l’obtention du grade de Docteur iconThèse Pour obtenir le grade de

Thèse présentée pour l’obtention du grade de Docteur iconTHÈse pour l’obtention du diplôme de

Thèse présentée pour l’obtention du grade de Docteur iconTHÈse présentée

Thèse présentée pour l’obtention du grade de Docteur iconThèse Présentée à la Faculté de Pharmacie de Montpellier

Thèse présentée pour l’obtention du grade de Docteur iconThèse de docteur en Pharmacie

Thèse présentée pour l’obtention du grade de Docteur iconThèse de docteur en Pharmacie

Thèse présentée pour l’obtention du grade de Docteur iconLa création d’un nouveau grade de directeur des finances publiques...
«administrateur de 1ère classe», avec éventuellement maintien d’un système de type tour de piste pour l’accès à la 1ere classe. Les...

Thèse présentée pour l’obtention du grade de Docteur iconThèse soutenue publiquement par Sang-Ha suh le 10 Juillet 2006
«avec projection», de cette thèse aux membres du Conseil scientifique et à leurs expliquer pourquoi cette thèse ne devait pas être...

Thèse présentée pour l’obtention du grade de Docteur iconPour l’Obtention Du Diplôme D’Ingénieur D’Etat

Thèse présentée pour l’obtention du grade de Docteur iconListe des contacts pour l’obtention de la carte professionnelle de guide-conférencier








Tous droits réservés. Copyright © 2016
contacts
ar.21-bal.com