Conception d’un outil décisionnel pour la gestion de la relation client dans un site de e-commerce Nazih SELMOUNE*, Saida BOUKHEDOUMA* and Zaia ALI MAZIGHI* Laboratoire des Systèmes Informatiques(LSl )- USTHB – ALGER selmoune@wissal. dz boukhedouma@wissal. dz alimazighi@wissal. dz Résumé Les entreprises souci continuellement leu or 14 L’utilisation du e. com er:-,• Sni* to nextÇEge l’internet fait naître d des clients et des coll prendre les décisions ad quates en vue de ntent à satisfaire alogies liées ? la part es entreprises ? répondre aux exigences de leurs clients, en examinant leur omportement sur son site de e-commerce.
Canalyse du marché pour une entreprise donnée repose sur la quantité importante d’informations provenant de son site web marchand. Cette analyse peut se faire en exploitant les entrepôts de données (ED) ou data warehouse (DW) d’une part et les outils de data mining ou de fouille de données pour une classification (profilage) des clients d’autre part, car l’aide à la décision peut nécessiter de comprendre plus profondément les chiffres et les faits de l’entreprise.
Le présent article décrit la conception, l’architecture et quelques fonctionnalités d’un outil d’aide ? a décision pour la gestion de la relation client sur un site de e- commerce. utiliser les nouvelles technologies, depuis longtemps, pour acquérir de nouveaux marchés et viser de nouveaux clients. De plus en plus sensibilisés au web, ils veulent accéder directement de façon personnalisée et sécurisée, au service de l’entreprise et de ses partenaires.
Partant de ce fait, les entreprises ont senti le besoin et la nécessité de prendre certaines décisions pour répondre aux attentes de ce nouveau type de clients qui se manifeste via ce nouveau canal d’interactions. La connaissance e l’environnement décisionnel est un élément vital dans la prise de décision. Par exemple la connaissance de clients et de leur comportement d’achat constitue un élément décisionnel pour le lancement d’un produit.
L’anayse du marché pour une entreprise donnée aura comme référence les données qui découlent de son site web marchand. Les entreprises possèdent donc, d’importants volumes de donnees aux formats généralement hétérogènes, ce qui nécessite l’utilisation d’un outil permettant l’exploitation efficace et performante de ces données pour aider fentreprise à la prise de déclsion, d’où la aissance des entrepôts de données (ED) ou data warehouse (DW) (Inman, 1996b), (Kimball & al, 2000).
Cette approche vise à extraire des données de bases de production, à les assembler, par sujet, à les organiser, à les transformer et à les résumer pour l’aide à la décision. L’entrepôt doit pouvoir mémoriser l’histoire de l’entreprise. Pour mieux connaitre sa clientèle, une entreprise peut décider d’effectuer une classification basée sur le comportement des clients. Ceci implique la nécessité de mettre en place des outils de data mining ou fouille de données Ces outils reposent en général sur 2 mettre en place des outils de data mining ou fouille de données .
Ces outils reposent en général sur des techniques basées sur les statistiques, la classification ou l’extraction de règles associatives (Gardarin, 2000). Le travail présenté dans cet article consiste en la conception et la mise en œuvre d’un outil d’aide à la décision basé sur les techniques de DW et de data mining, susceptible d’assister les entreprises de ventes sur internet , dans la prise de leurs décisions.
Page2 La suite du document est organisée comme sult • La section 2 présente les concepts de base du décisionnel, ? avoir les entrepôts de données (ED) et le data mining. La section 3 présente le concept d’aide à la décision dans la gestion de la relation client. La section 4 décrit la conception de l’outil réalisé pour Paide à la décision. En effet, elle présente les vues statique et dynamique du système en utilisant quelques diagrammes d’I_JML, le modèle multidimensionnel selon deux axes ventes et visites.
Une description d’un algorithme de groupage est aussi donnée dans cette section. Enfin, quelques figures montrant les principales fonctionnalités de l’outil sont données dans la section 5. 2. Concepts de base des systèmes d’aide à la décision Nous présentons dans ce qui suit quelques concepts de base, concernant les systèmes d’aide à la décision et notamment, les entrepôts de données : 2. 1 Entrepôt de données (data warehouwse) : un entrepôt de données (ED) ou data warehouse (DW) se définit selon W.
INMON comme étant un ensemble de données intégrées, orientées su’et non volatiles, gérées dans un environnement de stocka PAGF environnement de stockage particulier, historisées, résumées, disponibles pour Vinterrogation et l’analyse et organisées pour le support d’un processus ‘aide à la décislon (Bret & al, 2001) Les données d’un ED possèdent les caractéristiques suivantes (Teste, 2000) , (Raval & al, 2001) : Intégrées Les données de l’entrepôt proviennent de différentes sources éventuellement hétérogènes.
L’intégration consiste à résoudre les problèmes d’hétérogénéité des systèmes de stockage, des modèles de données, de sémantique de données. Orientées sujet Après leur intégration dans une sorte de source globale, les données sont réorganisées autour de thèmes tels que : client, vendeur, produit… etc. Chaque décideur d’une entreprise doit disposer d’une vue sur les informations qui lui sont pertinentes, et qui peuvent influer dans ses décisions pour une meilleure exploitation de ces données. Figure 1. : Architecture d’un entrepôt de données Non volatiles Tout se conserve, rien ne se perd : cette caractéristique est primordiale dans les ED. En effet, et contrairement aux bases de données classiques, un ED est accessible en ajout ou en consultation uniquement. Les modifications ne sont autorisées que pour des cas particuliers (correction derreurs„. etc. ). page3 Historisées La conservation de l’évolu ?es dans le temps, Les informations issues des sources de données doivent être agrégées et réorganisées afin de faciliter le processus de prise de décision.
Disponibles pour l’interrogation et l’analyse Les utilisateurs doivent pouvoir consulter les données en fonction de leurs droits d’accès. L’ED doit comporter un module de traitement des requêtes, exprimées dans un langage, doté d’opérateurs puissants, pour l’exploitation de la richesse du modèle. 2. 2 Architecture d’un entrepôt de données : L’architecture d’un ED, représentée dans la figure 1, s’articule autour de trois phases : l’intégration, la estructuration, et l’exploitation (Inman, 1 996b).
Intégration : Cette première étape, est assez délicate, car elle consiste ? extraire et regrouper les données, provenant de sources multiples, et hétérogènes. un certain nombre de problèmes est à résoudre à ce niveau : les données doivent être filtrées, triées, homogénéisées et nettoyées. Structuration Cette étape consiste à réorganiser les données, dans des magasins afin de supporter efficacement les processus d’analyse et d’interrogation, et d’offrir aux différents utilisateurs, des vues appropriées à leurs esoins.
Interrogation et Analyse L’exploitation de l’entrepôt, pour raide à la décision peut se faire de différentes façons, dont ‘ l’interrogation à travers un langage de requêtes, La connexion à des composants de report, pour des représentations graphiques et tabulaires, L’utilisation des techniques OLAP (OnLine Analytical Process L’utilisation des techniques de fouille de données (Data Mining). 2. 3 Modèle Multidimensionnel gret al, 2001 Les modèles basés sur le imensionnel, sont les PAGF s OF & al, 2001): Les modèles basés sur le concept multidimensionnel, sont les lus appropriés, à capturer les caractéristiques des DW.
Ils permettent en effet, de donner une vision simple, et facilement interprétable par des non informaticiens, et de visualiser les données selon différentes dimensions. Le modèle multidimensionnel contient deux types d’attributs : les dimensions et les mesures. Les dimensions sont les valeurs numériques que l’on compare, les dimensions sont les points de vue depuis lesquels les mesures peuvent être observées. La modélisation multidimensionnelle est illustrée par des cubes de données ou des hypercubes. age4 mesure Figure 2. 1 : Exemple d’un cube de données Les données représentées sur l’hypercube peuvent être sujettes ? une analyse OLAP. Le terme OLAP (Onl_ine Analytical Process) désigne communément, un ensemble de fonctionnalités qui servent à faciliter l’analyse multidimensionnelle, opérations réalisables sur l’hypercube, parmi lesquelles nous citons : la rotation, la coupe, le pliage et le dépliage (Codd, 1993 ), (Chaudrui, 1997). . 4 La fouille de données (Data mining) Le data mining fait référence à un ensemble de techniques d’exploratlon et d’analyse, par des moyens automatiques ou semi-automatiques, d’une masse importante de onnées dans le but de découvrir des tendances cachées ou des règles significatives (non triviales, implicites et potentiellement utiles) (Gardarin 2000), (Inmon, 1996a). Les outils de data nt en général, sur des associatives.
Objectifs du data mining Les objectifs du Data Mining peuvent être regroupés dans trois axes importants • Prédiction (What-if) : consiste à prédire les conséquences d’un événement (ou dune decision), se basant sur le passé. Découverte de règles cachées : découvrir des règles associatives, entre différents événements (Exemple corrélation entre les ventes de deux produits). Confirmation d’hypothèses : confirmer des hypothèses proposées par les analystes et décideurs, et les doter d’un degré de confiance. 3.
Aide à la décision dans le CRM CRM est un acronyme pour Customer Relationship Management – GRC ou Gestion de la Relation Client en français 3. 1 Définition CRM : C’est un terme de Pindustrie des systèmes d’information englobant des méthodologies, du software et habituellement des capacités Internet qul aident une entreprise ? gérer les relations avec ses clients d’une manière structurée. 3. 2 E-CRM . L’e-crm est un processus continu d’amélioration de la relation lient sur Internet. C’est un domaine en pleine expansion au vu de l’impact d’Internet sur le e-commerce.
Voici quelques chiffres justifiant l’intérêt porté à ce domaine (Source: META Group, Business Week, Forrester Research, Jupiter Communication): des acheteurs potentiels abandonnent le processus d’achat en cours des internautes acheteurs se disent insatisfaits du service client de leur site d’achat L’utilisation d’outils de gestion de campagnes d’e-mail permet de multiplier par quatre le taux d’achat engendré Les campagnes par e-mall coûtent moins cher que le publipostage direct classique 4.
Conception de l’outil d’aide à la décision OAD Dans ce qui suit, nous présentons la conception de notre outil d’aide à la décision, associé, à un site de ecommerce. Deux volets constituent notre solution, le premier est consacré à l’analyse multidimensionnelle, et le second, à l’utilisation d’une technique de fouille de données basée sur un algorithme de groupage . Nous utiliserons des diagrammes UM’ pour illustrer les aspects statiques, dynamiques et fonctionnels de notre conception. . 1 Diagrammes de cas d’utilisation Le commerçant, étant l’acteur principal. Les cas d’utilisation de ase qui vont être mis en évidence pour l’assister dans la prise de décision seront : Accéder à l’OAD. Visualiser les données en cube (choisir un magasin de données). Appliquer les opérations OLAP sur le cube de données. Appliquer les techniques du data mining. Figure 4. 1 : Diagramme des use case de l’OAD 4. Diagrammes de séquence: Dans cette phase, et après identification des cas d’utilisation, et des scénarios associés à chaque cas, nous les représentons à l’aide des diagrammes de séquence : « visualiser cube de données « appliquer les opérations OLAP « Appliquer algorithme de Data-mining ». ages séquence « Appliquer les opérateurs OLAP » 4. 2 Diagrammes de classes partlcipantes (DCP) : La phase suivante, consiste à identifier l’ensemble des diagramme de classes participantes (DCP).
Il s’agit de diagrammes de classes UMI_ qui décrivent, par cas d’utilisation, les principales classes d’analyse et leurs relations. Ces diagrammes font la jonction entre les cas d’utilisation, le modèle du domaine, la maquette et les diagrammes de conception logicielle. Les différentes classes d’analyse se répartissent en trois catégories : les classes « Interface » permettant les interactions entre le système t ses utilisateurs, les classes « contrôle » contenant la cinématque de l’application, et les classes « entité » représentant les objets métiers.
Classe d’interface Classe de contrôle Figure 4. 6 : DCP du cas d’utilisation Figure 4. 7 : DCP du cas d’utilisation « visualiser les données en cube » « Appliquer opérateur OLAP » Page8 Figure 4. 8 : DCP du cas d’utilisation « Appliquer un algorithme de data mining» Page9 Le deuxième module de l’OAD, est basé sur un algorithme de groupage (Cardarin, 2000) inspiré de la méthode des k-moyennes, permettant de construire des groupes de clients n fonction de critères de similarité.
Avant de détailler le fonctionnement de l’algorithme de groupage, il faut éclaircir certains points et rappeler quelques définitions de base utilisées dans les étapes de calcul des groupes d’individus. Représentation des clients Les clients sont représentés par des vecteurs de , où n et le nombre de variables (dimensions) selon lesquelles on perçoit le client. On associe à chaque client, un vecteur. x = xl . xnj On considère que chaque indivldu est muni dun poids pi avec pi > oetypi=l. Nuage d’individus Dans l’espace des individu = {xi / xi pi et