Qu’est-ce que l’analyse prédictive et comment l’utiliser en interne ?

Une fois n’est pas coutume nous commencerons cet article par un petit exemple très simple afin de définir l’analyse prédictive.

Prenons l’exemple d’une chaîne de magasins qui décide de lancer sa campagne de publicité annuelle pour vendre ses produits. Afin de « prévoir » l’impact de cette campagne sur son chiffre d’affaire, l’entreprise va « confronter » les résultats des campagnes passées à ses résultats présents.

L’objectif est ici d’étudier le lien qu’il y a eu dans le passé entre le CA et le budget publicité. Ceci en faisant intervenir d’autres indicateurs sur les magasins (surface, nombres de familles dans le secteur, etc.). Nous souhaitons ensuite généraliser les liens observés sur des nouvelles données inconnues.

En imaginant que dans plusieurs situations similaires, la même évolution peut se reproduire. Nous pouvons définir l’analyse prédictive comme l’art de prédire une situation future en confrontant une situation présente à une situation passée.

Habituellement très gourmande en ressources, l’analyse prédictive (prédictive analytics) nécessite souvent des compétences poussées.

La puissance de calcul des nouveaux logiciels de business intelligence agile rend les modèles prédictifs beaucoup plus précis, simples et rapides à utiliser par les utilisateurs métiers. Il n’est désormais plus nécessaire de posséder des compétences poussées en statistiques pour produire une analyse prédictive.

Les logiciels de tableaux de bord sont aujourd’hui des applications très courantes en termes d’analyse prédictive au sein des entreprises. Ils permettent à l’utilisateur métiers de se projeter à court et moyen terme. En lui fournissant des informations précises sur l’impact possible de certaines situations ou prises de décisions. C’est une véritable révolution dans le process décisionnel.

Que peut apporter l’analyse prédictive à votre entreprise et quelles en sont les étapes clés ?

 

L’analyse prédictive vous guide “rationnellement” dans les choix possibles pour orienter votre stratégie de façon objective.

Selon l’exemple de l’infographie sur les supermarchés, le prédictif permet de prendre des décisions de manière rationnelle en se basant sur des données du passé et des modèles mathématiques.

Au niveau de l’entreprise, l’analyse prédictive donne à vos collaborateurs non informaticiens et non statisticiens le pouvoir d’analyser les tendances et les relations dans vos données pour prédire l’évolution des indicateurs métiers.

La première étape (l’apprentissage) consiste à entraîner le modèle (machine learning) à partir de méthodes statistiques connues (régression linéaire, régression logarithmique, régression polynomiale, lissage exponentiel simple, lissage de Holt, Transformation de Fourier, etc.) pour construire le modèle prédictif.

La seconde étape (prédiction) permet de prédire les résultats en utilisant le modèle “intelligent”.

La dernière étape (décisionnelle), plus orientée métiers, consiste à utiliser pertinemment les données obtenues précédemment pour adapter sa stratégie.

Quels sont les modèles prédictifs les plus efficaces et dans quel cas les utiliser ?

 

Le choix d’un modèle prédictif dépend de la situation ainsi que ce que l’on souhaite montrer au travers de ses données. Ainsi, selon que l’on dispose de données avec une tendance ou des cycles, ou si l’on souhaite faire une modélisation compréhensible par un large public, alors on utilisera des approches différentes.

Nous avons regroupé dans ce tableau les différents types de modèle de données et les situations dans lesquelles ils s’appliquent le mieux.

Régression linéaire :

 

La régression linéaire est un des outils de base de la modélisation. Elle recherche une relation linéaire entre la mesure à prédire et l’axe temps.

La situation d’application idéale de ce modèle est lorsque la mesure à prédire est proportionnelle à l’axe temps. Toutefois, il peut être également intéressant de choisir ce modèle pour sa simplicité de visualisation (une droite), ce qui le rend rapidement compréhensible par un large public.

Régression logarithmique :

 

La régression logarithmique possède les mêmes propriétés que la régression linéaire. La différence réside dans le fait qu’elle permet de trouver une relation logarithmique entre la mesure à prédire et l’axe temps.

Régression polynomiale :

 

La régression polynomiale est une forme plus complexe de la régression linéaire. Elle permet d’approximer une mesure non plus par une droite mais par un polynôme.

Lissage exponentiel simple :

 

Contrairement aux techniques de régressions qui ne sont pas propres aux séries temporelles, les lissages tiennent compte de la spécificité de la variable temporelle. En effet, l’importance à donner à une valeur décroît dans le temps. Par exemple, pour prédire le chiffre d’affaires de l’année 2017, il est probable que l’on donne plus d’importance à la valeur du CA de 2016 qu’à la valeur du CA de 2008. Les diverses techniques de lissages permettent donc de tenir compte de la dépréciation de l’information au cours du temps.

Le lissage exponentiel simple permet à la fois de lisser des données et également de prédire la prochaine valeur. Il s’applique à des données ne présentant ni tendance et ni saisonnalité.

Lissage exponentiel double :

 

Le lissage exponentiel double est une version améliorée du lissage exponentiel simple. En effet, celui-ci est capable de prendre en compte la présence d’une tendance dans les données. Toutefois, il ne permet pas de prédire des données présentant une saisonnalité.

Lissage de Holt :

 

Le lissage de Holt est une version améliorée du lissage exponentiel double. Celui-ci utilise deux paramètres afin d’estimer la valeur de la mesure, contre un seul pour le lissage exponentiel double.

On peut alors se demander pour quelle raison utiliser le lissage exponentiel double si le lissage de Holt est plus précis. La raison principale est le temps de calcul. En effet, dans le cas du lissage de Holt il faut estimer deux paramètres, contre un seul dans le cas du lissage exponentiel double.

Lissage de Holt-Winters :

 

Les lissages de Holt-Winters permettent de prendre en compte des données présentant une tendance et une saisonnalité.

Il existe deux versions du lissage de Holt-Winters :

  1. Version additive
  2. Version multiplicative

Le cas additif correspond à des saisons dont l’amplitude reste constante au cours du temps alors que le cas multiplicatif correspond à des saisons dont l’amplitude croît/décroît au cours du temps

Transformation de Fourrier :

 

L’algorithme permettant de prédire la mesure n’est pas la transformation de Fourier, c’est un algorithme de prédiction utilisant la transformation de Fourier.

Techniquement, l’objectif est de décomposer la mesure à prédire en une somme de fonction sinus et cosinus de périodes différentes. Grâce à cela, notre algorithme est capable de prendre en compte des cycles/saisonnalités plus complexes que celles présentées dans la partie sur les modèles de Holt-Winters.

L’analyse prédictive dans le logiciel de business intelligence DigDash Enterprise ?

 

Parce que nous estimons qu’aujourd’hui, tout utilisateur métier devrait être en mesure de produire des prédictions sur ses données, nous avons décidé d’intégrer depuis Juillet 2016 l’analyse prédictive en standard dans DigDash Enterprise.

En savoir plus