Vous savez probablement maintenant que vous devriez, dans la mesure du possible, prendre des décisions fondées sur des données au travail. En tout état de cause, savez-vous comment analyser la majorité des informations qui vous sont accessibles ? Heureusement, vous n’avez probablement pas besoin de faire les calculs vous-même (Dieu merci !), mais vous devez comprendre et traduire efficacement l’examen effectué par vos partenaires
Pour mieux comprendre cette stratégie et la façon dont les organisations l’utilisent, j’ai discuté avec Tom Redman, auteur de Data Driven : Profiter de votre atout commercial le plus important. Il invite en outre les associations à faire part de leurs projets en matière d’information et de qualité de l’information.
Qu’est-ce que l’analyse de régression ?
Redman propose cette situation modèle : Supposons que vous soyez un chef de projet qui tente de prévoir les chiffres d’un mois à partir de maintenant. Vous réalisez que quelques poignées, peut-être même de nombreux éléments, du climat à l’avancement d’un candidat jusqu’aux ragots d’un modèle aussi bon que jamais, peuvent affecter le chiffre. Peut-être même que des membres de votre association ont une hypothèse sur ce qui aura le plus d’impact sur les marchés. “Faites-moi confiance. Plus nous avons de pluie, plus nous vendons.” “Six semaines après la promotion du concurrent, les ventes font un bond.”
L’analyse de régression est un moyen de déterminer mathématiquement laquelle de ces variables a effectivement un impact. Elle permet de répondre aux questions : Quels sont les facteurs les plus importants ? Lesquels pouvons-nous ignorer ? Comment ces facteurs interagissent-ils les uns avec les autres ? Et, ce qui est peut-être le plus important, quel est notre degré de certitude concernant tous ces facteurs ?
Dans l’analyse de régression, ces facteurs sont appelés variables.
Dans l’examen des rechutes, ces éléments sont appelés facteurs. Vous avez votre variable dépendante – le principal facteur que vous essayez de comprendre ou de prévoir. Dans le modèle de Redman terminé, la variable dépendante est les accords de mois en mois. Ensuite, vous avez vos facteurs autonomes – les éléments qui, selon vous, affectent votre variable dépendante.
Comment cela fonctionne-t-il ?
Afin de diriger une enquête sur les rechutes, vous rassemblez les données sur les variables en question. (Mise à jour : vous n’avez probablement pas besoin de faire cela sans l’aide de quelqu’un d’autre, mais il est utile que vous compreniez la procédure utilisée par votre associé examinateur d’informations). Vous prenez la majorité des chiffres de vos transactions de mois en mois pour les trois années précédentes, l’état et toute information sur les facteurs libres qui vous intéressent. Ainsi, pour cette situation, supposons que vous découvriez les précipitations normales d’un mois à l’autre pour une période remontant jusqu’à trois ans également. À ce moment-là, vous reportez la plupart de ces données sur un graphique qui ressemble à celui-ci :

Le y-pivot est la mesure des offres (la variable dépendante, la chose qui vous intéresse, est toujours sur le y-hub) et le x-hub est la précipitation totale. Chaque point bleu correspond à une information sur un mois, à savoir le montant des précipitations pour ce mois-là et le nombre d’offres que vous avez faites au cours de ce même mois.
En examinant ces informations, vous remarquerez très probablement que les transactions sont plus élevées les jours où il pleut une tonne. C’est fascinant à savoir, mais de combien ? S’il pleut 3 pouces, savez-vous combien vous vendrez ? Et s’il pleut 4 pouces ?
Envisagez actuellement de tracer une ligne à travers le graphique, une ligne qui passe généralement par le centre du nombre considérable de foyers d’information. Cette ligne vous permettra de répondre, avec un certain degré de conviction, au montant que vous vendez normalement lorsqu’il pleut une somme déterminée.

C’est ce qu’on appelle la ligne de régression et elle est tracée (à l’aide d’un programme de statistiques comme SPSS ou STATA ou même Excel) pour montrer la ligne qui correspond le mieux aux données. Pour ainsi dire, précise Redman, “la ligne rouge est la meilleure clarification du lien entre la variable autonome et la variable de quartier”.
En plus de tracer la ligne, votre programme de statistiques produit également une formule qui explique la pente de la ligne et ressemble à ceci :
Ignorez le terme d’erreur pour l’instant. Il fait référence au fait que la régression n’est pas parfaitement précise. Concentrez-vous sur le modèle :

Ignorez le terme d’erreur pour l’instant. Il fait référence au fait que la régression n’est pas parfaitement précise. Concentrez-vous sur le modèle :
Ce que cette formule vous dit, c’est que s’il n’y a pas de “x”, alors Y = 200. De cette façon, on peut vérifier que, lorsqu’il n’a pas plu du tout, vous avez réalisé en moyenne 200 ventes et vous pouvez espérer faire l’équivalent en attendant que les différents facteurs restent équivalents. De plus, auparavant, pour chaque centimètre d’averse supplémentaire, vous faisiez normalement cinq ventes supplémentaires. “Pour chaque ajout que x augmente d’un, y augmente de cinq”, dit Redman.
Pour l’instant, nous devrions revenir sur le terme d’erreur. Vous pouvez être tenté de dire que les pluies torrentielles affectent considérablement les transactions si, pour chaque centimètre, vous obtenez cinq transactions supplémentaires, mais le fait de savoir si cette variable mérite votre attention dépendra du terme d’erreur. Une droite de régression comporte toujours un terme d’erreur car, dans la vie réelle, les variables indépendantes ne sont jamais des prédicteurs parfaits des variables dépendantes. Ou peut-être que la ligne est une jauge dépendant de l’information accessible. Le terme d’erreur vous indique donc à quel point vous pouvez être certain de la recette. Plus il est grand, moins la ligne de rechute est certaine.
Le modèle ci-dessus n’utilise qu’une seule variable pour prévoir le facteur d’intrigue – pour que cette pluie de situations anticipe les transactions. Normalement, vous commencez une analyse de régression en ayant besoin de comprendre l’effet de quelques variables indépendantes. Vous pouvez donc intégrer les averses ainsi que des informations sur la progression d’un candidat. “Vous continuez à faire cela jusqu’à ce que le terme d’erreur soit faible”, dit Redman. “Vous essayez d’obtenir la ligne qui correspond le mieux à vos informations.” Bien qu’il puisse y avoir des dangers à essayer d’incorporer un nombre excessif de facteurs dans une enquête de rechute, des enquêteurs talentueux peuvent limiter ces dangers. De plus, réfléchir à l’effet de divers facteurs sans attendre un instant est peut-être la plus grande marge de manœuvre en cas de rechute.