L’analyse statistique est la science de la collecte de données et de la découverte de modèles et de tendances. En réalité, il s’agit d’une autre façon de dire “statistiques”. Après avoir collecté des données, il est possible de les analyser :

Résumer les données. Par exemple, faites un diagramme circulaire.

Trouvez les principales mesures de la position. Par exemple, la moyenne vous dit quel est le nombre moyen (ou “moyen”) dans un ensemble de données.

Calculez les mesures moyennes : Elles vous indiquent si vos données sont étroitement regroupées ou plus répandues. L’écart-type est l’une des mesures de diffusion les plus couramment utilisées ; il vous indique l’étendue moyenne de vos données.

Faites des prévisions pour l’avenir en vous basant sur le comportement passé. Cela est particulièrement utile dans le commerce de détail, l’industrie, la banque, le sport ou toute organisation où il serait avantageux de connaître les tendances futures.

Testez l’hypothèse d’une expérience. La collecte de données d’une expérience ne raconte une histoire que lorsque vous analysez les données. Cette partie de l’analyse statistique est plus formellement appelée “Test d’hypothèse”, où l’hypothèse nulle (la théorie communément acceptée) est prouvée ou réfutée.

Analyse statistique et méthode scientifique

L’analyse statistique est largement utilisée dans le domaine des sciences, de la physique aux sciences sociales. Outre la vérification d’hypothèses, les statistiques peuvent fournir une approximation pour une inconnue qui est difficile ou impossible à mesurer. Par exemple, le domaine de la théorie quantique des champs, bien qu’il soit une réussite sur le plan théorique, s’est avéré difficile à expérimenter et à mesurer de manière empirique. Certains sujets des sciences sociales, tels que l’étude de la conscience ou du choix, sont pratiquement impossibles à mesurer ; l’analyse statistique peut éclairer ce qui serait le scénario plus ou moins probable.

Quand les statistiques mentent

Si les statistiques peuvent sembler une base solide pour tirer des conclusions et présenter des “faits”, il faut se méfier des pièges de l’analyse statistique. Ils comprennent la manipulation délibérée et accidentelle des résultats. Cependant, il arrive parfois que les statistiques soient tout simplement erronées. Un exemple célèbre de statistiques “simplement erronées” est le paradoxe de Simpson, qui nous montre que même les meilleures statistiques peuvent être complètement inutiles. Dans un cas classique de Simpson, les moyennes d’admission de l’université de Berkeley ont montré (à juste titre) que leur taux moyen d’admission était plus élevé pour les femmes que pour les hommes, alors qu’en fait c’était le contraire. Pour une explication plus détaillée de cette énigme, voir Le paradoxe de Simpson.