Définition de l’importance statistique



Qu’est-ce que la signification statistique ?

La signification statistique fait référence à l’affirmation selon laquelle un résultat provenant de données générées par des tests ou une expérimentation n’est pas susceptible de se produire de manière aléatoire ou par hasard, mais est plutôt susceptible d’être attribuable à une cause spécifique. Avoir une signification statistique est important pour les disciplines universitaires ou les praticiens qui s’appuient fortement sur l’analyse des données et de la recherche, telles que l’économie, la finance, l’investissement, la médecine, la physique et la biologie.

La signification statistique peut être considérée comme forte ou faible. Lors de l’analyse d’un ensemble de données et des tests nécessaires pour discerner si une ou plusieurs variables ont un effet sur un résultat, une forte signification statistique aide à soutenir le fait que les résultats sont réels et ne sont pas dus à la chance ou au hasard. En termes simples, si une valeur p est petite, le résultat est considéré comme plus fiable.

Des problèmes surviennent dans les tests de signification statistique parce que les chercheurs travaillent généralement avec des échantillons de populations plus importantes et non avec les populations elles-mêmes. En conséquence, les échantillons doivent être représentatifs de la population, de sorte que les données contenues dans l’échantillon ne doivent en aucun cas être biaisées. Dans la plupart des sciences, y compris l’économie, la signification statistique est pertinente si une affirmation peut être faite à un niveau de 95 % (ou parfois 99 %).

Comprendre la signification statistique

Le calcul de la signification statistique (test de signification) est sujet à un certain degré d’erreur. Le chercheur doit définir à l’avance la probabilité d’une erreur d’échantillonnage, qui existe dans tout test qui n’inclut pas l’ensemble de la population.

La taille de l’échantillon est un élément important de la signification statistique dans la mesure où les échantillons plus grands sont moins sujets aux coups de chance. Seuls des échantillons aléatoires et représentatifs doivent être utilisés dans les tests de signification. Le niveau auquel on peut accepter si un événement est statistiquement significatif est appelé niveau de signification.

Les chercheurs utilisent une statistique de test connue sous le nom de valeur p pour déterminer la signification statistique : si la valeur p tombe en dessous du niveau de signification, le résultat est alors statistiquement significatif. La valeur p est fonction des moyennes et des écarts types des échantillons de données.

La valeur p indique la probabilité sous laquelle le résultat statistique donné s’est produit, en supposant que le hasard seul est responsable du résultat. Si cette probabilité est faible, le chercheur peut alors décider en toute sécurité de notre chance en tant que cause. La valeur p doit être inférieure au seuil de signification pour que les résultats soient au moins considérés comme statistiquement significatifs.

L’opposé du niveau de signification, calculé comme 1 moins le niveau de signification, est le niveau de confiance. Il indique le degré de confiance que le résultat statistique n’est pas le fruit du hasard ou d’une erreur d’échantillonnage. Le niveau de confiance habituel dans de nombreux tests statistiques est de 95 %, ce qui conduit à un niveau de signification habituel ou une valeur p de 5 %.

Points clés à retenir

  • La signification statistique fait référence à l’affirmation selon laquelle un résultat de données générées par des tests ou des expérimentations est susceptible d’être attribuable à une cause spécifique.
  • Si une statistique a une signification élevée, elle est considérée comme plus fiable.
  • Le calcul de la signification statistique est sujet à un certain degré d’erreur.
  • La signification statistique peut être mal interprétée lorsque les chercheurs n’utilisent pas le langage avec précaution dans la communication de leurs résultats.
  • Plusieurs types de tests de significativité sont utilisés selon les recherches menées

Considérations particulières

La signification statistique n’indique pas toujours une signification pratique, ce qui signifie que les résultats ne peuvent pas être appliqués à des situations commerciales réelles. De plus, la signification statistique peut être mal interprétée lorsque les chercheurs n’utilisent pas le langage avec précaution dans la communication de leurs résultats. Le fait qu’un résultat soit statistiquement significatif n’implique pas qu’il soit ne pas aléatoire, juste que la probabilité qu’il soit aléatoire est considérablement réduite.

Ce n’est pas parce que deux séries de données ont une forte corrélation l’une avec l’autre qu’il y a un lien de causalité. Par exemple, le nombre de films dans lesquels l’acteur Nicolas Cage joue au cours d’une année donnée est très fortement corrélé au nombre de noyades accidentelles dans les piscines. Mais cette corrélation est fausse puisqu’il n’y a aucune affirmation causale théorique qui puisse être faite.

Un autre problème qui peut survenir avec la signification statistique est que les données passées et les résultats de ces données, qu’ils soient statistiquement significatifs ou non, peuvent ne pas refléter les conditions actuelles ou futures. En matière d’investissement, cela peut se manifester par un modèle de tarification qui s’effondre en période de crise financière, car les corrélations changent et les variables n’interagissent pas comme d’habitude. L’importance statistique peut également aider un investisseur à discerner si un modèle d’évaluation des actifs est meilleur qu’un autre.

Types de tests de signification statistique

Plusieurs types de tests de signification sont utilisés selon les recherches menées. Par exemple, des tests peuvent être utilisés pour un, deux ou plusieurs échantillons de données de différentes tailles pour des moyennes, des variances, des proportions, des données appariées ou non appariées, ou des distributions de données différentes.

L’hypothèse nulle

Tous ces facteurs ont ce qu’on appelle des hypothèses nulles, et la signification est souvent l’objectif des tests d’hypothèses en statistique. L’hypothèse nulle la plus courante est que le paramètre en question est égal à zéro (indiquant généralement qu’une variable a un effet nul sur le résultat d’intérêt). Si vous pouvez rejeter l’hypothèse nulle avec une confiance de 95 % ou plus, les chercheurs peuvent invoquer la signification statistique. Des hypothèses nulles peuvent également être testées pour l’égalité (plutôt qu’égale à zéro) de l’effet pour deux traitements alternatifs ou plus.

Rejet de l’hypothèse nulle, même si un très haut degré de signification statistique ne peut jamais prouver quelque chose, ne peut qu’ajouter du support à une hypothèse existante. D’autre part, le fait de ne pas rejeter une hypothèse nulle est souvent un motif de rejet d’une hypothèse.

Un test de signification statistique partage en grande partie les mêmes mathématiques que celui du calcul d’un intervalle de confiance. Dans des situations courantes, une façon d’interpréter la signification statistique est que l’intervalle de confiance correspondant à 95 % ne contient pas la valeur zéro. Même si une variable s’avère statistiquement significative, elle doit toujours avoir un sens dans le monde réel.

De plus, un effet peut être statistiquement significatif mais n’avoir qu’un très faible impact. Par exemple, il peut être très improbable en raison du hasard que les entreprises qui utilisent du papier toilette à deux épaisseurs dans leurs salles de bain aient des employés plus productifs, mais l’amélioration de la productivité absolue de chaque travailleur sera probablement infime.

Laisser un commentaire