Définition de l’hypothèse nulle : tests et exemples



Qu’est-ce qu’une hypothèse nulle ?

Une hypothèse nulle est un type d’hypothèse utilisé en statistique qui propose qu’il n’y ait pas de différence entre certaines caractéristiques d’une population (ou d’un processus de génération de données).

Par exemple, un joueur peut être intéressé à savoir si un jeu de hasard est équitable. Si c’est juste, alors les gains attendus par jeu s’élèvent à 0 pour les deux joueurs. Si le jeu n’est pas équitable, alors les gains attendus sont positifs pour un joueur et négatifs pour l’autre. Pour tester si le jeu est équitable, le joueur collecte des données sur les gains à partir de nombreuses répétitions du jeu, calcule les gains moyens à partir de ces données, puis teste l’hypothèse nulle selon laquelle les gains attendus ne sont pas différents de zéro.

Si les gains moyens des données de l’échantillon sont suffisamment éloignés de zéro, le joueur rejettera l’hypothèse nulle et conclura à l’hypothèse alternative, à savoir que les gains attendus par jeu sont différents de zéro. Si les gains moyens des données de l’échantillon sont proches de zéro, le joueur ne rejettera pas l’hypothèse nulle, concluant plutôt que la différence entre la moyenne des données et 0 s’explique uniquement par le hasard.

Points clés à retenir

  • Une hypothèse nulle est un type de conjecture utilisée en statistique qui propose qu’il n’y a pas de différence entre certaines caractéristiques d’une population ou d’un processus de génération de données.
  • L’hypothèse alternative propose qu’il y ait une différence.
  • Le test d’hypothèse fournit une méthode pour rejeter une hypothèse nulle dans un certain niveau de confiance. (Les hypothèses nulles ne peuvent cependant pas être prouvées.)

Comment fonctionne une hypothèse nulle

L’hypothèse nulle, également connue sous le nom de conjecture, suppose que tout type de différence entre les caractéristiques choisies que vous voyez dans un ensemble de données est dû au hasard. Par exemple, si les gains attendus pour le jeu de hasard sont vraiment égaux à 0, alors toute différence entre les gains moyens dans les données et 0 est due au hasard.

Les hypothèses statistiques sont testées à l’aide d’un processus en quatre étapes. La première étape consiste pour l’analyste à énoncer les deux hypothèses afin qu’une seule puisse avoir raison. L’étape suivante consiste à formuler un plan d’analyse, qui décrit comment les données seront évaluées. La troisième étape consiste à exécuter le plan et à analyser physiquement les données de l’échantillon. La quatrième et dernière étape consiste à analyser les résultats et soit à rejeter l’hypothèse nulle, soit à affirmer que les différences observées ne s’expliquent que par le hasard.

Les analystes cherchent rejeter l’hypothèse nulle car cela est un fort conclusion. Cela nécessite des preuves solides sous la forme d’une différence observée qui est trop grande pour être expliquée uniquement par le hasard. Ne pas rejeter l’hypothèse nulle – que les résultats ne s’expliquent que par le hasard – est un faible conclusion parce qu’elle permet que des facteurs autres que le hasard peuvent être à l’œuvre mais peuvent ne pas être suffisamment forts pour être détectables par le test statistique utilisé.

Important

Les analystes cherchent rejeter l’hypothèse nulle pour exclure le hasard seul comme explication des phénomènes d’intérêt.

Exemples d’hypothèse nulle

Voici un exemple simple. Une directrice d’école affirme que les élèves de son école obtiennent une moyenne de 7 sur 10 aux examens. L’hypothèse nulle est que la moyenne de la population est de 7,0. Pour tester cette hypothèse nulle, nous enregistrons les notes de, disons, 30 élèves (échantillon) de l’ensemble de la population étudiante de l’école (disons 300) et calculons la moyenne de cet échantillon.

Nous pouvons ensuite comparer la moyenne (calculée) de l’échantillon à la moyenne (hypothétique) de la population de 7,0 et tenter de rejeter l’hypothèse nulle. (L’hypothèse nulle ici, selon laquelle la moyenne de la population est de 7,0, ne peut pas être prouvée à l’aide des données de l’échantillon ; elle ne peut être que rejetée.)

Prenons un autre exemple : le rendement annuel d’un fonds commun de placement donné est de 8 %. Supposons qu’un fonds commun de placement existe depuis 20 ans. L’hypothèse nulle est que le rendement moyen est de 8 % pour le FCP. Nous prenons un échantillon aléatoire des rendements annuels du fonds commun de placement pendant, disons, cinq ans (échantillon) et calculons la moyenne de l’échantillon. Nous comparons ensuite la moyenne de l’échantillon (calculée) à la moyenne de la population (affirmée) (8 %) pour tester l’hypothèse nulle.

Pour les exemples ci-dessus, les hypothèses nulles sont :

  • Exemple A : Les élèves de l’école obtiennent une moyenne de 7 sur 10 aux examens.
  • Exemple B : Le rendement annuel moyen du fonds commun de placement est de 8 % par an.

Aux fins de déterminer s’il faut rejeter l’hypothèse nulle, l’hypothèse nulle (en abrégé H0) est supposé, à des fins d’argumentation, être vrai. Ensuite, la plage probable des valeurs possibles de la statistique calculée (par exemple, le score moyen sur 30 tests d’étudiants) est déterminée selon cette présomption (par exemple, la plage de moyennes plausibles pourrait aller de 6,2 à 7,8 si la moyenne de la population est de 7,0). Ensuite, si la moyenne de l’échantillon est en dehors de cette plage, l’hypothèse nulle est rejetée. Sinon, la différence est dite « explicable par le hasard seul », se situant dans la plage qui est déterminée par le seul hasard.

Un point important à noter est que nous testons l’hypothèse nulle car il existe un élément de doute sur sa validité. Quelle que soit l’information qui va à l’encontre de l’hypothèse nulle déclarée, elle est saisie dans l’hypothèse alternative (H1). Pour les exemples ci-dessus, l’hypothèse alternative serait :

  • Les élèves obtiennent une moyenne de ne pas égal à 7.
  • Le rendement annuel moyen du fonds commun de placement est ne pas égal à 8 % par an.

En d’autres termes, l’hypothèse alternative est une contradiction directe de l’hypothèse nulle.

Test d’hypothèse pour les investissements

À titre d’exemple lié aux marchés financiers, supposons qu’Alice constate que sa stratégie d’investissement produit des rendements moyens plus élevés que le simple achat et la détention d’actions. L’hypothèse nulle stipule qu’il n’y a pas de différence entre les deux rendements moyens, et Alice est encline à le croire jusqu’à ce qu’elle puisse conclure à des résultats contradictoires.

Pour réfuter l’hypothèse nulle, il faudrait montrer une signification statistique, qui peut être trouvée à l’aide de divers tests. L’hypothèse alternative indiquerait que la stratégie d’investissement a un rendement moyen plus élevé qu’une stratégie traditionnelle d’achat et de conservation.

Un outil qui peut être utilisé pour déterminer la signification statistique des résultats est la valeur p. Une valeur p représente la probabilité qu’une différence aussi grande ou plus grande que la différence observée entre les deux rendements moyens puisse se produire uniquement par hasard.

Une valeur p inférieure ou égale à 0,05 est souvent utilisée pour indiquer s’il existe des preuves contre l’hypothèse nulle. Si Alice effectue l’un de ces tests, comme un test utilisant le modèle normal, entraînant une différence significative entre ses rendements et les rendements d’achat et de conservation (la valeur p est inférieure ou égale à 0,05), elle peut alors rejeter l’hypothèse nulle et conclure l’hypothèse alternative.

Laisser un commentaire