Test d'hypothèse
En statistiques, un test d'hypothèse est une démarche
consistant à rejeter ou à accepter une hypothèse
statistique, appelée hypothèse nulle, en fonction d'un jeu de données (échantillon).
Classification
De manière schématique, on distingue généralement les tests d'homogénéité et les tests de
conformité.
- Dans le cas d'un test d'homogénéité, on veut comparer deux échantillons entre eux. L'hypothèse nulle H0 supposera
l'homogénéité des deux échantillons.
- Dans le cas d'un test de conformité, on veut déterminer si un échantillon suit une loi statistique connue. L'hypothèse nulle
H0 supposera l'adéquation de l'échantillon à cette loi.
Risque de première et de deuxième espèce
Dans tous les cas, le test suit une succession d'étapes définies:
- Énoncé de l'hypothèse nulle H0 et de l'hypothèse alternative H1.
- Calcul d'une variable de décision correspondant à une mesure de la distance entre les deux échantillons dans le cas de
l'homogénéité, ou entre l'échantillon et la loi statistique dans le cas de la conformité. Plus cette distance sera grande et
moins l'hypothèse nulle H0 sera probable.
- Calcul de la probabilité pour que H0 soit vraie connaissant la variable calculée précédemment. Cette probabilité,
généralement appelée risque de première espèce et notée α0, correspond au risque de rejeter à tort
H0.
- Conclusion du test, en fonction d'un risque seuil αseuil arbitraire, en dessous duquel H0 pourra être
rejetée. Généralement, un risque de 5% est considéré comme acceptable (c'est-à-dire que dans 5% des cas, l'expérimentateur se
trompera quand il rejettera H0).
La probabilité pour que H0 soit fausse alors qu'on l'a acceptée est β, le risque de deuxième espèce. Sa
valeur dépend du contexte, et est très difficilement évaluable, c'est pourquoi seul le risque α est utilisé comme critère de
décision.
Test classiques
Il existe de nombreux tests statistiques classiques parmi lesquels on peut citer :
- - le test de Student,
parfois appelé aussi test de Student-Fisher, qui sert à la comparaison d'une moyenne observée avec une valeur
« attendue »
- - le test de Fisher,
parfois appelé aussi test de Fisher-Snedecor, qui sert à la comparaison de deux variances observées, ou d'une variance observée
avec une valeur « attendue »
- - le test de Khi-2, qui sert notamment à la comparaison d'un couple
d'effectifs observés, ou à la comparaison globale de plusieurs couples d'effectifs observés, et plus généralement à la
comparaison de deux distributions observées.
En méthodes bayésiennes, on utilise beaucoup le psi-test (mesure de distance dans l'espace des possibles) dont on montre que
le Khi-2 constitue une très bonne approximation asymptotique lorsqu'existent un grand nombre d'observations.
Voir aussi

