Tests statistiques de sighification

Rapport de la Métho o or20 Sni* to View Ouvrage de Thiétart : « Tests Statistiques de Signification » Article : « Competitive conditions in Islamic and conventional banking : A global perspective » de cette population. Les paramètres sont représentés avec des lettres grecques. • Une loi de probabilité est la forme générale de la distribution de fréquences de cette population.

Une hypothèse statistique se présente traditionnellement sous deux formes • Une hypothèse nulle : c’est-à-dire qu’il y a absence de changement par rapport à un statu quo ou absence de différence ntre des paramètres. Le but d’un chercheur est de repousser cette hypothèse au profit d’une hypothèse alternative. • une hypothèse alternative ou contraire : c’est celle recherchée par le chercheur, elle peut correspondre à son hypothèse de recherche.

Ces deux hypothèses sont comp émentaires, l’hypothèse nulle est notée HO et l’hypothèse alternative Hl ou Ha, cette hypothèse est acceptée si la première est rejetée. Test statistique Un test statistique permet de vérifier la validité d’une hypothèse statistique sur la base d’un échantillon tirée d’une population, il ermet d’aboutir au rejet ou non d’une hypothèse de départ. Il existe deux familles de tests statistiques : • Test paramétrique : c’est un test statistique qui exige une forme paramétrique des distributions des populations par exemple le test de Student. st non paramétrique : c’est un test statistique qui ne spécifie pas la forme paramétrique des distributions comme le test du signe, le test de Wilcoxon, le test de Mann-Whitney… Un test statistique portant sur la loi de probabilité suivie par la population suppose que Vhypothèse nulle est vérifiée quand a population étudiée suit une loi de probabilité donnée, par exemple la loi normale et l’hypothèse alternative est celle selon OF loi de probabilité donnée, par exemple la loi normale et l’hypothèse alternative est celle selon laquelle la population ne suit pas cette loi de probabilité.

IV- Risques d’erreur : Le but d’un test statistique est de rejeter ou garder l’hypothèse nulle, ceci se fait à travers les observations issues des échantillons des populations et qui comportent des risques d’erreur, il existe deux types d’erreurs : erreur de première espèce a et erreur de econde espèce notée 13 • L’erreur de première espèce mesure la probabilité de rejeter l’hypothèse nulle alors qu’elle est vraie, et le cas contraire est mesuré par l’erreur de seconde espèce.

Le chercheur peut soit commettre une seule erreur ou ne pas commettre, les deux ne peuvent être réunies. Il n’est pas suffisant de diminuer un seul type d’erreur car ceci entraîne l’augmentation de l’autre et inversement, donc pour diminuer simultanément a et p, il est nécessaire d’augmenter la taille de l’échantillon ou de trouver un compromis entre a et p en examinant par exemple la puissance du test. ??? La puissance d’un test statistique est la probabilité (1- 3) de rejeter l’hypothèse nulle H alors qu’elle est fausse, la puissance est d’autant plus grande que l’erreur de deuxième espèce est petite. • La courbe d’efficacité représente les variations de en fonction des valeurs de la statistique calculée pour lesquelles l’hypothèse alternative devrait être acceptée. ?? Le seuil de confiance est la probabilité (1- a) d’accepter l’hypothèse nulle alors qu’elle est vraie. L’erreur de première espèce est également appelée « seuil de signification » du test statistique, il est fixé géné remière espèce est également appelée « seuil de signification » du test statistique, il est fixé généralement avant la réalisation du test de 5 à pour ne pas rejeter l’hypothèse nulle, ils sont mentionnés avec des signes ou des astériques.

V- Statistique utilisable, région critique, seuil de signification La décision de rejeter ou non Phypothèse nulle Ho conditionne le calcul de la statistique X qui est une variable aléatoire, elle peut être simple comme la moyenne ou la variance ou être une fonction complexe de certains de ces paramètres ou de plusieurs autres. Une bonne statistique doit posséder trois propriétés . 1)- se comporter differemment selon que c’est Ho qui est vraie et Hl qui est fausse et le contraire ; 2)- sa loi de probabilité lorsque Ho est vérifiée doit être connue et calculable , 3)- des tables procurant cette loi doivent être disponibles.

Région critique : ou appelée aussi zone de rejet, est Pensemble des valeurs de la statistique X qui conduisent au rejet de l’hypothèse nulle. • Réglon complémentalre : c’est la zone d’acceptation • Valeur critique : c’est la valeur qui constitue la borne de la zone e rejet de l’hypothèse nulle Ho, dans le cas d’un test unilatéral, il existe une seule valeur critique Xc, dans le cas d’un test bilatéral, il en existe deux, Xcl et Xc2.

Vl- Étapes de l’élaboration d’un test statistique de signification : Dans les ouvrages de statistique, la démarche pour effectuer un test statistique de slgnlfication à partir d’un échantillon est généralement la suivante : 1. Formuler les hypothèses (Ho et Hl) 2. Choisir le seuil de signification d suivante : 2. Choisir le seuil de signification du test 3. Déterminer l’échantillon 4. our les tests paramétriques, déterminer la loi de probabilité correspondant à la distribution. 5. Déterminer une statistique X 6. Calculer les valeurs critiques 7.

Etablir les règles de décisions 8. Calculer la statistique et déterminer où elle se situe 9. Prendre la décision de rejeter ou non l’hypothèse nulle La tâche est facilitée aux chercheurs grâce aux logiciels. SECTION 2 : MISE EN ŒUVRE DES TESTS PARAMETRIQUES l- Tests sur les moyennes : Tests Questions de recherche 1 . 1 comparaison d’une moyenne d’échantillon à une valeur de référence quand la variance de la population est connue ne moyenne m calculée sur un échantillon issu d’une population de variance connue diffère-t-elle significativement d’une moyenne hypothétique ? . 2 comparaison d’une moyenne d’échantillon m à une valeur de référence quand la variance de la population est inconnue de variance inconnue diffère-t-elle significativement d’une moyenne hypothétique ? 1. 3 comparaison de la différence de deux moyennes à une valeur donnée quand les variances sont connues la différence entre les moyennes de deux populations de variances connues est-elle si nificativement différente d’une valeur donnée ? PAGF s OF eux populations de même variance inconnue est-elle significativement différente d’une valeur donnée ? . 5 comparaison de deux moyennes dont les variances sont inconnues et inégales Les deux moyennes de deux populations de variances inconnues sont-elles significativement différentes l’une de l’autre ? 1. 6 comparaison de k moyennes (analyse de la variance) k moyennes observees sur k échantillons diffèrent-elles significativement les unes des autres ? 1 . 7 comparaison de k moyennes pk (comparaisons deux à deux) Même question de rechercher 1. 8 comparaison de k moyennes pk (analyse de la covariance)

Même question de recherche. 1. 9 comparaison de deux séries de mesures (le test P de Hotelling) les profils moyens de deux séries de k mesures et observées sur deux échantillons diffèrent-ils significativement Hun de l’autre ? ll- Tests sur les proportions . 2. 1 Comparaison d’une proportion ou pourcentage p à une valeur de référence Tio (test binomial) une proportion p calculée sur un échantillon diffère-t-elle significativement d’une proportion hypothétique ? 2. Comparaison de deux proportions ou pourcentages p, et pa (grands échantillons) deux proportions ou pourcentages observés sur deux ?chantillons diffèrent-ils significativement l’un de l’autre ? 2. 3 Comparaison de k proportions ou pourcentages pk (grands échantillons) plusieurs proportions ou pourcenta es observés sur k échantillons diffèrent-ils si nt les uns des autres ? PAGF OF 3. 1 Comparaison d’une variance 02 à une valeur de référence 020 une variance calculée sur un échantillon diffère-t-elle Slgniflcativement d’une variance hypothétique ? . 2 Comparaison de deux variances les variances de deux populations sont-elles significativement différentes l’une de l’autre ? 3. 3 Test de Barlett 4. Test sur les corrélations : 4. 1 Comparaison d’un coefficient de corrélation linéaire r à zéro Un coefficient de corrélation linéaire r est-il significatif ? 4. 2 Comparaison d’un coefficient de corrélation linéaire r à une valeur de réference Un coefficient de corrélation linéaire calculé sur un échantillon diffère-t-il significativement d’une valeur hypothétique ? 4. Comparaison de deux coefficients de corrélation linéalre Deux coefficients de corrélation linéaire sont-ils significativement différents l’un de l’autre ? 5. Tests sur les coefficients de régression : . 1 Comparaison d’un coefficient de régression linéaire à zéro l_Jn coefficient de régresslon linéaire b entre deux variables est-il significatif ? 5. 2 Comparaison d’un coefficient de régression linéaire Un coefficient de régression linéaire entre deux variables est-il significativement différent d’une valeur de référence ? . 3 Comparaison de deux régression linéaire dans PAGF 7 OF SECTION 3 : MISE EN ŒUVRE DES TESTS NON PARAMÉTRIQUES Les tests non paramétriques portent sur des statistiques construites à partir des observations et qui ne dépendent pas de a distribution de la population correspondante. Ils présentent plusieurs avantages . Applicables aux petits échantillons ; Applicables à divers types de données ; Applicables à des données incomplètes ou imprécises. 1 . Tests sur une variable dans plusieurs échantillons 1 . Comparaison d’une distribution empirique à une distribution théorique La distribution empirique observée sur un échantillon est-elle significativement différente d’une distribution de référence ? 1. 2 Comparaison des distributions d’une variable X dans deux populations A et B : test de Kolmogorov-Smirnov Une variable X est-elle identiquement distribuée dans deux populations A et B ? 1. 3 Test U de Mann et Whitney 1. 4 Test de Wilcoxon 1. 5 Test du nombre de suites homogènes 1. 6 Test de KruskaI-WalIis ou analyse de variance par les rangs 1. 7 Comparaison de deux proportions ou pourcentages (petits 2.

Tests sur plusieurs variables dans un échantillon ou des échantillons appariés 8 OF variables mesurées sur deux échantillons appariés : test du signe Deux variables X et Y mesurables sur deux échantillons appariés A et B sont-elles identiquement distribuées ? 2. 3 Test de Wilcoxon signé . 4 Test de corrélation des rangs de Kendall 2. 5 Test de corrélation des rangs de Spearman 2. 6 Comparaison de k classements k classements effectués sur n éléments sont-ils identiques ? SECTION 4 : FAUT-IL BRULER LES TESTS STATISTIQUES DE SIGNIFICATION ?

Les tests statistiques d’amélioration ont été, depuis leur introduction et malgré le support de certains auteurs, objet ? plusieurs critiques. Les reproches faits à ces tests concernent leurs défauts intrinsèques et les erreurs liées à leur usage. 1. Les principales critiques 1. 1 Une hypothèse vraiment nulle L’utilité de leur hypothèse nulle ponctuelle, qui attribue au paramètre une valeur precise et non un intervalle, est remise en cause à cause du risque d’erreur toujours présent, car même si la différence est insignifiante, elle augmente en fonction de la taille de l’échantillon.

Si on part d’une population plutôt que d’un échantillon, Phypothèse nulle sera dans ce cas fausse, l’information apportée par le test sera donc quasi-nulle et par conséquent le test sera inutile. 1. 2 Une démarche anti-scientifique : L’hypothèse nulle mise en relief par les tests statistiques e signification affaiblit la démarche scientifique car elle est généralement mise en avant au détriment de [‘hypothèse de recherche qui devient alors écartée et, dans le cas de tests non signi l’hypothèse de recherche qui devient alors écartée et, dans le cas de tests non significatifs, non examinée. . 3 Hypothèse nulle, hypothèse alternative et hypothèse de recherche : Lorsque ‘hypothèse de recherche donne une valeur précise au paramètre, on peut l’identifier soit à l’hypothèse alternative soit ? – Dans le premier cas : si on choisit un grand échantillon on obtiendra un résultat significatif. Dans le deuxieme cas : s’il s’agit d’un grand échantillon, cela aboutira au rejet de l’hypothèse alors que celle-ci peut bien être la meilleure approximation de la réalité, et s’il s’agit d’un petit échantillon, il y aura une corroboration facile et artificielle de l’hypothèse de recherche. Probabilité de l’hypothèse ou probabilité des données : Les tests statistiques de signification donnent une probabilité des données observées conditionnellement à la véracité de l’hypothèse nulle, mais ce qui intéresse le chercheur c’est la probabilité des hypothèses nulles conditionnellement aux onnées observées. 1. 5 a est arbitraire, valeur p est ambiguë : Le seuil de signiflcation retenu est arbitraire et pourtant il décide du rejet ou du non rejet des hypothèses.

La valeur p dépend entièrement de la taille de l’échantillon et pourtant elle décide du degré de réfutation de l’hypothèse. 1. 6 L’importance de l’effet Les tests statistiques de signification se focalisent sur la significativité statistique et négligent l’importance de l’effet qui intéresse le chercheur en premier lieu. 2. Des erreurs fréquentes à Pusage 2. 1 Le renversement des condltions : La première erreur des tests statistiqu