Cours - Le test du khi deux

December 29, 2018 | Author: ventdest | Category: Scientific Method, Probability, Science, Mathematical Analysis, Scientific Modeling
Share Embed Donate


Short Description

Download Cours - Le test du khi deux...

Description

COURS N ° 7 : Le test du Khi-deux

Soit un tableau de contingence d'effectifs observés avec deux variables qualitatives (Sexe et Tabac) qui se distribuent ainsi : I) Tableau d'effectifs observés :

Hommes Femmes

Fumeurs Non fumeurs 17 8 25 9 14 23 26 22 48

 Nous pouvons identifier ces différentes valeurs par des symboles (a, b, c, d), symboles ayant leurs homologues correspondants correspondants (a', b', c', d') dans dans le tableau des effectifs théoriques que nous calculerons ultérieurement : Xa a c C1

Ya Yb

Xb b d C2

L1 L2 N

Ya Yb

Xa a’ c’ C1

Xb b’ d’ C2

L1 L2 N

L1 est la somme des effectifs marginaux pour la première ligne, L2 est la somme des effectifs marginaux pour la deuxième ligne, C1 est la somme des effectifs marginaux pour la première colonne, C2 est la somme des effectifs marginaux pour la deuxième colonne.  N correspond à l'ensemble l'ensemble des effectifs de de l'enquête. Calcul des valeurs théoriques de chaque case (a', b', c' et d') : a' : C1 x L1  N

b' = C2 x L1  N

c' = C1 x L2  N

d' = C2 x L2  N

Dans le tableau des effectifs théoriques, il faut conserver des chiffres décimaux. Écrivons le tableau des effectifs théoriques : II) Tableau d'effectifs théoriques :

Fumeurs Non fumeurs Hommes 13.54 11.46 25 Femmes 12.46 10.54 23 26 22 48 On notera le fait que les valeurs marginales (L1, L2, C1 et C2) sont identiques pour les deux tableaux (observés et théoriques). Formule du X² :

Somme (Observés - Théoriques)² Théoriques

 Attention : On ne divise chaque qu'après avoir élevé chaque différence au carré.

cad : X² =

(a - a')² (b - b')² (c - c')² (d - d')²  +  +  + a'  b' c' d' 1

X² =

(17 - 13,54)² (8 - 11,46)² (9 - 12,46)² (14 - 10,54)²  +  + + 13,54 11,46 12,46 10,54

d'où un khi-deux ==> X² = 4.02

(avec une probabilité de p = 0.0415)

d'un tableau à 4 cases, cases, tous les effectifs effectifs théoriques doivent Conditions de validité : Dans le cas d'un être supérieurs ou égaux à 5. Degrés de liberté :d.d.l. = (nombre de lignes - 1) x (nombre de colonnes - 1) ici, d.d.l. = (2 - 1) x (2 - 1) = 1 On lit sur la table du X² la valeur attendue pour 1 d.d.l. au seuil de 0.05 (cad avec un risque de 5 chances sur 100 de se tromper. La valeur lue est 3.841. Notre X² étant > à 3.841 (4.02 > 3.841), nous pouvons conclure qu'il existe une liaison statistiquement significative entre ces deux variables. III) Tableau des signes :   Lorsque la liaison est statistiquement significative, le tableau des

signes permet de déterminer le sens de cette liaison entre les l es 2 variables. Pour chaque case, on note le signe de la différence entre l’effectif observé moins l’effectif théorique. Par exemple, pour la case a, nous lisons : 17 - 13.54 = + 3.46. Cela signifie que les hommes fument davantage que les femmes). Fume Fumeur urss Non Non fum fumeu eurs rs Hommes + Femmes + Remarque : Si cette lecture est ici quasiment directe (intuitive) pour un tableau à 4 cases, par contre, elle est plus complexe pour un tableau à plus de 4 cases. Le tableau des signes est alors nécessaire  N.B. : Il existe 3 signes possibles : + , - et 0 (lorsque les chiffres observés et attendus d'une même case sont identiques).  Remarques importantes importantes :

1) On ne calcule jamais un X² avec les pourcentages mais toujours avec des effectifs réels observés. En effet, des pourcentages "gonfleraient" des effectifs de départ inférieurs à 100 (et donc "gonfleraient" le khi-deux) ou diminueraient des effectifs supérieurs à 100 (et diminueraient le khi-deux). 2) Les effectifs influent directement sur la valeur du X². Lorsque les effectifs doublent, la valeur du khi-deux double. Si l'on multipliait par 2 les effectifs de l'exemple de départ (34, 16, 18 et 28 au lieu li eu de 17, 8, 9 et 14), le khi-deux serait de {4.02 * 2}, soit 8.04 (avec une probabilité de p = 0.0046). ===> Un khi-deux non significatif ne signifie surtout pas  que les deux variables sont indépendantes car dans le cas d'un X² non significatif, avec des effectifs plus importants, on aurait peut-être pu observer un X² significatif. On se contentera de conclure qu'il n'y a pas de liaison statistiquement significative.

2

3) Attention à l'utilisation. Le X² donne la probabilité pour que la distribution observée soit liée au hasard. Il n'indique pas directement la force de la liaison. Il existe des tests spécifiques  permettant de mesure mesure la force de la liaison. La probabilité n'est pas un indicateur indicateur de cette force. Les difficultés d'interprétation d'un khi-deux à plus de 4 cases : n.b.: L'exemple est tiré d'une enquête réelle portant sur l’horoscope :

Question n°1 n°1 : "en général, vous vous fiez-vous à vote intuition ?" [ OUI ; NON ; non non réponse ]. Question n°2 : "quel est votre diplôme le plus élevé ? [ aucun – certificat d’études – CAP/BEP – Bac et + ] Vous fiez-vous à votre intuition ==> Diplôme Aucun Certificat d'études CAP/BEP BAC et plus

OUI

NON

non réponses

14 14 36 14

15 9 14 6

15 31 127 64

78

44

237

44 54 177 84 359

1er commentaire : ce tableau est totalement hétérogène, un khi-deux n'aurait aucun sens car il mélangerait des non réponses avec des réponses effectives. Avant d'éliminer les non réponses, il convient donc de voir si elles sont liées li ées au diplôme. Ainsi, on regroupe les réponses oui et non e ton les oppose aux non réponses. D'où le tableau suivant : Aucun Certificat d'études CAP/BEP BAC et plus

Réponses ( oui ou non )

non réponses

29 23

+ +

15 31

-

50 20

-

127 64

+ +

Le khi-deux de ce tableau et de 28,24 (pour un khi-deux attendu attendu de 7,81 avec ddl =3). Cela signifie que plus les gens ont de diplômes, moins ils avouent qu’ils se fient à leur intuition. 2ème commentaire : Une fois analysées ces non-réponses, nous pouvons les exclure. Cela donne : OUI NON Aucun Certificat d'études CAP/BEP BAC et plus

14 14

15 9

29 23

36 14

14 6

78

44

50 20 122

Le khi-deux de ce tableau tableau est de 4,91 (pour un khi-deux khi-deux attendu de 7,81 avec ddl =3). donc 4,91 < 7,81. Pour l’instant, on ne peut rien ri en dire.

3

Celà ne veut pas dire pour autant que nous sommes dans une impasse car il est possible de regrouper les niveaux de diplômes. Trois coupures peuvent être effectuées : a) Aucun diplôme + Certificat d'études / CAP-BEP + Bac et plus : OUI aucun diplôme + certificat d'études CAP/BEP + Bac et plus

NON

28 50 +

24 + 20 -

78

44

52 70 122

Khi-deux = 4,00 donc > 3,841 Cela signifie qu'en regroupant ainsi nous pouvons conclure que les gens les plus diplômés se fient davantage à leur intuition intuiti on que les gens les moins diplômés.  b) Aucun diplôme / Certificat Certificat d'études + CAP-BEP + Bac et plus : OUI aucun diplôme certificat certificat d'études + CAP/BEP + Bac et plus

NON

14 64 +

15 + 29 -

78

44

29 93 122

Khi-deux = 4,05 avec ddl = 1, donc > 3,841 Même interprétation que ci-dessus : les gens les plus diplômés se fient davantage à leur intuition que les gens les moins diplômés.  b) Aucun diplôme + Certificat d'études + CAP-BEP CAP-BEP / Bac et plus : OUI

NON

64 14

38 6

78

44

aucun diplôme + certificat d'études + CAP/BEP Bac et plus

102 20 122

Khi-deux = 0,38 avec ddl ddl = 1, donc < 3,841 (je ne peux rien dire) Conclusion : dans le cas d'un khi-deux non significatif, il i l est toujours intéressant d'essayer de

regrouper des modalités si cela a un sens bien évidemment. ***

4

Table du khi-deux ( χ  ² ) pour vale valeur ur de vale valeur ur de vale valeur ur de vale valeur ur de vale valeur ur de vale valeur ur de vale valeur ur de vale valeur ur de d.d.l.  X à 0,90 X à 0,30 X à 0,20 X à 0,10 X à 0,05 X à 0,02 X à 0,01 X à 0,50 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

0,0158 0,211 0,584 1,064 1,610 2,204 2,833 3,490 4,168 4,865 5,578 6,304 7,042 7,790 8,547 9,312 10,085 10,865 11,651 12,443 13,240 14,041 14,848 15,659 16,473 17,292 18,114 18,939 19,768 20,599

0,455 1,386 2,366 3,357 4,351 5,348 6,346 7,344 8,343 9,342 10,341 11,340 12,340 13,339 14,339 15,338 16,338 17,338 18,338 19,337 20,337 21,337 22,337 23,337 24,337 25,336 26,336 27,336 28,336 29,336

1,074 2,408 3,665 4,878 6,064 7,231 8,383 9,524 10,656 11,781 12,899 14,011 15,119 16,222 17,322 18,418 19,511 20,601 21,689 22,775 23,858 24,939 26,018 27,096 28,172 29,246 30,319 31,391 32,461 33,530

1,642 3,219 4,642 5,989 7,289 8,558 9,803 11,030 12,242 13,442 14,631 14,631 15,812 15,812 16,985 16,985 18,151 18,151 19,311 19,311 20,465 20,465 21,615 22,760 23,900 25,038 26,171 27,301 28,429 29,553 30,675 31,795 32,912 34,027 35,139 36,250

Quand le nombre de degrés de liberté est élevé , 2 (d.d.l.) - 1 avec une variance égale à 1.

2,706 4,605 6,251 7,779 9,236 10,645 12,017 13,362 14,684 15,987 17,275 18,549 19,812 21,064 22,307 23,542 24,769 25,989 27,204 28,412 29,615 30,813 32,007 33,196 34,382 35,563 36,741 37,916 39,087 40,256

3,841 5,991 7,815 9,488 11,070 12,592 14,067 15,507 16,919 18,307 19,675 21,026 22,362 23,685 24,996 26,296 27,587 28,869 30,144 31,410 32,671 33,924 35,172 36,415 37,652 38,885 40,113 41,337 42,557 43,773

5,412 7,824 9,837 11,668 13,388 15,033 16,622 18,168 19,679 21,161 22,618 24,054 25,472 26,873 28,259 29,633 30,995 32,346 33,687 35,020 36,343 37,659 38,968 40,270 41,566 42,856 44,140 45,419 46,693 47,962

6,635 9,210 11,345 13,277 15,086 16,812 18,475 20,090 21,666 23,209 24,725 26,217 27,688 29,141 30,578 32,000 33,409 34,805 36,191 37,566 38,932 40,289 41,638 42,980 44,314 45,642 46,963 48,278 49,588 50,892

vale valeur ur de X à 0,001

10,827 13,815 16,266 18,467 20,515 22,457 24,322 26,125 26,125 27,877 29,588 31,264 32,909 34,528 36,123 37,697 39,252 40,790 42,312 43,820 45,315 46,797 48,268 49,728 51,179 52,620 54,052 55,476 56,893 58,302 59,703

2  χ  ² est à peu près distribué normalement autour de

5

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF