Signification de la différence entre les moyens

Après avoir lu cet article, vous découvrirez l’importance de la différence entre les moyens.

Supposons que nous désirions vérifier si les capacités mécaniques des garçons de 12 ans et des filles de 12 ans des écoles publiques sont différentes. Comme la population de ces garçons et filles est trop importante, nous prenons un échantillon aléatoire de ces garçons et filles, nous leur faisons passer un test et nous calculons les moyennes des garçons et des filles séparément.

Supposons que le score moyen de ces garçons soit de 50 et celui de ces filles de 45. Nous marquons une différence de 5 points entre les moyennes des garçons et des filles. Il se peut qu’une telle différence soit due aux fluctuations de l’échantillonnage.

Si nous tirons deux autres échantillons, l'un de la population de garçons de 12 ans et l'autre de la population de filles de 12 ans, nous trouverons une différence entre les moyennes si nous continuons à le répéter pendant un grand nombre de fois en tirant des échantillons de Pour les garçons de 12 ans et les filles de 12 ans, nous constaterons que la différence entre deux ensembles de moyens variera.

Parfois, cette différence sera positive, parfois négative et parfois nulle. La distribution de ces différences formera une distribution normale autour d'une différence de zéro. Le SD de cette distribution s'appelle l'erreur standard de différence entre les moyennes.

Pour cela, les symboles suivants sont utilisés:

SEM 1 - M 2 ou SE D ou σ DM

Deux situations se présentent en ce qui concerne les différences entre les moyennes:

(a) Ceux dans lesquels les moyens sont non corrélés / indépendants, et

(b) Ceux dans lesquels les moyennes sont corrélées.

(a) SE de la différence entre deux moyens indépendants:

Les moyennes sont non corrélées ou indépendantes lorsqu'elles sont calculées à partir d'échantillons différents ou de tests non corrélés administrés sur le même échantillon.

Dans ce cas, deux situations peuvent se présenter:

(i) Quand les moyens sont non corrélés ou indépendants et que les échantillons sont grands, et

(ii) Lorsque les moyens sont non corrélés ou indépendants et que les échantillons sont petits.

(i) SE de la différence (SE D ) lorsque les moyennes sont non corrélées ou indépendantes et que les échantillons sont grands:

Dans cette situation, la SE D peut être calculée en utilisant la formule:

SE D = erreur type de la différence de moyennes

SEm 1 = erreur type de la moyenne du premier échantillon

SEm 2 = erreur type de la moyenne du deuxième échantillon

Exemple 1:

Deux groupes, l’un composé de 114 hommes et l’autre de 175 femmes. Les scores moyens des hommes et des femmes dans un test de construction de mots étaient respectivement de 19, 7 et 21, 0 et les écarts-types de ces deux groupes étaient de 6, 08 et 4, 89 respectivement. Vérifier si la différence observée de 1, 3 en faveur des femmes est significative au niveau de 0, 05 et au niveau de 0, 01.

Solution:

Il s'agit d'un test bilatéral → La direction n'est pas claire.

Pour tester la signification d'une différence obtenue entre deux moyennes d'échantillon, nous pouvons suivre les étapes suivantes:

Étape 1:

Dans un premier temps, nous devons préciser si nous devons effectuer un test bilatéral ou un test unilatéral. Ici, nous voulons tester si la différence est significative. Il s’agit donc d’un test bilatéral.

Étape 2:

Nous posons l'hypothèse nulle (H 0 ) selon laquelle il n'y a pas de différence entre les moyennes de population des hommes et des femmes dans la construction des mots. Nous supposons que la différence entre les moyennes de population de deux groupes est nulle, c’est-à-dire H o : D = 0.

Étape 3:

Ensuite, nous devons décider du niveau de signification du test. Dans notre exemple, nous devons tester la différence aux niveaux de signification de 0, 05 et 0, 01.

Étape 4:

Dans cette étape, nous devons calculer l’erreur type de la différence entre les moyennes, c’est-à-dire SE D.

Comme notre exemple est constitué de moyennes et de grands échantillons non corrélés, nous devons appliquer la formule suivante pour calculer la SE D :

Étape 5:

Après avoir calculé la valeur de SE D, nous devons exprimer la différence de moyennes d'échantillon en termes de SE D. Comme notre exemple est une facilité de grands échantillons, nous devrons calculer Z où,

Étape 6:

En référence à la nature du test dans notre exemple, nous devons déterminer la valeur critique pour Z à partir du tableau A, à la fois à 0, 05 et au niveau de signification 0, 01.

D'après le tableau A, Z.05 = 1, 96 et Z.01 = 2, 58. (Cela signifie que la valeur de Z pour être significative au niveau 0, 05 ou moins doit être de 1, 96 ou plus).

Maintenant 1, 91 <1, 96, la différence marquée n’est pas significative au niveau 0, 05 (c’est-à-dire que H 0 est accepté).

Interprétation:

Étant donné que l'échantillon est volumineux, nous pouvons supposer une distribution normale de Z. Le Z obtenu n'atteint tout simplement pas le niveau de signification de 0, 05, qui est de 1, 96 pour les grands échantillons.

Par conséquent, nous ne rejetterions pas l'hypothèse nulle et dirions que la différence obtenue n'est pas significative. Il se peut qu’il y ait une différence, mais nous n’en avons pas une assurance suffisante.

Une conclusion plus pratique serait que nous ne disposons pas de preuves suffisantes de la moindre différence de sexe dans la capacité à construire des mots, du moins dans le type de population échantillonnée.

Exemple 2:

Les données sur les performances des garçons et des filles sont présentées comme suit:

Testez si les garçons ou les filles ont de meilleures performances et si la différence de 1, 0 en faveur des garçons est significative au niveau 0, 05. Si nous acceptons que la différence soit significative, quelle serait l'erreur de type 1?

Solution:

1, 85 <1, 96 (Z 0, 05 = 1, 96). Par conséquent, H 0 est accepté et la différence marquée de 1, 0 en faveur des garçons n’est pas significative au niveau 0, 05.

Si nous acceptons que la différence soit significative, nous commettons une erreur de type 1. En lisant le tableau A, nous constatons que ± 1, 85 Z comprend 93, 56% des cas. Par conséquent, en acceptant la différence marquée comme étant significative, nous avons tort de 6, 44% (100 - 93, 56); l’erreur de type 1 est donc 0644.

Exemple 3:

La classe A a été enseignée dans un établissement d’entraînement intensif, tandis que la classe B a enseigné dans une classe normale. À la fin de l'année scolaire, les classes A et B étaient en moyenne de 48 et 43 avec un écart-type de 6 et 7, 40 respectivement.

Vérifiez si l'entraînement intensif a permis à la classe A de gagner en moyenne. La classe A comprend 60 élèves et la classe B 80.

. . . 4.42 est supérieur à Z.01 ou 2.33. Alors H o est rejeté. La différence marquée est significative au niveau .01.

Nous concluons donc que l’entraînement intensif a permis d’obtenir de bons scores moyens de la classe A.

ii) le SE de la différence (SE D ) lorsque les moyennes ne sont pas corrélées ou indépendantes et que les échantillons sont petits:

Lorsque les N de deux échantillons indépendants sont petits, le SE de la différence de deux moyennes peut être calculé en utilisant les deux formules suivantes:

Quand les scores sont donnés:

dans laquelle x 1 = X 1 - M 1 (c'est-à-dire l'écart des scores du premier échantillon par rapport à la moyenne du premier échantillon).

X 2 = X 2 - M 2 (c.-à-d. Écart des scores du deuxième échantillon par rapport à leur moyenne)

Lorsque les moyennes et les SD des deux échantillons sont donnés:

Exemple 4:

Un test d'intérêt est administré à 6 garçons d'une classe de formation professionnelle et à 10 garçons d'une classe de latin. La différence moyenne entre les deux groupes est-elle significative au niveau 0, 05?


Table d'entrée:

D nous trouvons que avec df = 14, la valeur critique de t au niveau 0, 05 est de 2, 14 et au niveau 0, 01 de 2, 98. La valeur calculée de 1, 78 est inférieure à 2, 14 au niveau de signification de 0, 05.

Par conséquent, H 0 est accepté. Nous concluons qu'il n'y a pas de différence significative entre les scores moyens de test d'intérêt de deux groupes de garçons.

Exemple 5:

Un inventaire de la personnalité est administré dans une école privée à 8 garçons dont le comportement est exemplaire et à 5 garçons dont le dossier est très médiocre.

Les données sont données ci-dessous:

La différence entre les moyennes de groupe est-elle significative au niveau 0, 05? au niveau 01?

En entrant dans le tableau D, nous constatons qu'avec df 11, la valeur critique de t au niveau 0, 05 est de 2, 20 et au niveau 0, 01 de 3, 11. La valeur calculée de 2, 28 est juste supérieure à 2, 20 mais inférieure à 3, 11.

Nous concluons que la différence entre les moyennes de groupe est significative au niveau de 0, 05 mais non significative au niveau de 0, 01.

Exemple 6:

Lors d’un test de raisonnement arithmétique, 11 garçons de 10 ans et 6 filles de 10 ans ont obtenu les résultats suivants:

La différence moyenne de 2, 50 est-elle significative au niveau 0, 05?

Solution:

En appliquant la formule (43 b).

En entrant dans le tableau D, nous constatons qu'avec df 15 la valeur critique de t au niveau 0, 05 est de 2, 13. La valeur obtenue de 1, 01 est inférieure à 2, 13. La différence marquée de 2, 50 n’est donc pas significative au niveau 0, 05.

(b) SE de la différence entre deux moyennes corrélées:

i) La méthode du groupe unique:

Nous avons déjà abordé le problème de déterminer si la différence entre deux moyens indépendants est significative.

Nous nous intéressons maintenant à la signification de la différence entre les moyennes corrélées. Les moyennes corrélées sont obtenues à partir du même test administré au même groupe à deux reprises.

Supposons que nous ayons administré un test à un groupe d'enfants et que nous devions répéter le test deux semaines plus tard. Nous souhaitons mesurer l’effet de la pratique ou de la formation spéciale sur le deuxième ensemble de scores. Afin de déterminer l’importance de la différence entre les moyennes obtenues lors des tests initial et final.

Nous devons utiliser la formule:

dans lequel σ M1 et σ M2 = SE des moyens de test initial et final

r 12 = Coefficient de corrélation entre les scores obtenus aux tests initial et final.

Exemple 7:

Au début de l'année scolaire, le score moyen de 81 élèves à un test de rendement en lecture était de 35 avec un écart-type de 5.

À la fin de la session, le score moyen sur une forme équivalente du même test était de 38 avec un écart-type de 4. La corrélation entre les scores obtenus lors des tests initial et final était de 0, 53. La classe a-t-elle fait des progrès significatifs en lecture au cours de l'année?

Nous pouvons compiler nos données comme suit:

(Test au niveau de signification .01)

Solution:

Comme nous ne nous intéressons qu’au progrès ou au gain, il s’agit d’un test unilatéral.

En appliquant la formule:

Puisqu'il y a 81 étudiants, il y a 81 paires de scores et 81 différences, de sorte que le df devient 81 - 1 ou 80. D'après le tableau D, le t pour 80 df est de 2, 38 au niveau 0, 02. (Le tableau donne 2, 38 pour l’essai bilatéral, qui est 0, 01 pour l’essai unilatéral).

Le t obtenu de 6.12 est de loin supérieur à 2.38. D'où la différence est significative. Il semble certain que la classe a beaucoup progressé en lecture au cours de l'année scolaire.

ii) Méthode de la différence:

Lorsque les groupes sont petits, nous utilisons la «méthode de la différence» pour des calculs faciles et rapides.

Exemple 8:

Dix sujets sont soumis à 5 essais successifs sur un test de chiffre-symbole dont seuls les scores des essais 1 et 5 sont indiqués. Le gain moyen du premier au dernier essai est-il significatif?

La colonne de différence est trouvée à partir de la différence entre les paires de scores. La différence moyenne est de 4 et le SD autour de cette moyenne (SD D )

Calcul du SE de la différence moyenne:

Dans lequel SE MD = erreur type de la différence moyenne

SD = écart type autour de la différence moyenne.

Le t obtenu de 5, 26> 2, 82. Notre t de 5, 26 est beaucoup plus grand que le niveau 0, 01 de 2, 82 et il ne fait guère de doute que le gain des essais 1 à 5 est significatif.

(iii) La méthode des groupes équivalents:

Matching par paires:

Parfois, il peut être nécessaire de comparer les performances moyennes de deux groupes équivalents appariés par paires.

Dans la méthode des groupes équivalents, la mise en correspondance est effectuée initialement par paires afin que chaque personne du premier groupe ait une correspondance dans le second groupe.

Dans ce cas, le nombre de personnes dans les deux groupes est le même, c’est-à-dire que n 1 = n 2 .

Ici, nous pouvons calculer SE D en utilisant la formule:

SE M1 et SE M2 = Erreurs-types des scores finaux du groupe I et du groupe II, respectivement.

r 12 = Coefficient de corrélation entre les scores finaux du groupe I et du groupe II.

Exemple 9:

Deux groupes ont été formés sur la base des scores obtenus par les étudiants lors d’un test d’intelligence. L'un des groupes (groupe expérimental) a reçu des instructions supplémentaires pendant un mois et l'autre groupe (groupe contrôlé) n'a pas reçu d'instructions de ce type.

Après un mois, les deux groupes ont subi le même test et les données relatives aux scores finaux sont données ci-dessous:

Interprétation:

En entrant dans le tableau de t (tableau D) avec df 71, la valeur critique de t au niveau 0, 05 dans le cas d’un test unilatéral est de 1, 67. Le t obtenu de 2, 34> 1, 67. La différence est donc significative au niveau 0, 05.

. . . La moyenne a augmenté en raison d'instructions supplémentaires.

Avec df de 71, la valeur critique de t au niveau .01 en cas de test unilatéral est de 2, 38. On obtient ainsi t de 2, 34 <2, 38. Par conséquent, la différence n’est pas significative au niveau .01.

Erreur standard de la différence entre d’autres statistiques:

(i) SE de la différence entre les médianes non corrigées:

On peut trouver la signification de la différence entre deux médianes obtenues à partir d'échantillons indépendants:

ii) SE de la différence entre les écarts-types: