Tendance centrale en statistique

Après avoir lu cet article, vous apprendrez: - 1. La signification de la tendance centrale 2. Les utilisations de la tendance centrale 3. Les mesures.

Signification de tendance centrale:

Les mesures de la tendance centrale sont une combinaison de deux mots, à savoir "mesure" et "tendance centrale". Mesure signifie méthodes et tendance centrale signifie valeur moyenne de toute série statistique. On peut donc dire que tendance centrale désigne les méthodes permettant de déterminer la valeur centrale ou la valeur moyenne d’une série statistique d’informations quantitatives.

JP Guilford a souligné qu ' «une moyenne est la valeur centrale d'un groupe d'observations ou d'individus».

Selon Clark, «Average est une tentative de trouver un seul chiffre pour décrire l’ensemble des chiffres».

Comme le dit AE Waugh: «Une moyenne est une valeur unique sélectionnée dans un groupe de valeurs pour les représenter de la même manière - une valeur qui est supposée représenter l'ensemble du groupe dont elle fait partie, comme typique de toutes les valeurs. dans le groupe."

On peut donc dire qu'une tendance moyenne ou centrale est un chiffre unique qui est calculé à partir d'une distribution donnée pour donner une idée centrale de la série entière. La valeur de la moyenne est comprise entre les valeurs maximale et minimale de la série.

Utilisations de la tendance centrale:

La tendance centrale est nécessaire pour les raisons suivantes:

1. Moyenne fournit une image globale de la série. Nous ne pouvons pas nous souvenir de tous les faits relatifs à un domaine d’enquête.

2. La valeur moyenne fournit une image claire du domaine à l'étude, à des fins d'orientation et de conclusion.

3. Il donne une description concise de la performance du groupe dans son ensemble et nous permet de comparer deux groupes ou plus en termes de performance typique.

Mesures de tendance centrale:

Il existe trois mesures de tendance centrale, telles que:

(1) La moyenne arithmétique.

(2) la médiane et

(3) Le mode.

(1) La moyenne (M):

Pour un homme ordinaire, la moyenne signifie la moyenne arithmétique. Il est le plus couramment utilisé pour sa simplicité, sa rigidité, etc.

Une moyenne arithmétique est définie comme le "quotient obtenu en divisant le total des valeurs d'une variable par le nombre total d'observations ou d'éléments".

II.E. Garett (1985 P) définit «La moyenne arithmétique, ou plus simplement la moyenne, est la somme des scores ou des mesures séparées divisée par leur nombre».

Méthodes de calcul de la moyenne:

Il existe plusieurs méthodes de calcul de la moyenne. Mais ici nous ne discuterons que de deux méthodes.

Ils sont comme suit:

1. Méthode directe ou méthode longue.

2. Méthode courte ou méthode supposée moyenne.

1. Méthode directe ou méthode longue:

Dans cette méthode, la moyenne est calculée directement à partir de la série donnée. Dans cette méthode, nous pouvons calculer la moyenne à partir des données non groupées et la formule de calcul de la moyenne à partir de données non groupées.

La formule pour calculer la moyenne à partir de données non groupées est la suivante:

À partir des données groupées, la moyenne est calculée à l'aide de la formule suivante:

Illustration:

Calculez la moyenne à partir des distributions de fréquence suivantes par méthode directe:

2. Méthode courte ou moyenne supposée:

C'est ce qu'on appelle la méthode de la moyenne supposée car au lieu de calculer la moyenne à partir des points médians, nous prenons la moyenne supposée pour déterminer la moyenne. Tout d'abord, nous «devinons» ou supposons une moyenne, puis nous appliquons une correction à cette valeur supposée afin de trouver la valeur exacte.

La formule permettant de connaître la moyenne dans la méthode de la moyenne supposée est donnée ci-dessous:

Ci-dessous sont discutées les étapes pour calculer la moyenne dans la méthode courte:

Étape 1:

Supposons que n'importe quel point médian de la distribution est moyen. Mais le meilleur plan est de prendre le point milieu d'un intervalle près du centre qui a la plus grande fréquence.

Étape 2:

Découvrez la x 'colonne, x' est l'écart entre le score et la moyenne supposée.

Ici, nous pouvons trouver x 'en utilisant la formule suivante:

Étape 3:

Découvrez la colonne fx . On le découvre en multipliant f colonne par x 'colonne.

Étape 4:

Découvrez ∑ f x. Ajoutez toutes les valeurs positives et négatives séparément. Puis trouve la somme algébrique qui est ∑ f x.

Étape 5:

Découvrez la moyenne en utilisant la formule 9.4.

Illustration:

Découvrez la moyenne de la distribution dans la méthode de la moyenne supposée.

Dans un test de mathématiques, les notes des 50 élèves ont été présentées dans la répartition suivante:

Nous avons pris ici 44, 5 le point médian de Ci 40-49 comme moyenne supposée. Maintenant, nous pouvons trouver le moyen en utilisant la formule — 8.4.

Moyenne combinée:

Les moyennes distinctes d'un certain nombre de séries différentes peuvent produire la moyenne arithmétique combinée de toutes les séries différentes lorsque le nombre d'éléments dans chacune de ces séries est donné. Ceci est calculé par la formule suivante lorsque le nombre de groupes est n.

Illustration:

Ci-dessous, la moyenne des élèves de la classe VI de 4 écoles. Quelle est la moyenne des élèves de la classe VI en général?

Nous pouvons trouver la moyenne combinée en appliquant la formule 9.5:

La moyenne de tous les élèves de la classe VI est donc de 55, 25.

Utilisations de moyenne:

Il existe certaines règles générales d'utilisation de la moyenne. Certaines de ces utilisations sont les suivantes:

1. La moyenne est le centre de gravité de la distribution et chaque score contribue à sa détermination lorsque la répartition des scores est symétrique-autour d'un point central.

2. La moyenne est plus stable que la médiane et le mode. Ainsi, lorsque la mesure de la tendance centrale ayant la plus grande stabilité est recherchée, la moyenne est utilisée.

3. La moyenne est utilisée pour calculer d'autres statistiques telles que l'écart type, le coefficient de corrélation, l'ANOVA, l'ANCOVA, etc.

Mérites de la moyenne:

1. La moyenne est définie de manière rigide de manière à éviter tout malentendu quant à sa signification et à sa nature.

2. C’est la tendance centrale la plus populaire car elle est facile à comprendre.

3. Il est facile à calculer.

4. Il inclut toutes les partitions d’une distribution.

5. Il n'est pas affecté par l'échantillonnage afin que le résultat soit fiable.

6. La moyenne est capable d'un traitement algébrique supplémentaire, de sorte que différentes statistiques telles que la dispersion, la corrélation, l'asymétrie exigent une moyenne pour le calcul.

Démérites de moyenne:

1. La moyenne est affectée par les scores extrêmes.

2. Parfois, la moyenne est une valeur qui n'est pas présente dans la série.

3. Parfois, cela donne des valeurs absurdes. Par exemple, il y a 41, 44 et 42 élèves dans les classes VIII, IX et X d'une école. Ainsi, la moyenne des étudiants par classe est de 42, 33. Ce n'est jamais possible.

4. Dans le cas d'intervalles de classe ouverts, il ne peut pas être calculé sans supposer la taille des classes d'extrémité ouverte.

(2) médiane:

La médiane est une autre mesure de la tendance centrale. Il s'agit d'une moyenne de position car sa valeur est déterminée par rapport à sa position dans la colonne de valeur d'une série. Dans le dictionnaire de statistiques Collins, il est défini comme «la valeur médiane d'une distribution, en dessous et au dessus de laquelle se trouvent des valeurs avec des fréquences totales égales ou des probabilités».

D. Patri (1996) définit la médiane «comme la valeur de l'élément central d'une série classée par ordre croissant ou décroissant. En tant que tel, il divise une série en deux parties égales. ”

La médiane peut être définie comme un point de la distribution en dessous duquel se situent cinquante pour cent des cas et au-dessus de cinquante pour cent des cas.

Calcul de la médiane à partir de données non groupées:

En cas de données non groupées, les scores sont classés par ordre de taille. Ensuite, on découvre le point médian, qui est la médiane. Dans ce processus, deux situations se présentent lors du calcul de la médiane: (a) N est impair (b) N est pair Nous allons d'abord examiner comment calculer la médiane (Mdn) lorsque N est impair.

Illustration:

Dans une classe, 9 élèves ont obtenu les notes suivantes lors d'un test de vocabulaire. Découvrez la médiane.

Marques - 6, 12, 8, 13, 7, 10, 7, 11, 9

Dans les données non groupées

Laissez-nous discuter de la façon de calculer Mdn lorsque N est pair.

Illustration:

Calculez le Mdn des données suivantes de 10 étudiants d'un test d'orthographe en anglais.

Marques = 7, 6, 8, 12, 7. 9, 11, 10, 13, 14

Pour résoudre le problème, nous devons organiser par ordre de taille

6, 7, 7, 8, 9, 10, 11, 12, 13, 14

Nous appliquons maintenant la formule 8.6;

Calcul de la médiane à partir de données groupées:

Nous savons que la médiane est un point qui distribue la distribution en deux moitiés égales.

La formule permettant de connaître la médiane à partir de données groupées se lit comme suit:

Où L = limite inférieure de la classe médiane.

La classe médiane est la classe dont la fréquence cumulée est supérieure à la valeur de N / 2, c'est-à-dire N / 2> cf (fréquence cumulée).

N / 2 = La moitié du nombre total de scores.

F = Fréquence cumulée de la classe interne inférieure à la classe médiane.

fm = fréquence de la classe médiane.

i = taille des internes de la classe.

Étapes pour calculer mdn à partir de données groupées:

Étape 1.

Calculer N / 2, soit 50% de la distribution.

Étape 2:

Calcule la fréquence cumulée de la distribution à partir de l'extrémité inférieure.

Étape 3:

Découvrez la classe mdn. La fréquence cumulée de l'intervalle de classe où N / 2> cf

Étape 4:

Découvrez F la fréquence cumulée sous la classe mdn.

Étape 5:

Découvrez f m . et mettre toutes les valeurs dans la formule.

Illustration:

Découvrez la médiane de la distribution.

Ci-dessous sont donnés les scores de 40 étudiants à un test de mathématiques:

L = 59, 5. Parce que le N / 2, c'est-à-dire 20, est inclus dans la fréquence cumulée de l'intervalle de classe 60—61 et les limites exactes du Ci = 59, 5—61, 5.

F = 17. La fréquence cumulée en dessous de la classe mdn.

fm = 7. La fréquence exacte de la classe mdn.

i = 2. Taille de l'intervalle de classe.

Maintenant, en mettant la valeur dans la formule

Mdn de la distribution est 60, 63.

Mdn peut également être calculé à partir de la limite supérieure de la distribution. La formule permettant de déterminer mdn en prenant des limites supérieures se lit comme suit.

Où U = La limite supérieure de la classe Mdn.

F 1 = fréquence cumulée de l'intervalle de classe au-dessus de la classe Mdn.

fm = fréquence de la classe médiane.

i = taille de l'intervalle de classe.

Pas:

En cas de calcul de Mdn à partir de la limite supérieure, la seule différence est que nous devons calculer la fréquence cumulée à partir de la limite supérieure.

Illustration:

U = 61, 5. Parce que la fréquence cumulée 23 inclut le N / 2, à savoir 20.

F = 16. Fréquence cumulée de l'intervalle de classe supérieur à la classe Mdn.

fm = 7 fréquence de la classe médiane.

i = 2

Le MDN est 60, 36.

Il existe également des cas exceptionnels de calcul de la médiane. Celles-ci se présentent lorsque la distribution de fréquence contient des lacunes et lorsque les intervalles de classe sont ouverts. Tout d’abord, nous discuterons des lacunes dans la distribution des fréquences.

Lorsqu'il y a des fréquences consécutives égales à 0 dans les intervalles de classe où Mdn est situé, la difficulté est de trouver la classe Mdn. Dans ce cas, nous ajoutons les intervalles de fréquence 0 aux intervalles de classe ci-dessus et inférieurs.

L'illustration suivante explique clairement le processus:

Illustration:

Découvrez le MDN de la série suivante:

L = 49, 5. La limite inférieure du Ci où le Ci est supérieur à N / 2.

F = 4 Cf du Ci en dessous de la classe Mdn

f m = 2. La fréquence de la classe Mdn.

i = 10. Taille du Ci

Mettre les valeurs dans la formule 8.7.

La médiane de la distribution est donc 57.

La deuxième situation est celle où il y a des intervalles de classe ouverts dans les deux extrémités. Dans ce cas, les extrémités ouvertes peuvent rester ouvertes ou être converties en classes spécifiques. Une illustration est donnée ci-dessous.

Illustration:

30 étudiants ont obtenu les notes suivantes à un test de mathématiques. 4 étudiants ont obtenu moins de 10 points. 6 étudiants ont obtenu des notes entre 10 et 20, 10 entre 20 et 30 ans, 8 étudiants entre 30 et 40 ans, 7 étudiants entre 40 et 50 ans et 3 étudiants âgés de plus de 50 ans.

L = 19, 5. Limite inférieure de la classe Mdn, à savoir 20-30.

F = 10. Cf du Ci en dessous de la classe Mdn.

fm = 10

i = 10

Donc, Mdn de la distribution est 28.5.

Utilisations de la médiane:

1. La médiane est utilisée lorsque le point médian exact de la distribution est requis ou lorsque le point de 50% est souhaité.

2. Lorsque les scores extrêmes affectent la moyenne à ce moment-là, la médiane est la meilleure mesure de la tendance centrale.

3. La médiane est utilisée lorsqu'il est nécessaire que certains scores affectent la tendance centrale, mais tout ce que l'on sait à leur sujet est qu'ils se situent au-dessus ou au-dessous de la médiane.

4. La médiane est utilisée lorsque les classes sont ouvertes ou que la taille de la cellule est différente.

Mérites de la médiane:

1. Il est facile à calculer et à comprendre.

2. Toutes les observations ne sont pas nécessaires à son calcul.

3. Les scores extrêmes n’affectent pas la médiane.

4. Il peut être déterminé à partir de séries ouvertes.

5. Il peut être déterminé à partir d’intervalles de classe différents.

Démérites de médiane:

1. Il n'est pas défini rigidement comme moyenne car sa valeur ne peut pas être calculée mais localisée.

2. Il ne comprend pas toutes les observations.

3. Il ne peut pas être traité algébriquement comme moyen.

4. Il faut disposer les scores ou les intervalles de classe en ordre croissant ou décroissant.

5. Parfois, il produit une valeur qui ne se trouve pas dans la série.

(3) Mode:

Le mode est les scores les plus fréquents dans une distribution. En moyenne, il représente la valeur la plus typique d'une série qui coïncide presque avec les éléments existants. Il n'est jamais affecté par les scores extrêmes, mais par les fréquences extrêmes des valeurs. Pour déterminer le mode différentes méthodes sont là.

Certaines des méthodes importantes sont discutées ci-dessous:

Méthodes pour déterminer le mode:

1. Méthode d'inspection

2. Méthode de regroupement

3. Méthode de relation empirique

1. Méthode d'inspection:

Dans cette méthode, le mode est déterminé simplement par observation. Ici, le mode est déterminé en observant le score le plus fréquent ou l'intervalle de classe par rapport auquel la fréquence maximale est considérée comme la classe modale. Lorsque deux valeurs ou intervalles de classe de ce type ont la même occurrence ou la même fréquence, les scores ou les intervalles de classe sont pris comme mode. ' Et la distribution s'appelle une distribution bimodale. Si plus de deux valeurs ou intervalles de classe sont présents, il s'agit d'une distribution multimodale.

2. Méthode de regroupement:

Lorsque la différence de valeur entre la fréquence la plus haute et la fréquence la plus haute suivante est très faible à ce moment-là, il n'est pas prudent de déterminer le mode dans la méthode d'inspection. Dans de tels cas douteux ont été utilisés méthode de regroupement.

Dans cette méthode, on prépare d'abord une table de regroupement ou une déclaration de regroupement des fréquences. Dans cette instruction, placez les valeurs ou les classes de valeurs dans la colonne de gauche et leurs fréquences correspondantes dans la colonne suivante. Dans la colonne suivante (2), regroupez les fréquences par deux à partir de la première fréquence. Ensuite, dans la troisième colonne, regroupez les fréquences par deux à partir de la deuxième fréquence. Dans la colonne suivante, regroupez les fréquences par trois à partir de la 1re fréquence.

Dans la colonne suivante, regroupez les fréquences par trois à partir de la 2ème fréquence. Dans la dernière colonne, regroupez les fréquences par trois à partir de la 3ème fréquence. Une fois le regroupement terminé, identifiez le (s) maximum (s) de chacune des 6 colonnes en mettant un cercle.

L'étape suivante consiste à préparer une table d'analyse pour localiser la valeur modale ou la classe modale. Dans ce tableau, les valeurs modales probables sont présentées dans la ligne horizontale supérieure sous les différentes colonnes et les différents numéros de colonne sont placés à gauche du tableau.

Les valeurs indiquant les fréquences groupées maximales dans la table de regroupement seront identifiées par une marque dans leur colonne respective. Le nombre de ces marques placées dans les colonnes de la valeur probable sera totalisé au bas de ce tableau. La valeur probable indiquant le maximum de ce total sera identifiée comme la valeur modale de la classe modale, selon le cas.

L'illustration suivante permettra de mieux comprendre:

Illustration:

Le tableau d'analyse ci-dessus montre que, autour du score 60, le maximum de grappes, c'est-à-dire le total 4. Alors voici 60 la valeur modale.

Lorsque les données sont dans la série continue, nous pouvons calculer le mode en appliquant la formule suivante:

Où M 0 = Mode

L 0 = limite inférieure de la classe modale

f 2 = fréquence de la classe qui succède à la classe modale.

f 0 = fréquence de la classe précédant la classe modale.

i = taille de l'intervalle de classe.

Illustration:

À partir des données suivantes, déterminez le mode:

Solution:

Ici, l'intervalle de classe 20-25 contient la fréquence la plus élevée. Pour qu'elle puisse être considérée comme la classe modale

Ici:

3. Méthode de relation empirique:

C'est la méthode la plus efficace pour déterminer le mode. Le professeur Karl Pearson a envisagé cette méthode. Le professeur Pearson a constaté que, dans une série moyennement asymétrique ou asymétrique, il existait une relation pertinente entre la moyenne, la médiane et le mode. Dans une telle série, la distance entre la moyenne et la médiane est égale à 1/3 de la distance entre la moyenne et le mode.

Illustration:

Découvrez le mode de la distribution donnée ci-dessus.

Solution:

La moyenne de la distribution est de 25, 94

La médiane de la distribution est 23.83

M 0 = 3 médiane - 2 moyenne

M 0 = 3 X 23, 83 - 2 x 25, 94

= 71.49—51.88

= 19, 61 (environ)

Utilisations du mode:

Le mode est utilisé:

(i) Lorsque nous voulons une mesure rapide et approximative de la tendance centrale.

(ii) Lorsque nous voulons une mesure de la tendance centrale qui devrait être une valeur typique. Par exemple, lorsque nous voulons connaître le style vestimentaire typique des femmes indiennes, à savoir le style vestimentaire le plus populaire. Ainsi, les notes moyennes d'une classe sont appelées marques modales.

Mérites du mode:

1. Mode donne la valeur la plus représentative d'une série.

2. Le mode n'est affecté par aucun score extrême, comme la moyenne.

3. Il peut être déterminé à partir d'un intervalle de classe ouvert.

4. Cela aide à analyser les données qualitatives.

5. Le mode peut également être déterminé graphiquement à l'aide d'un histogramme ou d'un polygone de fréquence.

6. Le mode est facile à comprendre.

Démérites:

1. Le mode n'est pas défini rigidement comme moyen. Dans certains cas, les résultats peuvent être différents.

2. Il n'inclut pas toutes les observations d'une distribution mais la concentration de fréquences des items.

3. Un traitement algébrique supplémentaire ne peut pas être effectué avec un mode comme moyen.

4. Dans les cas multimodaux et bimodaux, il est difficile à déterminer.

5. Le mode ne peut pas être déterminé à partir d'intervalles de classe inégaux.

6. Il existe différentes méthodes et différentes formules qui donnent des résultats différents de mode. C'est pourquoi, à juste titre, elle est considérée comme la moyenne la plus mal définie.