7 Concepts fondamentaux relatifs à l'échantillonnage

Les sept concepts fondamentaux relatifs à l'échantillonnage sont les suivants: 1. Univers / population 2. Base de sondage 3. Plan d'échantillonnage 4. Statistique (s) et paramètre (s) 5. Erreur d'échantillonnage 6. Précision 7. Niveau de confiance et niveau de signification.

1. Univers / Population:

D'un point de vue statistique, le terme "univers" désigne le total des éléments ou des unités dans n'importe quel domaine de recherche, tandis que le terme "population" désigne le total des éléments pour lesquels des informations sont souhaitées. Les attributs qui font l'objet de l'étude sont appelés caractéristiques et les unités qui les possèdent sont appelées unités élémentaires.

L'ensemble de ces unités est généralement décrit comme population. Ainsi, toutes les unités d’un champ d’investigation constituent l’univers et toutes les unités élémentaires (sur la base d’une caractéristique ou plus) constituent la population. Très souvent, nous ne trouvons aucune différence entre population et univers et, en tant que tel, les deux termes sont considérés comme interchangeables. Cependant, un chercheur doit nécessairement définir ces termes avec précision.

La population ou l'univers peuvent être finis ou infinis. La population est dite finie si elle est composée d'un nombre déterminé d'éléments, de sorte qu'il est possible de l'énumérer dans sa totalité. Par exemple, la population d'une ville, le nombre de ménages dans un village, le nombre de travailleurs dans une usine et le nombre d'étudiants dans une université sont des exemples de population finie. Le symbole 'N' est généralement utilisé pour indiquer combien d’éléments (ou d’éléments) sont présents dans le cas d’une population finie.

Une population infinie est cette population dans laquelle il est théoriquement impossible d'observer tous les éléments. Ainsi, dans une population infinie, le nombre d'éléments est infini, c'est-à-dire que nous ne pouvons avoir aucune idée du nombre total d'éléments.

Par exemple, le nombre d'étoiles dans le ciel, les particules de sable sur une plage de la mer et les cailloux dans le lit d'une rivière. D'un point de vue pratique, le terme «population infinie» est utilisé pour désigner une population qui ne peut être énumérée dans un délai raisonnable. De cette manière, nous utilisons le concept théorique de population infinie comme approximation d’une très grande population finie.

2. Cadre d'échantillonnage:

Les unités élémentaires ou le groupe de grappes de telles unités peuvent constituer la base du processus d'échantillonnage, auquel cas elles sont appelées unités d'échantillonnage. Une liste contenant toutes ces unités d'échantillonnage est appelée base de sondage. La base de sondage consiste en une liste d'éléments à partir desquels l'échantillon doit être tiré. Par exemple, on peut utiliser l’annuaire téléphonique comme base pour mener un sondage d’opinion dans une ville. Quel que soit le cadre, il devrait être un bon représentant de la population.

3. Plan d'échantillonnage:

Un plan de sondage est un plan précis pour obtenir un échantillon de la base de sondage. Il fait référence à la technique ou à la procédure que le chercheur adopterait pour sélectionner certaines unités d'échantillonnage à partir desquelles des inférences sont tirées de la population. Le plan d'échantillonnage est déterminé avant la collecte des données.

4. Statistique (s) et paramètre (s):

Une statistique est une caractéristique d'un échantillon, alors qu'un paramètre est une caractéristique d'une population. Ainsi, lorsque nous élaborons certaines mesures telles que la moyenne, la médiane, le mode, etc., à partir d’échantillons, elles sont appelées statistiques car elles décrivent les caractéristiques d’un échantillon. Mais lorsque de telles mesures décrivent les caractéristiques d’une population, elles sont appelées paramètres. Par exemple, la moyenne de la population (μ) est un paramètre, tandis que la moyenne de l'échantillon (X) est une statistique. Obtenir l'estimation d'un paramètre à partir d'une statistique constitue l'objectif premier de l'analyse par échantillonnage.

5. Erreur d'échantillonnage:

L'enquête par sondage implique l'étude d'une petite partie de la population et, en tant que telle, les informations recueillies présenteraient naturellement une certaine inexactitude. Cette inexactitude peut être qualifiée d’erreur d’échantillonnage ou de variance d’erreur. En d'autres termes, les erreurs d'échantillonnage sont les erreurs qui résultent de l'échantillonnage et il s'agit généralement de variations aléatoires (en cas d'échantillonnage aléatoire) des estimations de l'échantillon autour des valeurs réelles de la population. Il peut être décrit numériquement comme suit:

Erreur d'échantillonnage = erreur de trame + erreur de chance + erreur de réponse.

6. précision:

La précision est une plage dans laquelle la moyenne de la population (ou d’autres paramètres) doit être conforme à la fiabilité spécifiée dans le niveau de confiance en pourcentage de l’estimation ± ou en quantité numérique. Par exemple, si l'estimation est Rs. 4000 et la précision souhaitée est de ± 4%, alors la valeur réelle ne sera pas inférieure à Rs. 3840 et pas plus que Rs. 4160. C'est la plage (Rs. 3840 à Rs. 4160) dans laquelle la vraie réponse devrait se situer. Mais si nous souhaitons que l'estimation ne s'écarte pas de la valeur réelle de plus de Rs. 200 dans les deux sens, dans ce cas, la plage est Rs. 3800 à Rs. 4200.

7. Niveau de confiance et niveau d'importance:

Le niveau de confiance ou la fiabilité correspond au pourcentage attendu de fois que la valeur réelle sera comprise dans la limite de précision indiquée. Ainsi, si nous prenons un niveau de confiance de 95%, nous voulons dire qu'il y a 95 chances sur 100 (ou 0, 95 sur 1) que les résultats de l'échantillon représentent la condition réelle de la population dans une plage de précision spécifiée contre cinq chances sur cinq. 100 (ou 0, 05 en 1) que ce n'est pas le cas.

La précision est la fourchette dans laquelle la réponse peut varier et rester acceptable; le niveau de confiance indique la probabilité que la réponse se situe dans cette plage et le niveau de signification, la probabilité que la réponse se situe en dehors de cette plage. On peut se rappeler que si le niveau de confiance est de 95%, le seuil de signification sera de (100-95), soit 5%, si le niveau de confiance est de 99%, le seuil de confiance est de (100-99). ), c’est-à-dire 1%, et ainsi de suite.