Construction d'un test normalisé: 4 étapes

Cet article met en lumière les quatre étapes principales de la construction d’un test standardisé. Les étapes sont les suivantes: 1. Planification 2. Préparation du test 3. Essai du test 4. Évaluation du test.

Étape # 1. Planification:

«La planification des tests englobe toutes les opérations variées nécessaires à la production des tests. Non seulement cela implique l'utilisation d'un contour ou d'un tableau spécifiant le contenu ou les options devant être couverts par le test, mais également une attention particulière portée à la difficulté des articles, aux types d'articles, aux instructions données à l'examinateur, etc. » (Lindquist )

Pour un test standardisé, une planification systématique et satisfaisante est nécessaire. De l'avis de Ross, «les bons tests ne se produisent pas simplement, ils ne sont pas le résultat de quelques moments d'inspiration et d'exaltation élevées».

C'est le constructeur de test qui est absolument responsable de donner une forme appropriée à ses éléments de test et qui construit le test avec soin et sincérité.

Il comprend les activités suivantes:

1. Fixer les objectifs / buts.

2. Déterminer le poids par rapport aux différents objectifs pédagogiques.

3. Détermination de la pondération pour différentes zones de contenu.

4. Déterminer les types d’éléments à inclure.

5. Préparation du tableau de spécification-Blue Print.

6. Prendre des décisions sur ses aspects mécaniques tels que la durée, la taille de l’essai, le total des notes, l’impression, la taille des lettres, etc.

7. Donner des instructions pour la notation du test et sa procédure d'administration.

8. La pondération des différentes catégories de niveau de difficulté des questions doit être corrigée.

(Les activités spécifiées aux points 1 à 5 nécessitent des éclaircissements supplémentaires)

1. Fixer les objectifs / buts:

Avant la construction du test, il est nécessaire que ses objets soient formulés. L'attention devrait être dirigée sur la capacité des tests à mesurer efficacement la mesure dans laquelle les objectifs de l'éducation ont été atteints. Les objectifs de l’éducation peuvent être classés de différentes manières. Mais quelle que soit la classification, le programme doit amener les changements d’enfant envisagés à titre d’objectifs.

Le test doit être conçu de manière à indiquer dans quelle mesure les objectifs visant à modifier le comportement de l'enfant ont été atteints grâce au programme d'enseignement qui leur a été enseigné.

L'attention devrait également être dirigée vers le but pour lequel le test est requis. Si le test est construit pour classer les étudiants, il faut alors porter une attention particulière à sa capacité de classement. Mais si son objectif est diagnostique, il devrait être construit de manière à pouvoir diagnostiquer les difficultés individuelles des étudiants.

2. Détermination de la pondération de différents objectifs pédagogiques:

L'étape la plus importante dans la planification d'un test consiste à identifier les objectifs pédagogiques. Chaque matière a un ensemble d'objectifs pédagogiques différent. Dans les matières de sciences, de sciences sociales et de mathématiques, les objectifs principaux sont classés comme connaissances, compréhension, application et compétences, tandis que dans les langues, les objectifs principaux sont classés comme connaissances, compréhension et expression.

L’objectif de connaissance est considéré comme le niveau d’apprentissage le plus faible, alors que la compréhension et l’application des connaissances en sciences ou en sciences du comportement sont considérées comme un niveau d’apprentissage supérieur.

3. Détermination de la pondération dans différents domaines de contenu:

L'activité la plus importante dans la construction d'un test de performance est de spécifier un contour de la zone de contenu. Il indique la zone dans laquelle les étudiants sont censés montrer leurs performances. Il est utile d’obtenir un échantillon représentatif de toute la zone de contenu.

Cela empêche également la répétition ou l'omission d'une unité. Maintenant, la question se pose de savoir combien de poids il faut donner à quelle unité. Certains experts disent que cela devrait être décidé par l'enseignant concerné en gardant à l'esprit l'importance du chapitre.

D'autres disent que cela devrait être décidé en fonction du domaine couvert par le sujet dans le manuel. Généralement, la décision est prise sur la base des pages du sujet, du nombre total de pages du livre et du nombre d'éléments à préparer.

4. Détermination des types d'élément:

Les éléments utilisés dans la construction de test peuvent être divisés en deux types: les éléments de type objectif et les éléments de type essai. Pour certains objectifs pédagogiques, les items de type objectif sont les plus efficaces, tandis que pour d’autres les questions à développement se révèlent satisfaisantes.

Les types d'items appropriés doivent être sélectionnés en fonction des résultats d'apprentissage à mesurer. Par exemple, lorsque le résultat est en écriture, les éléments de type d'approvisionnement sont utiles.

Si le résultat est l'identification d'une réponse correcte, les types de sélection ou les éléments de type de reconnaissance sont utiles. Donc, cela doit être décidé et planifié à ce stade.

LA = réponse longue

SA = réponse courte

VSA = réponse très courte

5. Préparation du «BLUEPRINT» ou graphique tridimensionnel:

Préparer le plan directeur ou le tableau de spécifications en trois dimensions: contenu du tableau, objectif et type d’articles, indiquant le nombre d’articles dans chaque cellule ou compartiment. Il s’agit simplement d’un cadre qui donne une image claire de la conception du test et sert de guide.

Les trois dimensions du plan directeur sont constituées de zones de contenu en lignes horizontales et d'objectifs et de formes de questions en colonnes verticales. Une fois que le plan est préparé, le préparateur de papier peut écrire / sélectionner les éléments et préparer le document de questions.

Un exemple de format de schéma est donné ci-dessous:

Remarque:

Veuillez mettre le nombre de questions entre parenthèses et les marques en dehors des parenthèses.

E = type de question, SA = type de réponse courte, VS A = réponse très courte.

Étape n ° 2. Préparation du test:

La prochaine étape après la finalisation du plan directeur consiste à rédiger les questions appropriées conformément aux paramètres généraux définis dans le plan directeur. On devrait prendre un petit bloc du plan à la fois et écrire les questions requises.

Ainsi, pour chaque bloc de modèle qui est rempli, les questions doivent être écrites une à une. Une fois que cela est fait, nous avons toutes les questions répondant aux exigences nécessaires définies dans le plan directeur.

L'écriture de test standardisée nécessite tous les types de soins et de considérations. Il faut consacrer suffisamment de temps à la réflexion sur le poids du contenu et des zones à couvrir.

Dans cette étape, nous discuterons des règles spécifiques pour la construction de différents types d'éléments de test.

A ce stade, nous devons préparer:

(i) Les éléments de test.

(ii) Les instructions pour tester les éléments.

(iii) Les instructions pour l'administration.

(iv) Les instructions pour marquer.

(v) Un tableau d'analyse par question.

(i) Préparation des éléments de test:

La préparation des éléments de test est la tâche la plus importante de l’étape de préparation. Par conséquent, il faut être prudent lors de la préparation d'un élément de test. La construction d'éléments de test n'est pas si facile. C'est la tâche des testeurs et des experts. Un enseignant expérimenté et suffisamment formé à la construction de tests peut préparer les tests appropriés.

Il existe certaines règles et directives pour la construction des éléments de test. Pour cela, il faut avoir accès à toutes ces directives et à la taxonomie des objectifs. En général, les éléments de test doivent être clairs, complets et sans ambiguïté.

La langue des éléments doit être choisie de telle sorte que le contenu, et non la forme des éléments, détermine la réponse. Les éléments qui ont une signification cachée ne doivent pas être inclus. La déclaration des objets ne doit pas être donnée au hasard dans les livres. Tous les articles d'un type particulier doivent être placés ensemble.

Le vocabulaire utilisé dans les éléments doit être suffisamment simple pour être compris de tous. Une séquence régulière dans le modèle de réponses correctes devrait être évitée. Il peut y avoir plus d'un type d'éléments de test dans le test.

L'essai doit être soumis à une révision critique à intervalles de temps. Il sera souvent souhaitable que le test comprenne plus d'éléments que le nombre réellement nécessaire. Dans l'avant-projet, il est préférable que le double nombre d'éléments nécessaires soit inclus.

Dans la construction des éléments de test, seuls les éléments qui mettent l'accent sur la mémoire ou la reconnaissance ne doivent pas être inclus. Les éléments doivent être choisis de manière à ce que les élèves prennent l’habitude de mettre en corrélation leurs connaissances avec leur vie réelle.

Une fois les éléments de test encadrés, ils doivent être correctement disposés et assemblés pour un test. Si différentes formes d’items de test sont utilisées, elles devraient être de préférence regroupées par forme. De plus, les éléments faciles doivent avoir une place au début, les éléments de difficulté moyenne au milieu et les éléments difficiles à la fin.

Les items de test peuvent être classés par ordre de difficulté attendu. Bien sûr, il existe différentes manières de rassembler les questions et nous pouvons assembler les questions selon notre but et la commodité de notre interprétation.

(ii) Préparation des instructions pour tester les éléments:

C'est l'aspect le plus négligé de la construction de test. Généralement, tout le monde accorde son attention à la construction des éléments de test. Ainsi, les responsables du test ne joignent pas les instructions aux éléments du test. Mais la validité et la fiabilité des éléments de test dépendent dans une large mesure des instructions du test.

NE Gronlund a suggéré que le fabricant de tests fournisse des directives claires concernant:

1. Le but de tester.

2. Le temps imparti pour répondre.

3. La base de la réponse.

4. La procédure pour enregistrer les réponses.

5. Les méthodes pour traiter les devinettes.

Parfois, les instructions pour tester les éléments sont tellement ambiguës que l’enfant ne peut pas les suivre et, en tant que tel, il répond aux éléments d’une manière qu’il juge appropriée à cet instant ou passe simplement l’élément suivant en le laissant sans réponse.

En raison du manque de clarté des instructions, l'enfant réagira différemment à différents moments, ce qui réduira la fiabilité du test.

(iii) Préparation des instructions pour l'administration:

Des instructions claires et détaillées sur la manière dont le test doit être administré doivent être fournies. Les conditions dans lesquelles le test doit être administré, au moment où le test doit être administré (que ce soit au milieu ou à la fin de la session, etc.), dans quel délai il doit être administré, etc. être clairement énoncé.

Si l’essai comporte des sections distinctes, les délais applicables à chaque section doivent être mentionnés. Les matériaux nécessaires (le cas échéant) pour le test, tels que les papiers graphiques, les tableaux de logarithmes, etc., doivent être mentionnés.

Les instructions doivent indiquer clairement quelles précautions l’administrateur doit prendre au moment de l’administration. Donc, une direction appropriée et claire pour l'administration du test doit être préparée.

(iv) Préparation de la direction pour la notation:

Pour faciliter l'objectivité de la notation, des «clés de notation» doivent être fournies. La clé de notation est une liste préparée de réponses à un ensemble donné de questions de type objectif. Une clé de notation est préparée en listant en série la clé (ou la bonne réponse) de chaque question par rapport à chaque élément.

Pour les questions à réponse courte et les questions à développement, des schémas de correction doivent être préparés. Ces clés et systèmes de notation doivent être soigneusement préparés. Ils aident en tant que guides au moment de la notation du test et assurent l'objectivité de la notation.

(v) Préparation d'un tableau d'analyse par questions:

Un tableau d’analyse par questions peut être préparé dans lequel chaque question est analysée. Ce graphique montre la zone de contenu couverte par la question, l’objectif (avec la spécification) qu’elle entend mesurer, son type, les notes qui lui sont attribuées, le niveau de difficulté attendu et le temps nécessaire pour y répondre.

Ce graphique analyse non seulement les éléments, mais nous donne également une image de la couverture du contenu, des objectifs, du type de question et des niveaux de difficulté différents, etc. En outre, cela nous donne une idée du temps total à prendre pour prendre la tester. Ce tableau nous aide à vérifier si le test a été préparé conformément au plan directeur ou non.

Étape n ° 3. Essai du test:

Étant donné que le test est préparé par un groupe de personnes et d’experts, il ne peut pas être totalement exempt d’erreurs. Par conséquent, toute normalisation nécessite la préparation d’un formulaire d’essai et sa mise à l’essai sur un échantillon de population.

Les objectifs de l’essai sont les suivants:

1. Identifier les articles défectueux ou ambigus.

2. Découvrir la faiblesse du mécanisme d'administration des tests.

3. Identifier les distracteurs non fonctionnels ou invraisemblables en cas de test à choix multiples.

4. Fournir des données pour déterminer le niveau de difficulté des items.

5. Fournir des données pour déterminer la valeur discriminante des articles.

6. Déterminer le nombre d'éléments à inclure dans la version finale du test.

7. Déterminer la limite de temps pour le formulaire final.

Le but principal d'essayer est de sélectionner les bons éléments et de rejeter les mauvais.

L'essai se fait en trois étapes:

1. Essais préliminaires.

2. Essais appropriés.

3. Essai final.

1. Essai préliminaire:

L'essai préliminaire est effectué individuellement pour améliorer et modifier les difficultés de langage et l'ambiguïté des éléments. Cet essai est effectué sur 10 ou 15 personnes. La maniabilité des éléments est observée. Sur la base des observations et des réactions des individus, les items peuvent être améliorés et modifiés simultanément. Ainsi, le brouillon initial est préparé et imprimé ou cyclostylé pour l’essai approprié ou l’essai en groupe.

2. L'essai approprié:

L'essai approprié est effectué sur un groupe d'au moins 40 étudiants / individus. Le but est de sélectionner les bons éléments pour le test et de rejeter les mauvais.

Cette étape comprend les activités suivantes:

(A) Analyse d'article.

(B) Préparation de la version finale du test.

(A) Analyse d'article:

Un test ne devrait être ni trop facile ni trop difficile; et chaque élément devrait discriminer la validité entre les élèves les plus performants et les moins performants. La procédure utilisée pour juger de la qualité d'un article s'appelle l'analyse d'article.

La procédure d'analyse d'item suit les étapes suivantes:

1. Les épreuves doivent être classées du score le plus élevé au plus bas.

2. Sélectionnez 27% des papiers tests parmi le plus élevé et 27% parmi les plus bas. Par exemple, si le test est administré à 120 étudiants, sélectionnez 32 épreuves parmi les plus élevées et 32 ​​épreuves parmi les plus basses.

3. Gardez de côté les autres papiers de test car ils ne sont pas requis dans l'analyse des articles.

4. Compilez le nombre d'élèves des groupes supérieur et inférieur qui ont sélectionné chaque alternative pour chaque élément du test. Cela peut être fait au verso du papier de test ou une carte d'élément de test séparée peut être utilisée comme indiqué dans le tableau (14.1).

Comme nous le savons, la qualité ou le mérite d’un test dépend des éléments individuels qui le constituent. Ainsi, seuls les éléments qui conviennent à nos besoins doivent être conservés. L'analyse des éléments fait partie intégrante de la fiabilité et de la validité d'un test.

La valeur d'un objet est jugée sous trois angles principaux:

(i) Indice de difficulté de l'article,

(ii) pouvoir discriminant de l'objet,

(iii) Efficacité des distracteurs.

Une illustration hypothétique:

Si un test est administré à 120 étudiants, alors 27% des épreuves du niveau le plus élevé sont 32 et 27% des épreuves du niveau le plus bas est de 32.

(i) Indice de difficulté de l'élément / difficulté de l'élément:

L'indice de difficulté de l'élément est une partie importante de la construction de test. Si un élément particulier est trop facile, tous les élèves y répondent. Si tous les élèves obtiennent des résultats égaux, le but même du test est annulé. Si un destinataire ne peut répondre à un élément, il est trop difficile ou mal construit. Quelle est l'utilité d'avoir de tels articles dans un test? Il est donc évident que les éléments trop faciles et trop difficiles doivent être totalement ignorés.

Il est souhaitable que les éléments de difficulté moyenne soient inclus dans un test. Lors de l’analyse effectuée au stade de l’essai, les testeurs retiennent généralement des items dans une plage de difficulté allant de 16% à 84%.

La difficulté de l'article (ID) est calculée à l'aide de la formule.

ID = R / NX 100

où R = Nombre de personnes testées répondant correctement.

N = nombre total de personnes testées ont essayé l'élément.

Dans notre exemple, sur 64 étudiants des groupes supérieur et inférieur, 40 étudiants ont répondu correctement à la question et 60 étudiants ont essayé la question. Ensuite, la difficulté de l’article est calculée comme suit:

Difficulté de l'article = 40/60 x 100 = 66.67

Comme il est habituel de suivre la règle de 16% à 84% pour considérer la difficulté de l’élément, notre ID calculé se situe dans cette plage. Par conséquent, l'élément a un niveau de difficulté approprié. Cela signifie que si un article a un ID supérieur à 84%, il s'agit d'un article trop facile. S'il est inférieur à 16%, cet article est trop difficile.

ii) Pouvoir discriminant de l'objet:

Le pouvoir discriminant (c’est-à-dire l’indice de validité) d’un élément correspond au degré de discrimination d’un élément donné parmi les étudiants qui se distinguent nettement par la ou les fonctions mesurées par le test dans son ensemble.

Une estimation de l'indice de discrimination d'un élément peut être obtenue à l'aide de la formule suivante:

RU = Nombre de réponses correctes du groupe supérieur.

RL = Nombre de réponses correctes du groupe inférieur.

N = Nombre total d'élèves qui les ont essayés.

Dans notre exemple, 30 étudiants du groupe supérieur ont répondu correctement à l'élément et 10 du groupe inférieur ont répondu correctement.

Donc R U = 30, R L = 10 et N = 60

Indice discriminant = (30 - 10) / (60/2) = 20 / 30, 67

Un indice de discrimination est généralement exprimé sous forme décimale. S'il a une valeur positive, l'élément est discriminé de manière positive. Cela signifie qu'une proportion plus importante d'élèves plus avertis que d'élèves pauvres ont bien compris le sujet. Si la valeur est zéro, l'élément a une discrimination de zéro.

Cela peut se produire:

je. Parce que l'article est trop facile ou trop difficile; ou

ii. Parce que c'est ambigu.

Si plus de mauvais élèves que de bons élèves obtiennent le bon résultat, on obtiendrait une discrimination négative. Avec un petit nombre d'étudiants, cela peut être un résultat fortuit. mais cela peut indiquer que l'élément est ambigu ou mal saisi.

L'élément ayant un indice de discrimination nul ou négatif doit être jeté ou révisé. En général, plus l'indice de discrimination est élevé, meilleur est l'élément.

(iii) Efficacité des distracteurs:

Un distracteur est considéré comme un bon distracteur lorsqu'il attire plus d'élèves du groupe inférieur que du groupe supérieur.

Exemple:

Supposons un total de 40 cahiers de réponses (dans les groupes supérieur et inférieur, 20 dans chacun).

Vous trouverez ci-dessous une illustration hypothétique dans laquelle un astérisque indique la réponse correcte:

Dans l'illustration, les alternatives A et C sont efficaces en ce sens qu'elles attirent plus d'étudiants du groupe inférieur que du groupe supérieur. Mais la variante D est un mauvais distracteur car elle n’attire personne et est donc inutile. L'élément n'a que des options et les chances de succès par simple devinette sont améliorées. La variante E est également médiocre car elle attire une plus grande proportion de bons élèves que de mauvais élèves.

Le rédacteur doit se demander:

«Pourquoi les élèves les plus brillants ont-ils été attirés par E? Était-ce à cause de l'ambiguïté? Était-ce parce qu'il y avait deux réponses également correctes? »En résumé, ce point devrait être révisé en modifiant les variantes D et E.

(B) Préparation de la version finale du test:

Après analyse des éléments, seuls les éléments de niveau approprié, avec le niveau de difficulté approprié et avec un pouvoir discriminant satisfaisant, sont conservés et constituent l’épreuve finale. En conséquence, les bons articles sont sélectionnés parmi le grand nombre d’articles.

Certains d'entre eux peuvent être modifiés et le nombre d'éléments souhaité est sélectionné pour le brouillon final en fonction du schéma. Les articles sont classés par ordre de difficulté dans la version finale. Le temps requis pour le test est déterminé. Le test est maintenant administré à un grand échantillon représentatif et les épreuves de test sont notées.

3. Essais finaux:

L’essai final est effectué sur un large échantillon d’environ 400 personnes pour estimer la fiabilité et la validité du test. Son but est de décider de la durée du test également. Le but de cet essai est d'identifier les défauts et les carences des éléments de test. Lors de l'analyse des articles, les articles trop faciles et trop difficiles sont éliminés. Seuls les éléments de niveau de difficulté moyen sont inclus ou conservés.

Presque toutes les précautions d’essai sont à prendre lors de l’épreuve finale. La feuille de réponse complétée doit être notée à l’aide de la clé de notation et les notes doivent être totalisées pour traitement statistique.

Étape # 4. Évaluation du test:

La normalisation et l'évaluation du test sont effectuées de la manière suivante:

1. La forme finale du test est imprimée. La feuille de réponses est également imprimée.

2. Le temps requis pour le test est déterminé en prenant en moyenne le temps de trois élèves pour répondre au test. Les élèves sélectionnés à cet effet représentent trois groupes: brillant, moyen et inférieur à la moyenne.

3. Les instructions aux personnes qui administreront le test sont préparées et imprimées.

4. Les scores sont présentés sous forme de tableau et diverses mesures de la tendance centrale, de la médiane et du mode, ainsi que des mesures de la variabilité (écart type, écart quartile, etc.) sont trouvées.

Les scores sont représentés sur une feuille de graphique pour comparer la normalité de la distribution et dessiner et donner pour obtenir différents scores en centiles. Les scores dérivés tels que le T-score et le Z-score, etc. sont estimés.

Les normes telles que les normes d'âge, les normes de classe, les normes de sexe, les normes rurales-urbaines, etc., sont calculées conformément à l'exigence.

5. La validité des résultats du test est estimée en corrélant les résultats du test avec un autre critère. La validité de construction peut être déterminée par analyse factorielle. Différentes méthodes de détermination de la validité ont été discutées dans une unité séparée.

6. Lors de l'évaluation du test nouvellement construit, la fiabilité est également estimée. Dans le cas de deux formes parallèles, nous pouvons calculer la fiabilité en corrélant les scores de ces deux formes parallèles.

Si des formulaires parallèles n’ont pas été préparés, la fiabilité peut être déterminée par la méthode moitié-divisée ou par la méthode de l’équivalence rationnelle. Le test peut être lu et la fiabilité peut être estimée par la méthode test-retest.

7. Enfin, nous devrons évaluer dans quelle mesure un test est utilisable du point de vue de l’administration, de la notation, du temps et de l’économie. Le test doit fournir des normes de centile, des normes de score standard, des normes d'âge et des normes de classe qui faciliteront l'interprétation des scores.