Validité d'un test: 6 types

Les six types de validité suivants sont couramment utilisés, à savoir, la validité faciale, la validité du contenu, la validité prédictive, la validité concurrente, la validité de construction et la validité factorielle. Parmi ceux-ci, le contenu, la validité prédictive, concurrente et conceptuelle sont les plus importants utilisés dans le domaine de la psychologie et de l'éducation.

Ceux-ci sont discutés ci-dessous:

Type # 1. Validité faciale:

La validité apparente dans la mesure où le test semble mesurer ce qui doit être mesuré.

La validité apparente fait référence à la validité ou non d'un test, c'est-à-dire à l'apparence extérieure, que les éléments semblent mesurer l'aspect requis ou non. Si un test mesure ce que l'auteur du test souhaite mesurer, nous affirmons que le test a une validité apparente. Ainsi, la validité apparente ne fait pas référence à ce que le test mesure, mais à ce que le test «semble mesurer». Le contenu du test ne devrait évidemment pas sembler inapproprié, non pertinent.

Par exemple, un test visant à mesurer «compétences supplémentaires» ne doit contenir que des éléments supplémentaires. Quand on examine les éléments et que tous les éléments semblent mesurer l’habileté en plus, on peut dire que le test est validé par visage.

Bien qu’il ne s’agisse pas d’une méthode efficace d’évaluation de la validité d’un test et qu’il ne soit donc généralement pas utilisé, il peut être utilisé comme première étape de la validation du test. Une fois le test validé en face, nous pouvons continuer à calculer le coefficient de validité.

De plus, cette méthode aide un fabricant de tests à réviser les éléments de test en fonction du but recherché. Lorsqu'un test doit être construit rapidement ou lorsqu'il existe un besoin urgent de test et qu'il n'y a pas de temps ou de portée pour déterminer la validité par d'autres méthodes efficaces, la validité apparente peut être déterminée.

Ce type de validité n'est pas adéquat car il fonctionne au niveau du visage et peut donc être utilisé en dernier recours.

Type # 2. Validité du contenu:

Validité du contenu: processus consistant à faire correspondre les éléments du test aux objectifs pédagogiques.

La validité du contenu est le critère le plus important pour l'utilité d'un test, en particulier d'un test de réussite. On l'appelle aussi comme validité rationnelle ou validité logique ou validité théorique ou validité interne ou validité intrinsèque.

La validité du contenu fait référence au degré ou à la mesure dans lequel un test est constitué d'éléments représentant les comportements que le testeur souhaite mesurer. La validité de contenu du test est la mesure dans laquelle les éléments d’un test sont véritablement représentatifs de l’ensemble du contenu et des objectifs de l’enseignement.

La validité du contenu est estimée en évaluant la pertinence des éléments de test; c'est-à-dire que les éléments de test doivent couvrir dûment tous les domaines de contenu et de comportement du trait à mesurer. Cela donne une idée du sujet ou du changement de comportement.

De cette façon, la validité du contenu fait référence à la mesure dans laquelle un test contient des éléments représentant le comportement que nous allons mesurer. Les éléments du test doivent inclure toutes les caractéristiques pertinentes de l'ensemble du domaine de contenu et des objectifs dans les bonnes proportions.

Avant de construire le test, le testeur prépare un tableau de contenu et d'objectifs bidirectionnel, communément appelé «tableau de spécification».

Supposons qu'un test de rendement en mathématiques soit préparé. Il doit contenir des éléments de l’algèbre, de l’arithmétique, de la géométrie, de la mensuration et de la trigonométrie. De plus, les éléments doivent mesurer différents objectifs comportementaux tels que connaissances, compréhension, habileté, application, etc.

Un exemple de "spécification" en mathématiques est présenté dans le tableau suivant:

Le tableau reflète l'échantillon de tâches d'apprentissage à mesurer. Plus les éléments de test correspondent à l'échantillon spécifié, plus grande est la possibilité d'obtenir une validité de contenu satisfaisante. Par conséquent, il est souhaitable que les éléments d’un test soient examinés par une équipe d’experts. Ils devraient vérifier si l'emplacement des divers éléments dans les cellules du tableau est approprié et si toutes les cellules du tableau ont un nombre adéquat d'éléments.

L'adéquation doit être jugée en termes de pondération accordée aux différents tableaux de contenu par objectif en fonction de l'équipe d'experts qui ont conçu le programme.

Quelques points généraux pour assurer la validité du contenu sont donnés ci-dessous:

1. Le test devrait servir le niveau requis d'élèves, ni supérieur ni inférieur à leur niveau habituel.

2. La langue devrait être jusqu’au niveau des élèves.

3. Tout ce qui ne fait pas partie du programme ne doit pas être inclus dans les items du test.

4. Chaque partie du programme devrait recevoir la pondération nécessaire. Plus d'éléments devraient être sélectionnés dans des parties plus importantes du programme.

Limites:

1. Le poids à donner aux différentes parties du contenu est subjectif.

2. Il est difficile de construire le test objectif parfait.

3. La validité du contenu n'est ni suffisante ni adéquate pour les tests d'intelligence, de réussite, d'attitude et, dans une certaine mesure, de personnalité.

4. La pondération accordée à différents changements de comportement n'est pas objective.

Type n ° 3. Validité prédictive:

Validité prédictive Mesure dans laquelle le test prédit la performance future des étudiants.

La validité prédictive concerne la capacité prédictive d'un test. Il indique l'efficacité d'un test pour prévoir ou prédire les résultats futurs dans un domaine spécifique. L'utilisateur test souhaite prévoir les performances futures d'un individu. Les résultats des tests peuvent être utilisés pour prédire le comportement ou les performances futurs et sont donc appelés validité prédictive.

Afin de trouver une validité prédictive, le testeur met en corrélation les résultats du test avec les performances ultérieures du client, connues sous le nom de «critère». Le critère est une mesure indépendante, externe et directe de ce que le test est conçu pour prédire ou mesurer. Par conséquent, il est également connu sous le nom de «validité liée au critère».

La validité prédictive ou empirique a été définie par Cureton (1965) comme une estimation du coefficient de corrélation entre les scores au test et le critère réel.

Un exemple peut clarifier le concept mieux.

Exemple:

Le test médical d'entrée est construit et administré pour sélectionner le candidat à l'admission aux cours MBBS. Sur la base des scores obtenus par les candidats à ce test, nous admettons les candidats.

Une fois le cours terminé, ils apparaissent à l'examen final MBBS. Le score de l'examen final MBBS est le critère. Les scores du test d'entrée et de l'examen final (critère) sont corrélés. Une corrélation élevée implique une validité prédictive élevée.

On peut citer ici des exemples similaires, tels que d’autres tests de recrutement ou d’entrée, dans les domaines de l’agriculture, de l’ingénierie, des services bancaires, des chemins de fer, etc., qui doivent présenter une validité prédictive élevée.

C'est-à-dire que les tests utilisés pour le recrutement, la classification et l'examen d'entrée doivent avoir une validité prédictive élevée. Ce type de validité est parfois appelé «validité empirique» ou «validité statistique», car notre évaluation est essentiellement empirique et statistique.

Limitation:

Si nous obtenons un critère de mesure approprié avec lequel nos résultats de test doivent être corrélés, nous pouvons déterminer la validité prédictive d'un test. Mais il est très difficile d’obtenir un bon critère. De plus, il est possible que nous n'ayons pas de critères de mesure pour tous les types de tests psychologiques.

Type # 4. Validité simultanée:

Validité concurrente corrélant les résultats du test avec un autre ensemble de résultats de critères.

La validité simultanée fait référence à la mesure dans laquelle les résultats du test correspondent à une performance déjà établie ou acceptée, appelée critère. Pour connaître la validité d'un test nouvellement construit, il est corrélé ou comparé à certaines informations disponibles.

Ainsi, un test est validé par rapport à certaines informations disponibles simultanément. Les scores obtenus à partir d'un test nouvellement construit sont en corrélation avec les performances de test préétablies. Supposons que nous ayons préparé un test d'intelligence.

Nous l'administrons à un groupe d'élèves. Le test de Stanford-Binet est également administré au même groupe. À présent, les résultats des tests réalisés lors de nos tests nouvellement construits et des résultats obtenus par les élèves du test d'intelligence de Stanford-Binet sont corrélés. Si le coefficient de corrélation est élevé, notre test d'intelligence est dit à validité simultanée élevée.

La signification du terme "simultané" dans le dictionnaire est "existant" ou "fait en même temps". Ainsi, le terme «validité concurrente» est utilisé pour indiquer le processus de validation d'un nouveau test en corrélant ses scores avec une source d'information existante ou disponible (critère) qui aurait pu être obtenue peu de temps avant ou peu après le début du nouveau test.

Pour vérifier la validité concurrente d'un test de réussite construit récemment, ses scores sont corrélés aux scores obtenus par ces mêmes étudiants lors de leur premier examen terminal ou terminal récent. Ainsi, un test est validé par rapport à certaines informations disponibles simultanément. Pour obtenir une mesure critère, nous ne sommes pas obligés d'attendre longtemps.

La validité prédictive diffère de la validité concurrente en ce sens que dans l'ancienne validité, nous attendons le futur pour obtenir une mesure de critère. Mais, en cas de validité concurrente, nous n’avons pas besoin d’attendre de plus longs écarts.

Le terme «concurrent» implique ici les caractéristiques suivantes:

1. Les deux tests - celui dont la validité est en cours d’examen et celui qui a fait ses preuves - sont censés couvrir le même domaine de contenu à un niveau donné et le même objectif;

2. La population des deux tests reste la même et les deux tests sont administrés dans des environnements presque similaires; et

3. Les données de performance sur les deux tests peuvent être obtenues presque simultanément.

Ce type de validité est également appelé «validité externe» ou «validité fonctionnelle». La validité simultanée est pertinente pour les tests utilisés pour le diagnostic et non pour la prévision du succès futur.

Type # 5. Validité de construction:

Validité de construction C'est dans quelle mesure on peut dire que le test mesure une construction théorique ou une variable psychologique.

Une construction est principalement psychologique. Habituellement, il s'agit d'un trait ou d'un processus mental. La validation de construction est le processus permettant de déterminer dans quelle mesure un test particulier mesure les constructions psychologiques que le testeur a l'intention de mesurer.

Il indique dans quelle mesure un test mesure les attributs ou qualités abstraits qui ne sont pas définis opérationnellement.

Selon Gronlund et Linn, "La validation de la construction peut être définie comme le processus permettant de déterminer dans quelle mesure la performance du test peut être interprétée en termes d'une ou de plusieurs constructions psychologiques."

Ebel et Frisbie décrivent: «La validation de construction est le processus de collecte de preuves pour soutenir la thèse selon laquelle un test donné mesure bien le construit psychologique que les responsables du test devaient lui permettre de mesurer.

La validité de construction est également connue sous le nom de «validité psychologique», de «validité du caractère» ou de «validité logique». La validité de construction signifie que les résultats du test sont examinés en termes de construction. Il étudie la structure ou les attributs psychologiques mesurés par un test.

La mesure dans laquelle le test mesure les traits de personnalité ou les processus mentaux définis par le testeur est appelée validité de construction du test.

Tout en construisant des tests d'intelligence, d'attitude, d'aptitude mathématique, de pensée critique, d'aptitudes à l'étude, d'anxiété, de raisonnement logique, de compréhension de la lecture, etc., nous devons rechercher la validité conceptuelle. Prenons par exemple «un test de sincérité».

Avant de construire de tels types de test, le testeur est confronté aux questions suivantes:

1. Quelle devrait être la définition du terme sincérité?

2. Quels types de comportement faut-il attendre d'une personne sincère?

3. Quel type de comportement distingue entre sincérité et manque de sincérité?

Chaque construction a une théorie sous-jacente qui peut être utilisée pour décrire et prédire le comportement d'un élève.

Gronlund (1981) suggère les trois étapes suivantes pour déterminer la validité de construit:

(i) Identifiez les constructions supposées rendre compte de la performance du test.

(ii) Dérivez des hypothèses concernant les performances des tests à partir de la théorie sous-jacente à chaque construit.

(iii) Vérifier les hypothèses par des moyens logiques et empiriques.

Il faut noter que la validité de construction est inférentielle. Il est utilisé principalement lorsque d'autres types de validité sont insuffisants pour indiquer la validité du test. La validité de construction est généralement impliquée dans les habitudes d'étude, l'appréciation, l'honnêteté, la stabilité émotionnelle, la sympathie, etc.

Type n ° 6. Validité factorielle:

Validité factorielle: degré de corrélation des différents facteurs avec l'ensemble du test.

La validité factorielle est déterminée par une technique statistique appelée analyse factorielle. Il utilise des méthodes d’explication des corrélations pour identifier les facteurs (qui peuvent être verbalisés en tant que capacités) constituant le test.

En d'autres termes, des méthodes d'intercorrélation et d'autres méthodes statistiques sont utilisées pour estimer la validité factorielle. La corrélation du test avec chaque facteur est calculée pour déterminer le poids que chaque facteur contribue à la performance totale du test.

Cela nous indique les charges factorielles. Cette relation des différents facteurs avec l'ensemble du test s'appelle la validité factorielle. Guilford (1950) a suggéré que la validité factorielle soit la description la plus claire de ce qu'un test mesure et qu'il convient, par tous les moyens, d'avoir la préférence sur les autres types de validité.