طرق جمع أدلة الصدق

Site: Plateforme pédagogique de l'Université Sétif2
Cours: القياس النفسي
Livre: طرق جمع أدلة الصدق
Imprimé par: Visiteur anonyme
Date: Friday 10 May 2024, 00:08

1. مفهوم الصدق

يعد الصدق من معايير الجودة الفنية للاختبارات ذات أهمية في بناء وتقييم الاختبارات، وخاصية هامة من خصائص درجات الاختبارات، والذي يشير تقليديا إلى أن يقيس الاختبار أو أي أداة أخرى فعلا ما أعدت لقياسه. ولكن هذه النظرة للصدق كلاسيكية لا تعبَر بدقة عن التعريف الاجرائي للمفهوم، فقد تطورت النظرة إلى الصدق كما وصفه Cronbach (1971) على أنه العملية التي يجمع فيها مطور الاختبار أو مستخدمه من خلالها الأدلة التي تدعم الاستنتاجات التي استخلصها من درجات الاختبار.

كما تعرَفه وثيقة معايير العملية الاختبارية النفسية والتربوية (1999) American Educational Research Association, American Psychological Association & National Council on Measurement in Education على أنه الدرجة التي تؤيد بها الأدلة والنظرية تفسير درجات الاختبارات التي تتطلبها استخدامات مقترحة للاختبار.

يشير الصدق إلى الأدلة المستمدة من درجات الاختبارات لهدف معين ضمن مجموعة شروط وضعت مسبقا، لذلك فالصدق ضمن المفهوم الحديث ليس خاصية من خصائص الاختبارات وإنما خاصية من خصائص درجات الاختبارات.

فالصدق يتعلق بمدى فائدة أداة القياس في اتخاذ قرارات مرتبطة بغرض أو أغراض معينة، وليس خاصية من خصائص الأداة ذاتها، فالصدق يعدَ خاصية استدلالية (Messick, 1995). إضافة إلى أن الصدق لا يتضمن فقط تلاؤم الهدف مع السمة المطلوب قياسها وإنما في مختلف الأدلة المطلوب جمعها لاستخدام وتفسير درجات الاختبارات.

أكدت وثيقة معايير العملية الاختبارية AERA, APA, NCME (1999) بأن تأييد الصدق مسؤولية مشتركة بين مطوَر الاختبار الذي يقدَم أدلة وأسس منطقية للاستخدام المرجو للاختبار، ومستخدم الاختبار الذي يقيَم الأدلة الموجودة ضمن السياق الذي استخدم فيه الاختبار (p. 11).

2. أدلة تعتمد على المحتوى

يهدف صدق المحتوى إلى تقييم ما إذا كانت البنود تمثَل نطاق الأداء أو البناء المستهدف بشكل مناسب، يجب أن يكون المحتوى ممثلا تمثيلا جيدا لنطاق البنود الذي يتم تحديده مسبقا، ونقصد بنطاق البنود المعارف والمهارات والعمليات التي يتم معاينتها بواسطة بنود الاختبار. وحسب وثيقة "معايير العمليات الاختبارية التربوية والنفسية" (1999) فانه يتم الحصول على الأدلة المتعلَقة بالمحتوى من خلال الارتباط بين محتوى الاختبار والتكوين الفرضي المستهدف قياسه (AERA, APA & NCME, 1999, P.11).

ويتطلب أن يكون النطاق الشامل للبنود معرفا تعريفا دقيقا وإجرائيا للسمة المراد قياسها، فتحديد الأهداف السلوكية تعدَ خطوة ضرورية في قياس التحصيل، مثلا في اختبار المفردات نادرا ما يهدف مستخدم الاختبار ما إذا كان المفحوص يعرف معاني كلمات محددة فقط، لكنه يهتم بمعرفة المفحوص بالكلمات المشابهة لها. عادة ما يستخدم في صدق المحتوى طريقة هي تحكيم مجموعة من الخبراء المستقلين للحكم ما إذا كانت عينة البنود مناسبة لنطاق القياس، ويتضمن صدق المحتوى على الأقل سلسلة من الخطوات:

1- تحديد نطاق الأداء المستهدف.

2- اختيار فريق من الخبراء المؤهلين في مجال النطاق.

3- التزويد بهيكل بنائي لعملية مطابقة البنود لنطاق الأداء.

4- جمع وتلخيص البيانات الناتجة عن عملية المطابقة.

معظم أساليب تقدير صدق المحتوى تعتمد على الأحكام التقييمية لخبراء المواد الدراسية أو المهتمين بتنمية المهارات والكفاءات التعليمية والمهنية والفنية، وتتعلق هذه الأحكام بتقدير مدى تناظر بين بنود الاختبار والنطاق السلوكي الذي تمثَله هذه البنود.

- يمكن للتأكد من صدق المحتوى إعداد استمارة تشتمل على ميزان تقدير تتضمن الأبعاد الرئيسية المتعلقة بالنطاق السلوكي، مثل محتوى البنود، نوع المهارات ومجالها، ومصادر أو مواد ذات أهمية، ونوع البنود وملاءمتها للمحتوى والمهارة المرجوة. حينها يقوم المحكم بتقييم كل بند من بنود الاختبار في هذه الأبعاد على ميزان التقدير. ويُفضَل الاعتماد على أكثر من محكم للحصول على تقديرات أكثر اتساقا، ويمكن التحقق من ذلك بتحليل التقديرات إحصائيا باستخدام مؤشرات إحصائية تزودنا بدرجة اتساق التقديرات مثل تحليل التباين، معاملات الاتفاق.

- يمكن أيضا التحقق من الصدق امبريقيا وذلك بتطبيق الاختبار على عينة من الطلاب قبل بدء عملية التعليم، ثم إعادة تطبيقه بعد نهايتها وفحص نتائج الاختبار في المرتين للتعرف على ما إذا كان الاختبار يقيس بالفعل المجال الذي اهتمت به عملية التعليم.

يستند تقدير صدق المحتوى إلى ثلاثة فروض صاغها Lenon كالتالي:

1- يجب أن يكون المجال الذي يُختبر فيه الأفراد محدودا بنطاق شامل للبنود الذي تبدو أهميته لهم، ويمكن تعريفه تعريفا دقيقا.

2- يمكن انتقاء عينة من البنود من هذا النطاق بطريقة هادفة ومناسبة.

3- يمكن تحديد عينة البنود وأسلوب المعاينات المستخدم وتعريفها بدقة كافية لكي يتمكن مستخدم الاختبار الحكم على مدى تمثيل عينة البنود للنطاق السلوكي الشامل الذي يقيسه.

- توجد مجموعة من الطرق في تقدير معاملات صدق المحتوى، حدَدها Croker & Algina (1986) في:

1- نسبة البنود المزاوجة للأهداف السلوكية.

2- نسبة البنود المزاوجة للأهداف بتقديرات عالية الأهمية.

3- الارتباط بين الأوزان النسبية للأهداف والبنود التي تقيس هذه الأهداف.

4- معامل التوافق بين البند والهدف.

5- نسبة الأهداف التي لم تقيَم بأي بند في الاختبار.

اقترح المعامل الرابع (4) من طرف Hambelton & Revenelli (1977); Hambelton (1980) الذي يستخدم في تقييم إلى أيَ مدى تكون درجة صدق محتوى بند معين بالنسبة لمجموعة الأهداف. وتعتمد هذه الصيغة على افتراض أنه في الحالة المثالية يجب أن يزاوج البند هدفا واحدا فقط من مجموعة الأهداف، وتعكس طريقة جمع البيانات هذا الافتراض وذلك لأنه تم توجيه الخبراء لمزاوجة البند لكل هدف، وأن يعطوا القيمة (1) فيما لو كانت هناك مزاوجة والقيمة صفر (0) إن لم يكن متأكدا من المزاوجة والقيمة (-1) فيما لو لم يطابق البند مع الهدف بوضوح. ويمكن حساب معامل توافق البند مع الهدف K بالصيغة المبسطة:

N: عدد الأهداف.

  : متوسط تقدير الأحكام i على البند k للهدف .

  : متوسط تقدير الأحكام على البند k في جميع الأهداف.

أكبر قيمة محتملة لتوافق البند-الهدف تساوي (1.00) عندما يتطابق البند مع هدف واحد ومن قبل المحكمين جميعا، وفي حالة تطابق البند الواحد مع أكثر من هدف فان معامل التوافق يكون أقل من (1.00). في الحالة المثالية يجب أن تكون قيم لكل بند في الاختبار عالية وللهدف الذي صمم لقياسه ومنخفض للأهداف الأخرى.

3. أدلة تعتمد على المحك

في العديد من الحالات يهدف مستخدم الاختبار لاستخلاص نتائج من درجات الاختبار لفحص السلوك على محك أداء معين لا يمكن قياسه مباشرة بالاختبار، يناسب الصدق المرتبط بمحك المواقف التي نود فيها استخدام أداة قياس في تقدير سلوك معين ذي دلالة، وهذا السلوك خارج نطاق الاختبار ذاته ويُعدَ بمثابة المحك. فالصدق المرتبط بمحك يستند إلى الأسلوب الامبريقي في دراسة العلاقة بين درجات اختبارات أو مقاييس معينة تعدَ بمثابة منبئات ودرجات مقاييس خارجية مستقلة تعدَ بمثابة محكات أداء عملية. ويتم تصميم دراسة الصدق المرتبط بمحك وفقا للخطوات التالية:

1- تحديد سلوك المحك المناسب وطريقة قياسه.

2- تحديد عينة مناسبة من ممثلة من المفحوصين الذين سيستخدم الاختبار لفئتهم.

3- تطبيق الاختبار والاحتفاظ بدرجة كل مفحوص.

4- عندما تكون بيانات المحك مناسبة، يُحصَل على قياس للأداء على المحك لكل مفحوص.

5- تحديد قوة العلاقة بين درجات الاختبار والأداء على محك.

تميَز أدبيات القياس والتقويم بين نوعين من الصدق المرتبط بمحك أحدهما يسمى الصدق التنبؤي والآخر يسمى الصدق التلازمي. بحيث يشير الصدق التنبؤي إلى تقدير مدى صلاحية الاختبار في التنبؤ بأداء الفرد المستقبلي الذي يقاس باختبار محك باستخدام درجات اختبار يطبق عليه في الوقت الحاضر. تتعلق هذه الأدلة بدرجة العلاقة بين درجات اختبار ونمط معين من السلوك المستقبلي مما يمكن من التنبؤ بهذا السلوك، وذلك يتطلب مرور مدة زمنية بين الحصول على الدرجات في الاختبار التنبؤي ودرجات الاختبار المحك الذي نقدَر في ضوئه صدق القرار. مثلا، قد ترتبط درجات اختبار الاستعداد الدراسي بدرجات الطالب بالكلية قدره (0.40)، وبالتالي فان درجات اختبار الاستعداد الدراسي لها درجة صدق تنبؤي بالنسبة لدرجة الطالب بالكلية.

تتعدد طرق تقدير الصدق التنبؤي اعتمادا على مجالات استخدام الاختبارات والمقاييس ونوع القرارات التي تسترشد بالبيانات المستمدة من دراسات الصدق، من بينها:

3.1. طريقة الارتباط بين الاختبار التنبؤي والمحك

تعتمد الطريقة على تطبيق الاختبار التنبؤي ثم الانتظار لحين حدوث السلوك المتنبأ به (المحك) للحصول على درجات الأفراد في اختبار المحك ثم إيجاد معامل الارتباط بين درجات الاختبار التنبؤي ودرجات الاختبار المحك. فإذا كانت قيمة معامل الصدق التنبؤي مرتفعة بدرجة كافية يمكن اعتبار القرارات المتخذة صادقة.

يجب التنويه إلى أن معامل الارتباط بين درجات الاختبار المنبئ ودرجات اختبار المحك لا يستخدم فقط "معامل بيرسون"، حيث عندما يتم تصنيف الأداء على كل من المتنبئ والمحك (مثل، ناجح-راسب على المتنبئ، والنجاح-الفشل على المحك) يمكن تقدير مثلا "معامل فاي"Phi  أو "معامل كابا"Kappa  أو أي طريقة ارتباطية مناسبة للاستخدام مع البيانات التصنيفية.

3.2. طريقة الانحدار في التنبؤ بدرجات الاختبار المحك

يمكن استخدام معادلة الانحدار في التنبؤ بدرجة الفرد في اختبار المحك بمعلومة درجته في الاختبار التنبؤي اعتمادا على قيمة معامل الصدق التنبؤي لكن يتطلب أن تكون العلاقة بين درجات الاختبارين خطية، ويمكن التوصل إلى معادلة خط الانحدار في مرحلة دراسة صدق الاختبار المستخدم في التنبؤ، إذ يمكن استخدام قيمة معامل الارتباط بين هذا الاختبار والاختبار المحك، وكذلك قيمة المتوسط والانحراف المعياري لدرجات كل منهما في التوصل إلى معادلة الانحدار:

حيث تتضمن هذه المعادلة متغيرين أحدهما المتغيَر المتنبئ x والآخر المتغير المتنبأ به 'Y، أما بقية رموز المعادلة وهي  ،  ،  ، ، r يتم حسابها في مرحلة دراسة الصدق. ويلاحظ أن:

 و  : المتوسط الحسابي والانحراف المعياري لدرجات عينة الأفراد في المتغيَر المتنبئ.

و : المتوسط الحسابي والانحراف المعياري لاختبار المحك المتنبأ بها في العينة التي تكون درجات أفرادها في الاختبار التنبؤي .

أما الصدق التلازمي فيشير إلى العلاقة بين درجات اختبار وقياس محكي طُبَق الاثنان في الوقت نفسه، مثلا إذا تقدم المتكوَن (المعلم) لاختبار الورقة والقلم في المعرفة التدريسية ومن ثم أجريت عليه ملاحظة لتقدير أدائه أثناء عملية التعليم. فالعلاقة الايجابية يمكن أن تكون مؤشرا للصدق التلازمي لاختبار المعرفة التدريسية، حينها يتعلق بدرجة اقتران تباين درجات الاختبار بتباين اختبار آخر يطبق في الوقت نفسه تقريبا وبالتالي يهتم الصدق التلازمي بالوصف مقارنة الصدق التنبؤي الذي يهتم بالتنبؤ.

على سبيل المثال يمكن للمعلم أن يقارن درجات اختبار تحصيلي مقنن في مجال دراسي معين بدرجات اختبار تحصيلي يعده بنفسه لتلاميذه في مجال معين، تعتمد خطوات تقدير الصدق التلازمي على تطبيق الاختبار المراد التحقق من صدقه التلازمي، ثم الحصول على درجات الأفراد في المحك بعدها إيجاد معامل الارتباط بين مجموعتي الدرجات.

تتأثر قيم معامل الصدق المرتبط بمحك بعوامل متعددة يجب على مستخدمي الاختبارات والمقاييس ومتخذي القرارات مراعاتها عند تفسير البيانات المتعلقة بهذا النوع من الصدق، وهي: مدى تجانس عينة الأفراد، ثبات درجات المحك، تأثر المحك بمتغيرات أخرى مثل، التحيَز، عدد بنود الاختبار التنبؤي، المدة الزمنية الفاصلة بين تطبيق الاختبار التنبؤي واختبار المحك، عدد أفراد عينة المختبرين.

4. أدلة تعتمد على المفهوم

مصطلح صدق التكوين الفرضي قدمه Cronbach & Meehl (1955) ونال اهتماما وقبولا متزايدا من جانب الباحثين في القياس خاصة في السنوات الأخيرة، وذلك نتيجة غموض في كثير من التكوينات الفرضية أو المفاهيم السيكولوجية الذي نتج عنه صعوبة في تطوير اختبارات ومقاييس أكثر صدقا. يتناول صدق التكوين الفرضي العلاقة بين نتائج الاختبارات وبين المفهوم النظري الذي يهدف الاختبار لقياسه، مثل مفاهيم الذكاء، القلق، الدافعية للإنجاز، الإبداع، الانبساط-الانطواء...وغيرها. 

يركز صدق التكوين الفرضي على ثلاثة عناصر الاختبار، والسمات المراد قياسها، وماذا يقيس الاختبار من وجهة نظر القائم بإعداده أي أن هذه العناصر تتعلق بالتكوين الفرضي والتفسير والنظرية التي يستند إليها التفسير. ويتضمن صدق التكوين الفرضي تجميع أدلة من سلسة دراسات تتضمن الخطوات التالية:

1- صياغة فرضية أو أكثر تبيَن الاختلافات المتوقعة في الخصائص الديموغرافية أو محكات الأداء أو مقاييس الأبنية الأخرى ذات العلاقة بمحك أداء تم تصديقه، هذه الفرضيات يجب أن تعتمد على نظرية مصاغة بوضوح يقع البناء ضمنها، وتزوَدنا بتعريف خاص للبناء.

2- اختيار أو تطوير أداة قياس تتألَف من بنود تمثَل سلوكات مخصصة وواضحة بشكل حسي للبناء.

3- جمع بيانات تجريبية تسمح باختبار العلاقة الافتراضية.

4- تحديد ما إذا كانت البيانات مطابقة للفرضية مع الأخذ بعين الاعتبار مدى إمكانية تفسير النتاجات الملاحظة بواسطة النظريات المنافسة أو التفسيرات البديلة.

من الواضح من الخطوات السابقة أن صدق الاختبار وصدق نظرية البناء الذي نهتم به لا يمكن الفصل بينهما، فإذا كانت العلاقة المفترضة مثبتة كما تنبأت به النظرية فان كلا من البناء والاختبار الذي تقيسه مفيدا، وإن لم نتمكن من إثبات الفرضية بواسطة دراسة الصدق فان مطوَر الاختبار لا يستطيع معرفة ما إذا كان هناك قصور في البناء النظري أو الاختبار الذي يقيسه أو كلاهما.

يتطلب جمع أدلة عن صدق التكوين الفرضي من مصادر متعددة أكثر من أي أسلوب صدق آخر، وتعدد أساليب جمع الأدلة منها: دراسات تعتمد على الارتباطات، دراسات تعتمد على التجريب، دراسات تعتمد على التحليل المنطقي، دراسات تعتمد على تباين طرق القياس.

تهتم الدراسات الارتباطية بتحديد طبيعة الفروق بين الأفراد الذين يحصلون على درجات مرتفعة في الاختبار والأفراد الذين يحصلون على منخفضة، وتحليل العلاقات القائمة بين درجات مجموعة من الاختبارات للكشف عن السمات التي تشترك في قياسها واختلافها عن غيرها من السمات.

أما الدراسات التجريبية فتهدف إلى معرفة التغيَرات التي تحدث في أداء الفرد في اختبار معين نتيجة التأثير التجريبي في أحد المتغيرات المتعلقة بالفرد للتحقق من صحة فرض معين يتعلق بما يقيسه الاختبار.

وتركز الدراسات المنطقية على محتوى الاختبار وطريقة تصحيحه أو تقدير درجاته، والعوامل التي تؤثر على الدرجات، وتركز أخرى على تباين ملاحظات الفرد في البناء عبر طرائق قياس مختلفة من خلال عناصر تحليل التباين الناتجة عن تطبيق نظرية إمكانية التعميم.

4.1. طرق تعتمد على الارتباطات

تتعد الطرق المستخدمة في دراسات صدق التكوين الفرضي اعتمادا على الارتباطات، من بين هذه الأساليب:

- التمييز بين المجموعات: تهدف الطريقة إلى المقارنة بين مجموعتين مختلفتين في ضوء الدرجات التي يحصل عليها الأفراد في اختبار معين، حيث يتوقع اختلاف درجات الأفراد في الاختبار بين المجموعتين (Crocker & Algina, 1986).

فإذا أردنا التحقق مثلا من صدق التكوين الفرضي لاختبار يقيس جودة الحياة عند المصابين بالسرطان، فانه يمكن اختيار مجموعتين من الأفراد استنادا إلى تشخيص الأخصائيين النفسيين بحيث تكون هذه السمة مرتفعة لدى إحدى المجموعتين ومنخفضة لدى الأخرى، حينها يطبق الاختبار على المجموعتين. فإذا تبين وجود فروق جوهرية بين درجات كل من المجموعتين، فانه يمكن اعتبار ذلك أحد أدلة صدق التكوين الفرضي للاختبار، ويُحتفظ حينها بالبنود التي ميَزت بدرجة أكبر بين المجموعتين.

- الارتباط بين الطرق والسمات: يمكن للنتائج التي نحصل عليها في الاختبارات أن ترجع أيضا إلى السمة المقاسة أو طريقة القياس (استبيان، قائمة ملاحظة، بطاقة تقرير ذاتي، مقابلة...). فإذا درسنا السمة نفسها أو سمات متباينة بطرق مختلفة فانه ربما نحصل على نتائج مختلفة، لذلك يجب دراسة أكثر من سمة وأكثر من طريقة معا، أي ندرس ما يسمى بالصدق التقاربي والصدق التمايزي. ففي الصدق التقاربي ننظر إلى الارتباطات بين السمات نفسها إذا أجري قياسها بطرق مختلفة، وفي الصدق التمايزي ننظر إلى الارتباطات بين سمات متباينة إذا أجري قياسها بطريقة واحدة.

فالأسلوب الأول (الصدق التقاربي) يمكن استخدام عناصر تحليل التباين للتعرف ما إذا كانت درجات الفرد على البناء لا تتباين عبر طرائق القياس المختلفة، فقد اقترح Kane (1982) استخدام هذه الطريقة من خلال تحليل عناصر التباين الناتجة عن تطبيق "نظرية إمكانية التعميم". مثلا أثناء تقييم أداء الطلاب في العلوم باستخدام طرق قياس مختلفة (الملاحظة، دفاتر الكتابة، المحاكاة بواسطة الكمبيوتر، الإجابة القصيرة) وسوف نعتبر أن البناء أكثر أهمية أو قابلية للتعميم فيما لو كانت درجة المفحوص النسبية نفسها إذا استخدمت طرق قياس مختلفة، ويشير  Kane (1982) أن معامل إمكانية التعميم الذي نحصل عليه من تطبيق نظرية إمكانية التعميم هو معامل للصدق مع ملاحظة أنه يمكن تفسيره على أنه متوسط معامل الصدق التجميعي الناتج عن الاختيار العشوائي لطرائق مختلفة تقيس السمة نفسها من نطاق الطرائق المختلة. 

أما الأسلوب الثاني (الصدق التمايزي) الذي يستند إلى الارتباطات يعتمد على إيجاد معامل الارتباط بين درجات اختبار ويفترض أن يقيس تكوينا فرضيا معينا، ودرجات اختبار آخر بيَنت الأدلة المتعددة أنه يقيس التكوين الفرضي ذاته. مثلا، اختبارات الذكاء التي يقوم الباحثون ببنائها تعتمد على إيجاد ارتباط درجات الاختبار الجديد بدرجات اختبار شائع الاستخدام ونال كثيرا من دراسات الصدق، مثل اختبار Sanford-Binet أو اختبار Wechsler للذكاء، فإذا وجد قيمة معامل الارتباط مرتفعة فانه يُعدَ دليلا على صدق التكوين الفرضي.

- التحليل العاملي: يتناول أسلوب التحليل العاملي العلاقات القائمة بين الاختبار ومجموعة أخرى من الاختبارات بدلا من اختبار واحد، ويستخدم في ذلك أحد الأساليب الإحصائية متعددة المتغيرات يسمى "التحليل العاملي"، والتي يهدف إلى تحليل العلاقات وذلك بتكوين مصفوفة لقيم معامل الارتباط بين درجات الاختبار، ودرجات اختبارات أخرى مناسبة، وإجراء تحليل إحصائي لهذه المصفوفة لتحديد أقل عدد من العوامل (التكوينات الفرضية) التي تسهم في تفسير التباين في قيم معاملات الارتباط داخل المصفوفة، وكذلك العوامل التي تسهم في الأداء في كل من هذه الاختبارات.

يوجد تطبيقين عامين في صدق التكوين الفرضي باستخدام التحليل العاملي:

1)- يتم معالجة مصفوفة الارتباطات الداخلية للبنود لتحديد ما إذا كانت الاستجابات على البنود تتجمَع معا في نمط معين يمكن التنبؤ به أو منطقي في ضوء التركيب النظري للبناء الذي نهتم به، وتحدَد ما إذا كانت الأبنية المحددة تجريبيا من خلال التحليل العاملي مناظرة للأبنية النظرية التي افترضها مطوَر الاختبار.

2)- يمكن معالجة مصفوفة ارتباطات مجموعة اختبارات أو قياسات مختلفة لتحديد مدى ارتباط الدرجات الملاحظة الذي يُعزى إلى تباين عامل مشترك واحد أو أكثر، وبالتالي التعرف ما إذا كانت الاختبارات الفرعية أو الاختبارات التي يُفترض أن تقيس البناء نفسه ثم تحديدها على أنها تقيس عاملا مشتركا.

- مصفوفة السمات-الطرق المتعددة: ليس من الضروري الاقتصار على التعرف على العلاقات الموجبة بين الاختبار الجديد الذي يفترض أن يقيس تكوينا فرضيا معينا وغيره من الاختبارات المشابهة التي تقيس التكوين الفرضي نفسه، وإنما أيضا التعرف على علاقته ببعض الاختبارات أو المقاييس التي لا تقيس هذا التكوين الفرضي. طوَر الأسلوب من طرف Campell & Fiske (1959) للتحقق من ذلك اعتمدا فيه على مصفوفة تسمى "مصفوفة السمات-الطرق المتعددة" التي يمكن باستخدامها للكشف عن علاقات الاختبار باختبارات مشابهة للتوصل إلى الصدق التقاربي، وعلاقته باختبارات مختلفة عنه للتوصل إلى الصدق التمايزي للاختبار.

يجب على الباحث في هذه الطريقة أن يفكر في طريقتين أو أكثر لقياس البناء الذي يهتم به، إضافة إلى تحديد بناءات أخرى مختلفة تماما يمكن قياسه بشكل مناسب بالطرائق نفسها المطبقة على البناء، وباستخدام عينة واحدة من الأفراد يتم الحصول على قياسات لكل بناء بكل طريقة، ثم تُحسب الارتباطات بين كل زوج من القياسات، وكل معامل ارتباط يعرف على أنه أحد الأنواع الثلاثة الآتية:

1)- معاملات الثبات: هي معاملات ارتباط بين قياسات البناء نفسه باستخدام طريقة القياس نفسها، ويجب أن تكون عالية.

2)- معاملات الصدق التجميعي: هي معاملات ارتباط قياسات البناء نفسه باستخدام طرائق قياس مختلفة، ويجب أن تكون عالية لكن احتمالية الضعف الناجمة عنه عدم ثبات طرائق القياس يجب أخذها بعين الاعتبار.

3)- معاملات الصدق التمايزي: هي معاملات ارتباط بين مقاييس بناءات مختلفة باستخدام طريقة القياس نفسها، ويُطلق عليها اسم معاملات الطريقة الواحدة-السمات المتجانسة، وهذه يجب أن تكون أقل بصورة  أساسية من كلا معاملات الثبات أو معاملات الصدق التجميعي.

من أجل تسهيل المقارنة بين الأنواع المختلفة من المعاملات المحصلة يتم ترتيب المعاملات في مصفوفة السمات-الطرق المتعددة.

4.2. طرق تعتمد على التجريب

تعتمد هذه الطرق على التدخل التجريبي لإحداث تغييرات في درجات الأفراد في اختبار ما كوسيلة للتعرف على مدى تأثَر الأداء بمعالجات أو متغيرات معينة مما يساعد في تأكيد بعض التفسيرات المتعلقة بنتائج الاختبار أو رفضها، فإذا تأثَرت درجات الاختبار بمؤثرات معينة يؤدي ربما إلى الحد من تفسير الدرجات مما يضفي بعض الشك على صدق التكوين الفرضي للاختبار.

على سبيل المثال التحقق من صدق التكوين الفرضي لمقياس "القلق" من المهم تحديد مدى قدرة المقياس على تزويدنا بنتائج تتفق مع نظرية معينة تتعلق بالقلق، فإذا أوضحت النظرية أن القلق يزداد في موقف معينة تثير الإحباط فانه يمكن إجراء تجربة لتحديد ما إذا كان الأفراد الذين يواجهون أحد هذه المواقف يحصلون على درجات مرتفعة في المقياس أكثر من الذين لم يواجهوا هذا الموقف. هذه الدراسات عبارة عن دراسات تجريبية من حيث التصميم، ويهدف التطبيق على الأفراد الذين تم إخضاعهم لمعالجة معينة صُمَمت لتغيير موقفهم على البناء عن أولئك الذين لم يتعرضوا للمعالجة، فان لم توجد فروقات بين المجموعتين فان التفسيرات المحتملة هي فشل في النظرية أو البناء أو كلاهما، أو عدم ملاءمة الأداة في قياس البناء أو فشل في المعالجة أو كلاهما.

4.3. طرق تعتمد على التحليل المنطقي

تعتمد هذه الطرق على الفحص الدقيق للاختبار والأداء المطلوب، وإحداث تكامل بين نتائج هذا الفحص وبين النظرية التي يستند إليها الاختبار وآراء المختبرين الذين سبق أن اختبروا باختبارات مشابهة، ويعتبر Cronbach أن التحليل المنطقي من أهم مصادر التوصل إلى فروض بديلة فيما يتعلق بالأداء في الاختبارات، فالمحكم الذي لديه خبرة سابقة بالأخطاء التي شابت الاختبارات السابقة يمكنه أن يكتشف جوانب الضعف في أداة القياس الجديدة. كما يمكن الاستعانة بأسلوب تحليل العمليات التي يستخدمها الأفراد في أدائهم أو في التوصل إلى إجاباتهم عن بنود الاختبار، لذلك عادة ما يرفق على سبيل المثال في اختبارات تقييم الأداء بتعليقات أو أسئلة تطلب من الأفراد تبرير اختياره للإجابة أو تبرير إجابته عن المهمات المطلوبة.

يساعد التكوين الفرضي في تحديد السمات التي يهدف الاختبار لقياسها، كما يساعد في بناء وتمحيص النظريات التربوية والسيكولوجية، وذلك عن طريق جمع أدلة ومعلومات متعددة لتغطية التكوينات الفرضية باستخدام الأساليب السابقة. ولأن صدق التكوين الفرضي يمكن تطبيقه على جميع أنواع الاختبارات وعلى نطاق واسع من استخدامات درجات الاختبارات فان التمييز بينه وبين الأسلوبين الآخرين للصدق قد يكون مصطنعا، لأن النوع أكثر ملاءمة للصدق يبقى محكوما بأنواع الاستدلالات المراد استنباطها من درجات الاختبار.

اتضح أن أنواع الصدق الثلاثة؛ صدق المحتوى والصدق المرتبط بمحك وصدق التكوين الفرضي ليست متباينة وإنما جوانب متكاملة يتم التحقق بواسطتها من تأييد تفسيرات واستخدامات الدرجات المحصلة من أدوات القياس، لذلك فان الفصل بين هذه الجوانب أي دراسة أحدهما بدون أخرى يؤدي إلى أدلة غير كافية حول الصدق.

3- العوامل المؤثرة على الصدق:

أشرنا في البداية إلى أن ثبات درجات الاختبارات تتأثر بعوامل: طول الاختبار، وتجانس عينة المفحوصين، وحدود الزمن، وخصائص بنود الاختبار، وموضوعية التصحيح. يمكن لهذه العوامل أيضا أن تؤثر على درجات صدق الاختبارات لأن معظم طرق تقدير الصدق تعتمد على التجريب الذي من خلاله نتحصل على درجات الاختبار.

كما يتأثَر الثبات بمصادر خطأ متعدَدة يمكن أيضا للصدق أن يتأثَر بمصادر خطأ استدلالاتنا وتفسيراتنا حدَدها Messick (1995) في مصدرين أو تهديدين أساسيين رئيسيين هما: ضعف تمثيل التكوين الفرضي والتباين غير الملائم للتكوين الفرضي. يتعلَق التهديد الأول للصدق بمحدودية وضعف شمولية المحتوى الاختبار، والأبعاد، أو الأوجه المتصلة بالتكوين الفرضي موضع الاهتمام، ويتعلَق التهديد الثاني باتساع إضافي للتباين غير الملائم وغير المرتبط بتفسير التكوين الفرضي.

وقد تناولت وثيقة "معايير العملية الاختبارية التربوية والنفسية (1999) المصدرين وأشارت إلى ضعف تمثيل التكوين الفرضي إلى الدرجة التي يفشل فيها الاختبار في قياس التكوين الفرضي، وأشارت إلى التباين غير الملائم للتكوين الفرضي إلى الدرجة التي تتأثر بها درجات الاختبار بالعمليات غير جوهرية في التكوين الفرضي المطلوب (AERA, APA & NCME, 1999) .

إضافة إلى هذين العاملين توجد عوامل أخرى يمكن أن تحد أو تخفَض من صدق التفسيرات منها ما يرتبط بخصائص الطلاب (قلق، انخفاض الدافعية، تزييف الإجابة) ومنها ما يرتبط بإجراءات تطبيق الاختبار وإجراءات تقدير الدرجات (تقديم تعليمات غير مناسبة، محدودية الوقت، عدم اتساق أو تحيَز التقديرات) ومنها ما يرتبط بالتعليم والتدريب الخاص للأفراد المختبرين.