2. أدلة تعتمد على المحتوى
يهدف صدق المحتوى إلى تقييم ما إذا كانت البنود تمثَل نطاق الأداء أو البناء المستهدف بشكل مناسب، يجب أن يكون المحتوى ممثلا تمثيلا جيدا لنطاق البنود الذي يتم تحديده مسبقا، ونقصد بنطاق البنود المعارف والمهارات والعمليات التي يتم معاينتها بواسطة بنود الاختبار. وحسب وثيقة "معايير العمليات الاختبارية التربوية والنفسية" (1999) فانه يتم الحصول على الأدلة المتعلَقة بالمحتوى من خلال الارتباط بين محتوى الاختبار والتكوين الفرضي المستهدف قياسه (AERA, APA & NCME, 1999, P.11).
ويتطلب أن يكون النطاق الشامل للبنود معرفا تعريفا دقيقا وإجرائيا للسمة المراد قياسها، فتحديد الأهداف السلوكية تعدَ خطوة ضرورية في قياس التحصيل، مثلا في اختبار المفردات نادرا ما يهدف مستخدم الاختبار ما إذا كان المفحوص يعرف معاني كلمات محددة فقط، لكنه يهتم بمعرفة المفحوص بالكلمات المشابهة لها. عادة ما يستخدم في صدق المحتوى طريقة هي تحكيم مجموعة من الخبراء المستقلين للحكم ما إذا كانت عينة البنود مناسبة لنطاق القياس، ويتضمن صدق المحتوى على الأقل سلسلة من الخطوات:
1- تحديد نطاق الأداء المستهدف.
2- اختيار فريق من الخبراء المؤهلين في مجال النطاق.
3- التزويد بهيكل بنائي لعملية مطابقة البنود لنطاق الأداء.
4- جمع وتلخيص البيانات الناتجة عن عملية المطابقة.
معظم أساليب تقدير صدق المحتوى تعتمد على الأحكام التقييمية لخبراء المواد الدراسية أو المهتمين بتنمية المهارات والكفاءات التعليمية والمهنية والفنية، وتتعلق هذه الأحكام بتقدير مدى تناظر بين بنود الاختبار والنطاق السلوكي الذي تمثَله هذه البنود.
- يمكن للتأكد من صدق المحتوى إعداد استمارة تشتمل على ميزان تقدير تتضمن الأبعاد الرئيسية المتعلقة بالنطاق السلوكي، مثل محتوى البنود، نوع المهارات ومجالها، ومصادر أو مواد ذات أهمية، ونوع البنود وملاءمتها للمحتوى والمهارة المرجوة. حينها يقوم المحكم بتقييم كل بند من بنود الاختبار في هذه الأبعاد على ميزان التقدير. ويُفضَل الاعتماد على أكثر من محكم للحصول على تقديرات أكثر اتساقا، ويمكن التحقق من ذلك بتحليل التقديرات إحصائيا باستخدام مؤشرات إحصائية تزودنا بدرجة اتساق التقديرات مثل تحليل التباين، معاملات الاتفاق.
- يمكن أيضا التحقق من الصدق امبريقيا وذلك بتطبيق الاختبار على عينة من الطلاب قبل بدء عملية التعليم، ثم إعادة تطبيقه بعد نهايتها وفحص نتائج الاختبار في المرتين للتعرف على ما إذا كان الاختبار يقيس بالفعل المجال الذي اهتمت به عملية التعليم.
يستند تقدير صدق المحتوى إلى ثلاثة فروض صاغها Lenon كالتالي:
1- يجب أن يكون المجال الذي يُختبر فيه الأفراد محدودا بنطاق شامل للبنود الذي تبدو أهميته لهم، ويمكن تعريفه تعريفا دقيقا.
2- يمكن انتقاء عينة من البنود من هذا النطاق بطريقة هادفة ومناسبة.
3- يمكن تحديد عينة البنود وأسلوب المعاينات المستخدم وتعريفها بدقة كافية لكي يتمكن مستخدم الاختبار الحكم على مدى تمثيل عينة البنود للنطاق السلوكي الشامل الذي يقيسه.
- توجد مجموعة من الطرق في تقدير معاملات صدق المحتوى، حدَدها Croker & Algina (1986) في:
1- نسبة البنود المزاوجة للأهداف السلوكية.
2- نسبة البنود المزاوجة للأهداف بتقديرات عالية الأهمية.
3- الارتباط بين الأوزان النسبية للأهداف والبنود التي تقيس هذه الأهداف.
4- معامل التوافق بين البند والهدف.
5- نسبة الأهداف التي لم تقيَم بأي بند في الاختبار.
اقترح المعامل الرابع (4) من طرف Hambelton & Revenelli (1977); Hambelton (1980) الذي يستخدم في تقييم إلى أيَ مدى تكون درجة صدق محتوى بند معين بالنسبة لمجموعة الأهداف. وتعتمد هذه الصيغة على افتراض أنه في الحالة المثالية يجب أن يزاوج البند هدفا واحدا فقط من مجموعة الأهداف، وتعكس طريقة جمع البيانات هذا الافتراض وذلك لأنه تم توجيه الخبراء لمزاوجة البند لكل هدف، وأن يعطوا القيمة (1) فيما لو كانت هناك مزاوجة والقيمة صفر (0) إن لم يكن متأكدا من المزاوجة والقيمة (-1) فيما لو لم يطابق البند مع الهدف بوضوح. ويمكن حساب معامل توافق البند مع الهدف K بالصيغة المبسطة:
N: عدد الأهداف.
: متوسط تقدير الأحكام i على البند k للهدف .
: متوسط تقدير الأحكام على البند k في جميع الأهداف.
أكبر قيمة محتملة لتوافق البند-الهدف تساوي (1.00) عندما يتطابق البند مع هدف واحد ومن قبل المحكمين جميعا، وفي حالة تطابق البند الواحد مع أكثر من هدف فان معامل التوافق يكون أقل من (1.00). في الحالة المثالية يجب أن تكون قيم لكل بند في الاختبار عالية وللهدف الذي صمم لقياسه ومنخفض للأهداف الأخرى.