الصدق: يعتبر الصدق من المعايير الفنية الرئيسية التي يقوم عليها بناء الاختبارات النفسية والتربوية، وقد مر مفهوم الصدق واستخداماته بعدة مراحل وتطورات، فالبدايات الأولى لاستخدام الصدق تركزت على تقييم ما إذا كان الاختبار يقيس ما أعدّ لقياسه، وهذا يعكس التعريف البسيط والكلاسيكي لمفهوم الصدق، غير أن التعريف الحديث يرتبط بالاستخدامات المختلفة لدرجات الاختبار وليس بالاختبار نفسه وعليه فإن الصدق هو صدق استخدام درجات الاختبار وليس صدق الاختبار. وقد عرّفه (Messick, 1988) على أنه "حكم تقييمي شامل، مبني على أدلة تجريبية ومبررات نظرية، على مدى كفاية وملاءمة الاستدلالات والإجراءات المستندة إلى درجات الاختبار" هذ المفهوم اعتمد فيما بعد من قبل وثيقة معايير العمليات الاختبارية النفسية والتربوية (AERA, APA, & NCIME, 1999) في اشتقاق التعريف التالي للصدق" على أنه الدرجة التي تؤيد بها الأدلة والنظرية تفسير درجات الاختبارات التي تتطلبها استخدامات مقترحة للاختبار". وعليه يمكن توضيح الصدق في النقاط التالية:

أ‌-        يشير الصدق إلى تفسير نتائج الاختبار وليس الاختبار نفسه.

ب‌-     يستنتج الصدق من الأدلة المتوفرة وليست المناسبة.

ت‌-     الصدق خاص باستخدام درجات الاختبار مثل استخدام الدرجات في اختيار عينة الأفراد أو توزيعهم أو تقويم أدائهم.

ث‌-     يعبر عن الصدق بدرجة وصفية مثل مرتفع أو متوسط أو منخفض وقد تستخدم الأرقام (معاملات الاتفاق أو الارتباط) لتوضيح الدرجة الوصفية.

وقبل التعرض لمصادر أدلة الصدق في ضوء وثيقة المعايير الصادرة من الجمعية الأمريكية للبحث في التربية، الجمعية الأمريكية لعلم النفس، المجلس القومي للتربية الأمريكي (AERA, APA, & NCIME, 1999)نستعرض أبرز التطورات التاريخية لمفهوم الصدق (النظرية الكلاسيكية والحديثة)، وهذا تفاديا لأي لبس يقع للباحثين ومطوري الاختبارات النفسية والتربوية بسبب اعتماد المراجع الصادرة قبل التحديث الأخير (AERA1999) على التسميات الكلاسيكية لأنواع الصدق (صدق المحتوى، الصدق المرتبط بمحك، صدق التكوين الفرضي) ونذكر أن هذا التصنيف شائع الاستخدام إلى يومنا هذا. سيكون التطرق لنظرية الصدق الكلاسيكية والحديثة في ضوء المراجعات النظرية التي قدمها كل من (تيغزة، 2008) و (Reynolds & Livingston, 2013) و (Goodwin & Leech, 2003)

1-نظرية الصدق الكلاسيكية:

المرحلة الأولى: بدايات هذه النظرية كانت في النصف الأول من القرن العشرين، وتميزت هذه المرحلة بظهور أصناف عديدة وتسميات متباينة لأنواع الصدق، نجم عنه فوضى في التسميات (الصدق التنبئي، الصدق التلازمي الصدق الارتباطي...). طبعت هذه المرحلة بروز منظورين أساسيين على ميدان الصدق هما:

-الاتجاه الإمبريقي(التجريبي): والذي روج للصدق المحكي أو صدق الارتباط بالمحك، الصدق العاملي.

-الاتجاه المنطقي: يعتبر المنطق والأحكام الفردية (الخبرة) كأطر مرجعية لتقدير الصدق. صدق المحتوى انبثق عن هذا الاتجاه.

المرحلة الثانية: تميزت هذه المرحلة بصدور الدليل الارشادي والفني للقياس والاختبارات والذي جاء نتيجة التغيرات التي طرأت على مفهوم الصدق في أوساط الباحثين وكذا تتويجا لانضمام أعضاء الجمعية الأمريكية لعلم النفس التطبيقي إلى الجمعية الأمريكية لعلم النفس.

-1954 صدور الدليل الأول (AERA,APA) بعنوان" التوصيات الفنية للاختبارات النفسية وفنيات أدوات التشخيص" قدم هذا الدليل تصنيف رباعي لأنواع الصدق:

أ‌-        صدق المضمون.

ب‌-     الصدق التنبئي.

ت‌-     الصدق التلازمي.

ث‌-     صدق التكوين الفرضي أو المفهوم.

يعتبر صدق المفهوم إضافة جديدة في ميدان القياس في تلك الفترة، وكان وراء هذا المفهوم وتوضيح دلالته فيما بعد كل من Cronbach وMeehl 1954.

-           1966 صدور الدليل الارشادي الثاني المنقح (AERA, APA): قلص هذا الدليل التصنيف الرباعي للصدق إلى تصنيف ثلاثي:

أ‌-        صدق المضمون.

ب‌-     صدق المحك.

ت‌-     صدق المفهوم.

ظهر في هذا التصنيف تسمية صدق المحك كتسمية جديدة تضم (الصدق التنبئي، والصدق التلازمي). جدير أن نشير إلى أن هذا التصنيف الثلاثي لأنواع الصدق هو المنتشر في ميدان التأليف وتطوير الاختبارات، ولازال يستخدم ويعتمد بشكل واسع في ميدان التدريس أيضا.

-      1974الدليل الارشادي الثالث للقياس: هذا الدليل يشير إلى أنواع الصدق باستخدام لفظ "جوانب الصدق" وعلى هذا فالصدق ليس صفة أو خاصية تقاس قياسا مباشرا، وإنما نستنج الصدق استنتاجا من دراسة جوانب أو أبعاده الثلاثة، وهذه الأبعاد مترابطة فيما بينها من الناحية الوظيفية والمنطقية، وبغية تسهيل مناقشتها عمليا يمكن دراستها على انفراد.

-      1985 الدليل الارشادي الرابع: أبرز توجهات هذا الدليل اعتبار الصدق وحدة واحدة لا تتجزأ، وتبني تعريف جديد للصدق يحمل تغييرا في المفهوم والاستخدام "الصدق يدل على ملاءمة ودلالة وجدوى الاستنتاجات الخاصة المستمدة من الدرجات" واستعمال لفظة "أدلة الصدق" (أدلة صدق المحتوى، أدلة صدق المحك، أدلة صدق المفهوم) بدل أنواع الصدق أو جوانب الصدق التي كانت متداولة سابقا. كما أبقى على التصنيف الثلاثي لأنواع الصدق (تيغزة، 2008). هذا الدليل كشف عن توجهات جديدة في تقدير الصدق والذي يعتمد على تجميع البيانات أو الأدلة وتراكمها لتدعيم الاستنتاجات المستمدة من درجات الاختبار، فهنا يتم تقدير صدق الاستنتاجات التي تكشف عن أوجه استعمال معينة للاختبار وليس تقدير صدق الاختبار ذاته.

2- نظرية الصدق الحديثة:

     التمعن في تطور مفاهيم الصدق وتصوراته واستخداماته عبر المراحل التاريخية التي استعرضناها سابق، يجعلنا ننتبه إلى أنَّ بوادر التغيير بدأت تظهر في الإصدار الأول لدليل معايير العمليات الاختبارية النفسية والتربوية (1954) إلى غاية الإصدار الخامس (1999) والذي حمل تطورات حدثت على مستوى مفهوم الصدق والذي أشرنا إليه في التعريف المقدم للصدق، وكذا اعتبار مفهوم الصدق موحد ولا يتجزأ إلى أقسام أو أنواع. ويعتبرMessck 1994 من مهندسي فكرة وحدة الصدق، وأن هذه الوحدة يتضمنها صدق المفهوم والذي يعنى بدمج متكامل لمصادر أدلة الصدق التي تستهدف تفسير وتأويل وتبيُّن دلالة درجات الاختبار، وهذه النظرة الوحدوية للصدق لا تتنافى مع وجود أدلة متمايزة في تصنيف مصادر أدلة الصدق وطبيعتها التي صنَّفها إلى ست جوانب، ولخصها فيما بعد الدليل الارشادي الخامس في خمسة مصادر لأدلة الصدق والتي نركز عليها في عرض مصادر أدلة الصدق في ضوء النظرية الحديثة لصدق الاختبارات.

*مصادر أدلة الصدق:

-أدلة تعتمد على محتوى الاختبار:

وثيقة المعايير ذكرت بأنه يمكن الحصول على أدلة قيّمة بفحص العلاقة بين محتوى الاختبار والتكوين الفرضي (النطاق الذي صمم الاختبار من قياسه. فصدق المحتوى نحصل عليه من خلال من التحليل المنطقي / التقديري للبنود وصيغة المقياس أو الاختبار وحسب ( Goodwin & Leech, 2003) يستند هذا النوع من أدلة الصدق على التحليلات المنطقية وتقييمات الخبراء لمحتوى الاختبار، والتي تشمل البنود من حيث المهام والصيغة والصياغة والعمليات المطلوبة من المختبرين. بشكل عام، فإنه يعالج أسئلة حول المدى الذي يمثل فيه محتوى القياس نطاق محتوى محددًا.

أنشطة التحقق من الصدق حسب (Goodwin & Leech, 2003)

1. القيام بتحليلات منطقية ومراجعة الخبراء لفحص مدى تمثيل محتوى الاختبار لنطاق المحتوى (التناظر بين محتوى الاختبار والتكوين الفرضي)

2 التحليلات المنطقية ومراجعة الخبراء لفحص مدى ملائمة البنود أو المهام أو الأجزاء الفرعية من المقياس لتعريف التكوين الفرضي / أو الغرض من التدبير.

3 التحليلات المنطقية ومراجعة الخبراء لفحص نجاعة وأهمية ووضوح البنود، وابتعادها عن التحيز.

4 - التحليلات المنطقية ومراجعة الخبراء لفحص ما قد ينتج عنه نقص التمثيل أو الجوانب غير ذات الصلة من القياس لمزايا غير عادلة لمجموعات فرعية واحدة أو أكثر من المجيبين.

     وقد أورد (Holmbeck & Devine, 2009) منهجا أكثر تفصيلا لجمع أدلة صدق المحتوى. يمكن الرجوع للتفصيل أكثر. نلاحظ أن جميع أدلة صدق المحتوى في عادتها تكون نوعية لكن هذا لا يمنعنا من اتخاذ خطوات لتقرير النتائج بطريقة أكثر كمية ففي هذا السياق أشار (Reynolds & Livingston, 2013) إلى أنه يمكن للباحثين تقرير عدد الخبراء ومؤهلاتهم، عدد مرات مراجعة التقييم وتعليقاتهم عليه، ودرجة اتفاقهم على قضايا تتعلق بالمحتوى، ولأثراء هذه الجهود نعتمد معادلة Lawche1975 التي تعكس درجة الاتفاق بين الخبراء الذين يصدرون احكاما تتعلق بالمحتوى، وكذا تحليل الموازين متعددة الأبعاد.

-أدلة تعتمد على عمليات أو سيرورات الاستجابة:

 يذكرWhiston2009 أن أدلة الصدق التي تستند على عمليات الاستجابة "تركز على ما إذا كانت طريقة أداء واستجابة المفحوص تتوافق مع التكوين موضع القياس، مثلا في تقويم ما يحاول قياس الاهتمام المهني، سوف يفحص مطورو الاختبار ما إذا كان الأفراد يجيبون على البند بناءً على ما يرغبون القيام به بدلا من ما يمكنهم فعله" (Whiston, 2009 )فمدى التوافق بين الأنشطة العقلية والانفعالية التي يتكون منها المفهوم، وبين الأنشطة العقلية والانفعالية التي يمارسها الفرد عند إجابته على فقرات الاختبار تمثل إحدى المصادر الهامة لبينات الصدق. ومن الإجراءات التي يمكن أن تتيح هذا النوع من البينات عن الصدق ما يلي:

-تحليل استجابات المفحوصين بطريقة التفكير المسموع أثناء حل المشكلة، أو يصفوا بعد حل المشكلة

العمليات والاستراتيجيات التي استخدموها في الوصول إلى الحل، وذلك بمعرف العمليات (المهارات والاستراتيجيات) التي وظفها المفحوصون أثناء أدائهم للمهام التقويمية لمطابقتها مع العمليات التي يحددها التكوين الفرضي المراد قياسه.

-فحص المنطق الذي قامت عليه إجابات الأفراد، وكذا طرق إجاباتهم (تحليل أسبابها ودواعيها) على بنود الاختبار، وذلك بتحليل أوجه التفسير أو التعليلات التي يحررها المختبرين، أو يصرحون بها شفويا، لتعليل المنطق والطرق التي استعملوها.

-بالنسبة للتقويم البديل الذي يتبنى فقرات أو مهمات أو أنشطة تقويمية واقعية، فلابد من الاطمئنان بأن المقدرين يطبقون محكات تقدير الدرجات بطريقة دقيقة، وأت تقديراتهم لأداء المختبرين لم تتأثر بعوامل خارجية كالتحيز، أو تأويل محكات التصحيح تأويلا خاطئا (تيغزة، 2008).

-إجراء مقابلة مع المختبرين لمعرفة عمليات واستراتيجيات استجاباتهم، وتدوين مؤشرات سلوكية، مثل: زمن الاستجابة، أو حركات العبن، أو حتى تحليل أنواع الأخطاء التي يقعون فيها.

 

-أدلة تعتمد على البنية الداخلية:

فحص البنية الداخلية لاختبار معين تحدد ما إذا كانت العلاقات بين مفردات الاختبار وعناصره متسقة مع التكوين الفرضي المقترح تفسير درجاته (AERA, APA, & NCIME, 1999) فحسب هذه الوثيقة فإن تحليلات البنية الداخلية للاختبار يمكن أن تشير إلى مدى تطابق العلاقات بين بنود الاختبار ومكوناته مع التكوين الفرضي الذي تقوم عليه تفسيرات الدرجات. وهناك عدة طرق كمية لتحليل البيانات:

-تقدير الارتباط بين البنود والدرجة الكلية للمقياس.

-تقدير الارتباط بين مجالات التكوين.

-التحليل العاملي الاستكشافي.

-التحليل العاملي التوكيدي.

-الاتساق الداخلي للبنية الداخلية للاختبار.

المظهر الرئيس لهذا النوع من أدلة الصدق هو أن الباحثين يفحصون إمبريقيا البنية الداخلية للاختبار، ويقارنوا ذلك ببنية التكوين الفرضي موضع القياس، هذا النوع من أدلة الصدق تم تضمينه تقليديا تحت عنوان صدق التكوين الفرضي (Reynolds & Livingston, 2013).

-أدلة تعتمد على العلاقات بمتغيرات أخرى أو أدلة البنية الخارجية: 

نحصل على أدلة صدق البنية الخارجية للاختبار أو المقياس من خلال فحص ودراسة علاقة درجات الأداة موضع الاهتمام بدرجات متغيرات خارجية (مقاييس، أو محكات)، ودراسة ما إذا كان مستوى هذه العلاقات وطبيعتها أو اتجاهها ينسجم ودلالة المفهوم المقاس. ويندرج ضمن هذا النمط معظم التسميات الكلاسيكية للصدق (الصدق التقاربي والتمايزي، الصدق المحكي سواءً التلازمي أو المحكي)، وأهم إجراءات الحصول على أدلة الصدق القائمة على البنية الخارجية ما يلي (Goodwin & Leech, 2003) (تيغزة، 2008) وهذه الأدلة وردت في التصنيفين الصادرين عن (AERA,APA,NCIME,1985,1999):

1 – الدراسة الارتباطية لقوة واتجاه العلاقة بين درجات الاختبار المراد تقدير صدق نتائجه وبين متغيرات خارجية تكون محكية، ويعرف هذا النوع من الصدق، بالصدق التلازمي في النظرية الكلاسيكية.

2. الدراسة الارتباطية لمعرفة مدى قدرة الدرجات التي تم الحصول عليها من المقياس على التنبؤ مع المحكات الخارجية التي يتم قياسها في وقت لاحق.، ويعرف هذا الإجراء في نظرية الصدق الكلاسيكية بالصدق التنبئي.  فالدراسات التلازمية تكون ملائمة بدرجة كبيرة عندما يكون الغرض من الاختبار تحديد الوضعية الراهنة للفرد المختبر، في مقابل التنبؤ بنتائج مستقبلي (Anastasi & Uraina, 1997) ويستخدم في تقدير علاقة درجات الاختبار بمحك طرق متعددة تعتمد على معاملات الارتباط بين الاختبار التنبؤي واختبار المحك، ومعادلة الانحدار في التنبؤ بدرجات الاختبار المحك، إضافة إلى طريقة جداول التوقع، وطريقة نظرية المنفعة.

3-دراسة قوة العلاقة الارتباطية، واتجاهها بين درجات المقياس بالمتغيرات الأخرى (كأن تكون اختبارات أخرى تقيس المفهوم ذاته) التي ينبغي أن يرتبط بها ارتباطا قويا بناء على المنطق النظري الذي قام عليه المقياس. وسمي هذا النوع من البينات في نظرية الصدق الكلاسيكية بالصدق التقاربي.

 4-دراسة قوة العلاقة الارتباطية، واتجاهها بين درجات المقياس بالمتغيرات الأخرى (كأن تكون اختبارات أخرى تقيس مفاهيم أخرى مختلفة) التي ينبغي أن يرتبط بها ارتباطا ضعيفا (قوة العلاقة ضعيفة لا يعتد بها رغم وجود دلالة إحصائية أحيانا) أو ارتباطا غير دال إحصائيا، بناء على المنطق النظري الذي قام عليه المقياس. وسمي هذا النوع من البينات في نظرية الصدق الكلاسيكية بالصدق التمايزي.

5-طريقة تعدد السمات وتعدد الطرق استخدمت في النظرية الكلاسيكية للدلالة على صدق المفهوم، أو الصدق التقاربي والصدق التمايزي.

6-الدراسة التقويمية لفعالية عملية الانتقاء المهني وقرارات الوضع أو التسكين.

7- تقدير مدى مواءمة المحكات وجودتها، بما في ذلك تقدير ثبات درجاتها وصدقها، والصعوبات العملية عند استعمالها، وإمكانية توفرها. وتتأتى أهمية هذه المحكات من إمكانية الحكم على صدق الأداة بناء على مدى ارتباطها بها.

-أدلة تعتمد على عواقب العملية الاختبارية:

هذا النوع من أدلة الصدق يتعلق بالنتائج المتوقعة وغير المتوقعة للقياس على حد سواء الإيجابية والسلبية. وهذه البينة لم تذكر سابقا في دليل معايير العمليات الاختبارية النفسية والتربوية إلاّ في إصدار 1999. متأثرا بأعمالMessick1989) وُتدعى أدلة عواقب العملية الاختبارية أحيانا بصدق النتائج أو المترتبات.

"عادة يتم بناء المقياس بأمل تحقيق بعض المكاسب من استخدام الدرجات، من بين المكاسب الممكن تحقيقها اختيار العلاجات الفعالة لمرض ما، وضع الموظفين في الوظائف المناسبة، منع الأفراد غير المؤهلين من الوصول إلى وظائف، أو تحسن الممارسات التدريسية الصفية. الهدف الأساسي لتقدير صدق درجات المقياس تحديد ما إذا كان تحقيق هذه الفوائد أو المكاسب المنتظرة من عملية القياس يمكن تحقيقها"  (AERA, APA, & NCIME, 1999)

       هناك العديد من الباحثين والمدربين في دورات القياس، يرحبون بالتغييرات الطارئة في دراسة ومعالجة الصدق في ضوء المعايير الجديدة (أدلة الصدق). إن النظرة الثلاثية الكلاسيكية للصدق الواردة في كتب القياس لعدة سنوات، تعد مشكلة لعديد من الأسباب المترابطة. أولا تقسيم الصدق لثلاثة أنواع أو أربعة يشكل مصدر خلط بين صدق التكوين الفرضي والأنواع الأخرى للصدق لدى القائمين على دراسة صدق الاختبار، حيث يتولد لديهم قلق بشأن قدرتهم على التحديد الصحيح لنوع الصدق الملائم. وبذلك يفقدون النظرة الكلية والتكاملية للصدق وتضيع جهودهم في السعي إلى الفرز بين أنواع الصدق بدل البحث في قضايا مهمة متعلقة بالصدق. المشكلة الثانية في النظرة الكلاسيكية للصدق هي أنه يشجع على اتباع نهج "قائمة مرجعية" للمراجعة عند قيام الباحثين بتجميع أدلة الصدق الموجود في دليل الاختبار أو المقالات البحثية. ثالثًا، يميل مخطط التصنيف الثلاثي للصدق إلى الترويج للاعتقاد الخاطئ بأن الصدق هو خاصية ثابتة للمقياس أو الاختبار، وليس خاصية لعينة (Tracey & Glidden-Tracey, 1999). تؤدي هذه المشكلة إلى استخدام تعبيرات غير مناسبة للصدق على سبيل المثال استخدام عبارات مثل، "هذا الاختبار صادق"، وقد ثبت أن هذا الاختبار صادق،" لقد أُثبت صدق هذا الاختبار"، وهكذا دواليك. رابعًا، هذه الطريقة في التفكير في الصدق تتناقض مع المفاهيم التي مفادها أن الصدق هي مفهوم وحدوي وأن صدق التكون هي في الواقع "كل متكامل، وأخيرًا، فإنه يسمح بشكل شمولي للغاية للباحثين ومطورو الاختبارات بالنظرة لجميع أنواع الصدق التقليدية على نفس القدر من الأهمية في جمع مجموعة من الأدلة لدعم الاستدلالات التي سيتم إجراؤها من نتائج الاختبارات.

3- العلاقة بين الصدق والثبات:

يرتبط مفهوم الصدق بمفهوم الثبات ارتباطا وثيقا، حيث لا يمكن أن تتصف درجات الاختبار بالصدق في استخدامات معينة دون أن تكون درجاته متسقة، كما أن مؤشر الثبات يعدَ الحد الأعلى لقيمة معامل صدق درجات الاختبار. وتؤثر قيم معامل الثبات في درجة العلاقة بين الاختبار التنبؤي واختبار المحك، كما تسهم قيمة معامل استقرار درجات الاختبار في زيادة الثقة بصدق التكوين الفرضي للاختبار لأنه يهتم بالثبات النسبي للسمات.

كما يقدَم معامل الاتساق الداخلي دليلا آخر على صدق التكوين الفرضي، لذلك يرى كرونبـاخ وزملائه Cronbach, Glaser & Rajaratnam أن الصدق والثبات مفهومان مترابطان ويمكن أن يندرجا تحت اسم "مقاييس إمكانية التعميم" فالفرق الرئيسي بينهما يكمن في الأبعاد التي نريد التعميم عليها. لذلك تعدَ نظرية إمكانية التعميم التي قام بصياغتها كرونبـاخ وزملائه من التطورات المعاصرة المهمة التي ساهمت في إبراز التكامل بين مفهومي الصدق والثبات.

Modifié le: Wednesday 15 May 2024, 17:50