الثبات

Site:	Plateforme pédagogique de l'Université Sétif2
Cours:	القياس التربوي وإعداد الاختبارات
Livre:	الثبات

Imprimé par:	Visiteur anonyme
Date:	dimanche 15 février 2026, 15:22

Description

يقول Thorndike (1951) " لا يوجد معامل ثبات واحد وشامل ومطلق للاختبار، تحديد الثبات مشكلة منطقية أكثر منها إحصائية " [Cited in Briesch & al., 2014, p. 13]

1. تعريف الثبات

يقصد بثبات درجات الاختبارات مدى خلوها من الأخطاء غير المنتظمة التي تشوب القياس، اي مدى قياس الاختبار للمقدار الحقيقي للسمة التي يهدف لقياسها، فدرجات الاختبار تكون ثابتة إذا كان الاختبار يقيس سمة معينة قياسا متسقا في الظروف المتباينة التي قد تؤدي إلى أخطاء القياس (عـــلام، 2000).

يُعرَف الثبات وفق الجمعية الأمريكية للبحث التربوي والجمعية الأمريكية لعلم النفس والمجلس القومي للقياس AERA, APA, NCM (1999) بأنه اتساق القياسات من خلال إعادة تطبيق أداة القياس على مجتمع من الأفراد أو الجماعات.

بناء على التعريفين السابقين يشير الثبات إلى اتساق درجات المفحوصين عبر التطبيقات المتكررة لنفس الاختبار أو الصيغ المتكافئة له، والمصدر الرئيسي لعدم اتساق الأداء على الاختبار هو أخطاء القياس العشوائية. بتعبير بسيط فان الثبات يشير إلى الحصول على نفس الدرجات في مختلف ظروف تطبيق الاختبار (إعادة التطبيق، اختلاف صيغ الاختبار، اختلاف البنود، اختلاف التقديرات) على نفس عينة الأفراد.

تتضمن عملية القياس عددا من أبعاد القياس مثلا، بنود، مصححين، فترات، إجراءات تطبيق، ويشير التقييم الثابت إلى اتساق بين مختلف هذه الأبعاد، وعدم الاتساق بين مختلف أبعاد القياس يشير إلى خطأ القياس أو عدم الثبات. فالثبات يعني أن تكون درجات الأفراد المختبرين في التقييم نفسها تحت مختلف الشروط، بمعنى عندما يأخذ المفحوصون مجموعة بنود إلى أخرى، وتصحَح إجاباتهم بمقدَر إلى آخر، وعندما يختبرون في فترة أخرى.

من الناحية النظرية الثبات هو أن تعكس البيانات المستمدة من الاختبارات والمقاييس الجوانب الحقيقية للسمة أو القدرة المقاسة، أي المصادر المنتظمة للتباين ولا تعكس عوامل الصدفة أو العشوائية أي تباين الخطأ. أما من الاحصائية هو نسبة تباين الدرجة الملاحظة إلى تباين الدرجة الحقيقية، أو يشير إلى مربع معامل الارتباط بين الدرجة الملاحظة والدرجة الحقيقية. ويعبر عنه وفق الصيغة التالية:

: تباين الدرجة الحقيقية.

: تباين درجة الخطأ.

: تباين الدرجة الملاحظة لأن الدرجة الملاحظة = الدرجة الحقيقية + درجة الخطأ العشوائي.

بما أن ظروف تطبيق الاختبارات مختلفة فان الأخطاء العشوائية التي تؤثر على الدرجات الملاحظة للأفراد تكون مختلفة، لذلك طورت نظرية القياس طرق عديدة لتقدير ثبات درجات الاختبارات تعتمد على إعادة تطبيق الاختبار، والصور المتكافئة للاختبار، والاتساق الداخلي، وتقديرات المصححين.

2. تحديد الخطأ المعياري للقياس

تتأثر الدرجات الملاحظة للفرد بنوعين من الأخطاء؛ الأخطاء المنتظمة والأخطاء غير المنتظمة (العشوائية). الأخطاء المنتظمة تساهم بدرجة منتظمة في تباين درجات الاختبار وتكون جزء من تباين الدرجة الحقيقية، فدرجة الفرد الحقيقية في الاختبار هي الدرجة الناجمة عن جميع العوامل المنتظمة. أما الأخطاء العشوائية هي الاخطاء التي لا ترتبط بأداء الفرد في الاختبار، وتؤثر بدرجات متفاوتة في معامل ثبات الاختبار، وهناك مصادر متعددة للأخطاء العشوائية، تتعلق بأداة القياس، وإجراءات تطبيق الاختبار وتصحيحه، والأفراد المختبرين (عـلام، 2000).

الخطأ المعياري للقياس عبارة عن كيان معياري للدرجات يجب أن يُؤخذ بعين الاعتبار أثناء تقييم جودة أدوات القياس (Cardinet, Sandra & Pini, 2010). ويعتبر من الجوانب المهمة في تقدير دقة القياس لأنه يجعل من درجة الفرد الملاحظة تختلف في أغلب الأحيان عن درجته الحقيقية بسبب تأثَر الدرجة الملاحظة بمصادر أخطاء متعددة. فإذا استطعنا تحديد قيمة الأخطاء العشوائية التي أثَرت في الدرجة الملاحظة لكل فرد من الأفراد المختبرين، فانه يمكن إيجاد الانحراف المعياري لدرجات الخطأ، والقيمة الناتجة من تقدير الانحراف المعياري لدرجات الخطأ تسمى الخطأ المعياري للقياس (عـلام، 2000(Bertrand & Blais, ; 2004 ;

الخطأ المعياري للقياس كيان نظري غير قابل للملاحظة، ونعرف أن متوسطه يُمثَل الخطأ المعياري لمجموعة الأفراد لأننا لا نستطيع في الحقيقة ملاحظة درجة الخطأ لكل فرد من أفراد المجموعة إلا إذا أعيد تطبيق الاختبار على الفرد نفسه عدة مرات، وهذا غير ممكن، ولكن يمكن تقدير قيمته إذا عرفنا قيمة الانحراف المعياري للدرجات الملاحظة وقيمة معامل الثبات. ويرمز للخطأ المعياري للقياس بالرمز SEM أو بالرمز .

يمكن الحصول على قيمة الخطأ المعياري للقياس من قيمة معامل الثبات وفقا للصيغة التالية:

: الخطأ المعياري للقياس.

: الانحراف المعياري لدرجات الاختبار.

: معامل الثبات المقدر.

يعتبر تقدير الخطأ المعياري للقياس من المساهمات الأساسية التي ساعدت على ظهور نظريات القياس، فمن أجل تفسير دقة نتائج القياس فان الخطأ المعياري للقياس يساعد في الحصول على معلومات ملموسة وقابلة للتفسير مباشرة حول ثبات النتائج المحصل عليها من أدوات القياس.

3. طرق تقدير الثبات

توجد عدة طرق لتقدير ثبات الاختبارات والمقاييس التربوية والنفسية تبعا لطبيعة خطأ القياس المراد تقييم أثره على الدرجة الملاحظة للفرد، فإذا أردنا التأكد من مدى استقرار الدرجات عبر الزمن نستخدم طريقة الاستقرار (التطبيق-إعادة التطبيق)، وإذا أردنا التأكد من تكافؤ درجات الاختبار باختبار آخر موازي نستخدم طريقة التكافؤ، وإذا أردنا التأكد من اتساق بنود الاختبار نستخدم طريقة الاتساق الداخلي...وهكذا.

3.1. طرق تعتمد على تطبيق اختبارين

1- طريقة التطبيق-إعادة التطبيق (الاستقرار):

تعتمد الطريقة على تطبيق الاختبار على عينة من الأفراد ثم يُعاد تطبيق نفس الاختبار على نفس العينة في نفس الظروف بعد فترة زمنية معينة. يعتبر التطبيق الأول قياسا موازيا للتطبيق الثاني وتسمى هذه الطريقة أيضا بالاستقرار عبر الزمن يقدَر الثبات من خلالها بحساب معامل الارتباط Pearson بين درجات التطبيقين. يبدو من السهل تطبيق طريقة إعادة الاختبار لكن يجب الأخذ بعين الاعتبار بعض عناصر السياق الأساسية قبل إجراء التجريب الذي يهدف إلى تقدير الاستقرار:

1- يجب ضمان أن تقدير الثبات ملائم لطبيعة الاختبار.

2- يجب أن تكون العينة المختارة لهذا التجريب ممثلة للمجتمع المستهدف من الاختبار.

3- يجب أن تعكس شروط التجريب (حدود الوقت، المكان، الضجيج...) حتى يطبق الاختبار بشكل عادي.

4- يجب أخذ بعين الاعتبار مسافة الوقت بين التطبيقين.

يمكن التذكير بصيغة حساب معامل الارتباط بيرسون:

n : عدد أفراد العينة.

x: درجات الأفراد في التطبيق الأول.

y : درجات الأفراد في التطبيق الثاني.

2- طريقة الصور المتكافئة:

يعتمد تقدير الثبات على الارتباط بين مجموعتين من القياسات، لذلك فان معامل الثبات يعتمد على استخدام صيغتين متكافئتين أو متوازيتين للاختبار على نفس الأفراد. فإذا توفرت صيغتين متكافئتين لاختبار معين مثلا، A و B فان الثبات يتعلق باتساق درجات كل من الصيغتين، ويصبح تقدير الثبات ينتج من حساب معامل الارتباط بيرسون بين صيغتي الاختبار. وتتطلب هذه الطريقة أن تكون بنود صيغتي الاختبار من نفس النوع وذات مستوى صعوبة متساوية وتنتمي إلى نفس نطاق المحتوى.

3- طريقة الاستقرار والتكافؤ:

يمكن استخدام الطريقة عندما نريد أن نجمع بين طريقتين: طريقة معامل الاستقرار وطريقة التكافؤ، وتؤدي إلى قيم تقديرية لمعامل الثبات أقل من الطريقتين السابقتين لأنها تجمع بين الأخطاء العشوائية التي تؤثر في كل منهما لأنها تعكس الأخطاء الناتجة عن اختلاف بنود صيغتي الاختبار وكذا اختلاف الدرجات الناتجة عن التغيرات التي تحدث للأفراد في السمة التي يقيسها الاختبار. وتطبق إحدى صيغ الاختبار ثم بعد فترة زمنية (تكون طويلة نسبيا) تطبق الصيغة الأخرى. وتستخدم في تقدير معامل الثبات معادلة بيرسون بين مجموع الدرجات المحصلة.

3.2. طرق تعتمد على تطبيق اختبار واحد

تُعرف بطريقة التجزئة النصفية التي يطبق فيها مستخدم الاختبار ومطوَره صيغة واحدة من الاختبار على المفحوصين، وبعد تصحيح الاختبار يجزئ إلى نصفين أو فرعين يتألف كل جزء من نصف الاختبار الأصلي من حيث الطول، ولهذا عند تطبيق اختبار مؤلف من (40) بندا فانه يجزأ إلى نصفين كل منهما مؤلف من (20) بندا. وتجد أربعة طرق شائعة لتجزئة الاختبار إلى نصفين هي:

1- اختيار البنود الفردية لتؤلف الاختبار الفرعي الأول والفقرات الزوجية لتؤلف الفرعي الآخر.

2- ترتيب البنود وفقا لمستوى صعوبتها ثم اختيار البنود الفردية لتؤلف الاختبار الفرعي الأول والبنود الزوجية لتؤلف الاختبار الفرعي الآخر.

3- اختيار بنود كلا النصفين عشوائيا.

4- تجزئة الاختبار إلى جزأين بحيث تكون هناك مزاوجة بين بنود كلا الجزأين من حيث المحتوى.

بعدها يصحح كلا النصفين مستقلا عن الآخر ويحسب معامل الارتباط بين درجات المجموعتين الفرعيتين من البنود كمؤشر لثبات الاختبار، وتوجد العديد من صيغ حساب معامل الثبات وفق طريقة التجزئة النصفية، منها:

- صيغة Spearman-Brown:

تعتمد هذه الصيغة على حساب معامل الارتباط بيرسون بين نصفي الاختبار، ثم إدخال معامل الثبات باستخدام صيغة سبيرمان-براون للحصول على القيمة المصححة لمعامل ثبات الاختبار الكلي. وعند تطبيق معامل الارتباط لنصفي الاختبار تكتب الصيغة على النحو التالي:

: معامل الارتباط المعدل للاختبار الكلي

: معامل ارتباط نصفي الاختبار.

يجب على مستخدمي صيغة سيبرمان-براون ملاحظة أنها طريقة تعتمد أساسا على افتراض توازي نصفي الاختبار، فكلما تحرى المبدأ كانت النتائج أكثر دقة، وكلما انحرفت عن الافتراض بشكل أكبر كلما كانت النتائج أقل دقة.

- صيغة Rulon:

تعتمد الطريقة على تباين درجات نصفي الاختبار عوضا عن معامل الارتباط بيرسون، فهي طريقة تتميز بالسهولة والسرعة في تقدير معامل الثبات، كما أنها طريقة بديلة تتطلب استخدام فرق الدرجات بين نصفي الاختبار أي D = A - B حيث تمثل A درجة الفرد على نصف الاختبار الأول وB درجة الفرد على نصف الاختبار الثاني. ويستخدم تباين فروق الدرجات على أنه تباين الخطأ في الصيغة المحددة لمعامل الثبات:

: تباين الفرق بين الدرجات الفردية والدرجات الزوجية.

: تباين الدرجات الكلية للاختبار.

- صيغة Guttman:

تستخدم الطريقة أيضا في تقدير معامل ثبات الاختبار بواسطة التجزئة النصفية بين الاختبار الفرعي الأول والاختبار الفرعي الثاني، كما أنها تصلح عندما لا تتساوى الانحرافات المعيارية لنصفي الاختبار. وتحسب قيمة الثبات وفق هذه الطريقة بالصيغة التالية:

: تباين درجات الاختبار الفردي.

: تباين درجات الاختبار الزوجي.

: تباين الاختبار الكلي.

3.3. طرق تعتمد على التباين المشترك بين البنود

تتميَز طرق تقدير الثبات بواسطة التجزئة النصفية بالبساطة والسهولة لأنها تخضع إلى طريقة تقسيم الاختبار، لذلك ابتكرت طرق جديدة بعد الفترة التي ظهرت فيها طرق التجزئة النصفية تعتمد بالأساس على مدى اتساق بنود الاختبار أي تعتمد على الارتباطات أو التباينات الداخلية بين البنود. وتتمثل في ثلاثة طرق شائعة الانتشار هي طريقة ألفا كرونباخCronbach α وطريقتي كيودر-ريتشاردسون Kuder-Richardson (20 و21)، وطريقة تحليل التباين لهويت Hoyt.

1- صيغة Cronbach α:

في بداية الخمسينات عرض كرونباخ تركيبا شاملا ومناقشة للطرق المختلفة المستخدمة في تقدير التجانس الداخلي وربطها جميعا في صيغة تعرف اسم معامل Cronbach α وهي على النحو التالي:

K: عدد بنود الاختبار.

: مجموع تباين بنود الاختبار.

: تباين الاختبار الكلي.

يمكن استخدام صيغة ألفا كرونباخ لتقدير التجانس الداخلي للبنود ثنائية التصحيح أو الدرجات ذات المدى الواسع من الدرجات مثل اختبارات المقال أو استبيانات الاتجاهات.

2- صيغتي Kuder-Richardson:

تعتبر إحدى الطرق المعروفة التي اشتقها كيودر-وريتشاردسون كحل لمشكلة التجزئة النصفية التي فشلت في إعطاء نتيجة واحدة لاختبار معين، فالدراسة التي قدماها كأرضية تتضمن صيغتين تعرف حاليا بصيغة (20 KR) وصيغة (21 KR) واتخذت هذه الأسماء من الخطوات المرقمة في الاشتقاق الذي نشر في المجلة التي نُشر فيها المقال.

حيث أن صيغة (20 KR) تكتب كما يلي:

k: عدد بنود الاختبار.

: مجموع نسب ضرب معامل الصعوبة في معامل السهولة.

: تباين الاختبار الكلي.

هذه الصيغة مكافئة لصيغة معامل ألفا كرونباخ عندما يتم تعويض بـ نلاحظ أن المجموع يشير إلى أن تباين كل بند ينبغي حسابه أولا ثم جمع البنود جميعها.

بافتراض تساوي صعوبة البنود جميعها اشتق Kuder_Richardson صيغة أبسط ولا تتطلب حساب صعوبة وسهولة كل بند، حيث يمكن كتابة صيغة (21 KR) على النحو التالي:

: متوسط الدرجة الكلية.

k : عدد بنود الاختبار.

: تباين الدرجة الكلية للاختبار.

عندما تتساوى صعوبة بنود الاختبار فان تقديرات الثبات في كلا من الصيغتين (20 KR) و (21 KR) تكون متساوية، في حين أنه عندما تختلف صعوبة البنود فان تقدير الثبات عند استخدام صيغة (21 KR) يكون أقل من القيمة المحسوبة باستخدام الصيغة (20 KR).

3- طريقة Hoyt:

استخدم هويت أسلوبا جديدا يختلف عن الأساليب السابقة المذكورة في تقدير معامل الثبات يؤدي إلى نتائج متماثلة لتلك الناتجة من معامل ألفا كرونباخ، ويعتمد على تحليل التباين بمعالجة الأفراد والبنود على أنها مصادر للتباين، وتتطلب طريقة "هويت" معرفة طرق إحصائية أكثر تعقيدا من الطرق الأخرى لتقدير معامل الثبات، وباستخدام رموز تحليل التباين المعياري فان معامل الثبات يحدد على النحو التالي:

MS persons: متوسط مربعات الأفراد المأخوذة من جدول تحليل التباين.

MS residual: متوسط مربعات البواقي المأخوذة من جدول تحليل التباين.

وقد ربط هويت هذه الصيغة بالتعريف النظري لمعامل الثبات، وذلك بملاحظة أن متوسط مجموع المربعات للأفراد MS persons تمثل تباين الدرجة الملاحظة ومتوسط مجموع مربعات البواقي MS residual تمثل تباين الخطأ في التعريف النظري للثبات.

3.4. طرق تعتمد على اتساق تقديرات الملاحظين أو المصححين

تستخدم بعض أدوات القياس مجموعة واحدة من البنود (مثل، قائمة سلوكات في استبانة الأداء) ولكن يتم جمع ملاحظات أو بيانات عن كل فرد من طرف اثنين أو أكثر من الملاحظين الذين يقيمون أداء الأفراد، وفي هذا الموقف يهمنا تجانس الملاحظات أو البيانات عبر المقدرين أو المصححين المختلفين. وتوجد عدة مؤشرات لتقدير معامل الاتفاق أو التجانس بين المقدرين.

ومن أمثلة الاختبارات التي تستخدم في تقدير ثبات تقديرات المصححين أو الملاحظين، اختبار كاندل Kandall لاتساق التقديرات واختبار Cooper للاتفاق بين التقديرات، واختبار كابا لكوهين Kappa de Cohen في حالة تقديرات ثنائية (نجاح-فشل).

تسمح هذه الاختبارات في تحديد الأخطاء الراجعة لعدم اتساق تقديرات الملاحظين والمصححين الناتجة عن الذاتية من خلال التشدد أو التساهل أثناء عملية التصحيح وأثر الهالة، وعدم وضوح موازين التقدير أو الملاحظة، أو فترة ملاحظة أداء الأفراد. وكلما ازدادت قيمة الخطأ الراجعة لعدم اتساق التقديرات انخفض ثبات الاختبار، وكلما قلت قيمة الخطأ ارتفع ثبات الاختبار.