قيم معامل الثبات ليست قيما مطلقة وانما تعد قيما تقديرية تؤثر فيها عوامل متعددة يجب مراعاتها في تصميم أدوات القياس، وعند انتقاء هذه الأدوات واستخدامها وتفسير نتائجها. فبالإضافة إلى مصادر الأخطاء العشوائية
يجب أخذ بعين الاعتبار بعض العوامل الأخرى هي:
1. طول الاختبار:
درجات الاختبار الأطول أكثر ثباتا من درجات الاختبار الأقصر المؤلف من فقرات متشابهة، لذلك فطول الاختبار أحد المظاهر التي تؤثر بالتأكيد على تباين الدرجة الحقيقية والدرجة الملاحظة، وقـد اشتق Spearman-Brown علاقة بين طول الاختبار و تقدير الثبات، والتي عبّر عنها بالمعادلة التالية:
: الثبات المرغوب للاختبار المعدل.
: الثبات الأصلي للاختبار
: عدد مرات زيادة عدد البنود.
- تساعدنا صيغة العلاقة بين طول الاختبار وتقدير الثبات في التعرف على درجة الدقة التي سوف يصل إليها الاختبار عندما نعدل عدد البنود بنسبة k، فعند زيادة طول الاختبار فانّ قيمة k تصبح أكبر من (1)، وعندما يقل طول الاختبار فان قيمة k تصبح أقل من 1.
- يجب ملاحظة أن زيادة قيمة الثبات الناتجة عن زيادة طول الاختبار تتبع قانون الغلة (ليس بالضرورة زيادة طول الاختبار الى أبعد نقطة معينة سوف يزيد بشكل مناسب في الثبات)، كما أن زيادة طول الاختبار سوف تترتب عليه زيادة في تكلفة كتابة البنود الاضافية والوقت المستهلك على تطبيق وتصحيح الاختبار، كما يشترط زيادة بنود الاختبار أن تكون موازية في المحتوى والصعوبة لبنود الاختبار الأصلي.
- تسمح لنا صيغة Spearman-Brown بتحديد نسبة طول الاختبار الذي يجب زيادته لبلوغ درجة مستهدفة من الثبات، وبتعديل المعادلة السابقة يمكن تعويض قيمة k لتصبح:
: معامل الثبات المرغوب.
: عدد مرات زيادة عدد البنود.
: معامل الثبات الأصلي.
- يجب أن نشير إلى أن صيغة Spearman-Brown تشترط بالنسبة للبنود المضافة أن تكون مكافئة لبنود الاختبار الأصلي، بمعنى لها نفس المحتوى ونفس مستوى الصعوبة.
2. تجانس عينة المختبرين (مدى الفروق الفردية):
بما أن قيمة معامل الثبات تعتمد على تباين الأفراد في درجاتهم الحقيقية ودرجات الخطأ، لذا فتجانس عينة المختبرين يعد مهما في تطوير الاختبار واختياره. فاذا كانت عينة ناشر الاختبار غير متجانسة في السمة المقاسة بدرجة كبيرة فان هذا يؤدي حتما إلى خفض معامل الثبات عند تطبيق الاختبار على عينة أكثر تجانسا. قدم Gullikson (1950) خلاصة للجدل السيكومتري لعدم تجانس عينة المختبرين وأثره على ثبات الاختبار، كما قدم Magnuson (1967) الصيغة التالية للتنبؤ بتغير الثبات نتيجة تغير في تباين العينة:
: تباين العينة الأصلية.
: تباين العينة الجديدة
: تقدير ثبات العينة الأصلية
: الثبات المتنبأ به للعينة الجديدة.
على سبيل المثال أثناء دراسة ثبات أداة قياس معينة فان العديد من الوضعيات التي يمكن أن تنتج مساهمة على خفض الفروق الفردية، فتطبيق اختبار على عينة تمتلك تباينا أقل من المجتمع الأصلي أي عينة منحدرة من وسط مفضل يمكن أن تؤدي إلى الشك في تباين النتائج المحصلة فتكون أقل من التي سوف نحصل عليها بواسطة عينة ممثلة.
تفترض المعادلة تساوي تباينات الخطأ لكلا المجموعتين، وأن التغير في الدرجات الملاحظة يعود إلى الفروق في توزيع الدرجات الحقيقية للمجموعة، حيث أن مستخدم الاختبار لا يمكنه الجزم بتحقيق هذا الافتراض عندما تكون العينة المستخدمة مختلفة بشكل ملحوظ عن العينة الأصلية، ومن الأنسب هنا التحقق من ثبات العينة الجديدة. إذا كانت عينة المفحوصين متجانسة بشكل كبير في السمة المقاسة فان الثبات المحسوب يكون أقل مما لو كانت العينة غير متجانسة.
3. حدود الزمن:
عندما يكون الاختبار موقوتا فان العديد من المختبرين لا يصلون إلى الاجابة على كل البنود، لذا فمدى مجهود المختبر يؤثر بانتظام في أدائه على بنود الاختبار لأن البنود المتروكة تؤثر على درجاته والتي نجدها في آخر الاختبار وتصحح عموما بالدرجة (0). هذا الاجراء سوف يخلق نوعا من التضخم في الارتباط بين البنود الأخيرة، مما يؤدي إلى اتساق أكبر بين البنودـ، والتي في الواقع غير ذلك لأن هذا الاتساق لا يكون راجعا إلى مؤشر أن البنود تقيس نفس الشيء ولكن لأنها متروكة من طرف الافراد المختبرين.
تقدير ثبات اختبارات السرعة أو الموقوتة يجب تفسيره بحذر عندما تتطلب المهام الاختبارية أكثر من قدرة أداء مهام بسيطة بسرعة كبيرة، فتقدير الثبات يحدث مخاطرة نتيجة تزييف الارتباط بين البنود في حالة التجزئة النصفية أو حتى الاتساق الداخلي ويفضل استخدام طريقة الاختبار وإعادة الاختبار التي لا تتأثر بعامل الزمن المحدد للإجابة.
4. خصائص بنود الاختبار:
تؤثر بنود الاختبار في ثبات درجات الاختبار ككل، فخلو الاختبار من الخطأ يعتمد على كيفية بناء البنود، فبعضها يشتمل على مؤثرات الاجابة مما يساعد على التخمين، وبعض البنود تتميز بدرجة عالية من الصعوبة أو السهولة مما يعمل على خفض قيمة معامل الثبات. كذلك البنود الغامضة أو غير محددة الهدف أو التي تكون تعليماتها أو صياغتها غير دقيقة تؤثر على ثبات درجات الاختبار.
تؤدي صعوبة أو سهولة البنود بشكل كبير إلى التواء الدرجات سواء سلبا في حالة اختبار سهل أو التواء موجب في حالة اختبار صعب، فمعامل الارتباط بيرسون لا يمكن بلوغ قيمته القصوى (1) بتوزيع المتغيرين للارتباط معتدلة أو نفس الالتواء، فاختلاف توزيع البيانات في الاختبار عنها في إعادة الاختبار (تكون معتدلة في التطبيق الأول وملتوية في التطبيق الثاني) سوف يؤثر على استقرار الدرجات.
5. موضوعية التصحيح:
تؤثر أحكام المصححين على ثبات درجات الاختبار خاصة بالعوامل الذاتية أو عوامل التحيز، بحيث تنخفض قيمة معامل الثبات نتيجة ذلك، فتصحيح الاختبارات مثل الاختيار من متعدد، والصواب والخطأ، والتكملة لا تطرح مشكلة لأنه عادة ما يكون التصحيح موضوعيا، ولكن المشكلة تبدو واضحة في تقدير درجات اختبارات المقال، وبعض اختبارات الأداء أو مقاييس الشخصية لأن التصحيح يتطلب أحكاما ذاتية حول استجابات المختبرين مما يؤثر تأثيرا كبيرا على ثبات التقديرات.