1-تعريف الاختبارات : كلمة "اختبار" حسب (Murphy & Davidshofer, 2005) تشير إلى طريقة منتظمة ومعيارية في الحصول على معلومات حول بعض جوانب السلوك البشري. يشمل هذا التعريف كلا من الاختبارات التربوية والنفسية، ويغطي ثلاث خصائص محددة:
• الاختبار النفسي هو عينة من السلوك.
• يتم الحصول على العينة في ظل ظروف موحدة.
• هناك قواعد ثابتة لتسجيل النقاط، أو للحصول على معلومات كمية (رقمية) من عينة السلوك.
_ الاختبار هو طريقة لقياس قدرة الشخص، معارفه أو أدائه في مجال معين (Brown, 1984)
_ الاختبار هو مقياس موضوعي ومقنن لعينة من السلوك، والاختبارات النفسية تماثل الاختبارات في علم آخر، من حيث أن الملاحظات تُجرى على عينة صغيرة ولكن يتم انتقاؤها بعناية (Anastasi & Uraina, 1997)
وردت في التعريفات السابقة مصطلحات التقنين والمعايير، الموضوعية، ربما تحتاج إلى توضيح أدق كون هذه المفاهيم مرتكزات أساسية في بناء وتطبيق الاختبارات وتفسير نتائجها.
_ التقنين: انتظام وتوحيد الإجراءات عند تطبيق الاختبار وتقدير درجاته، وتكوين المعايير إحدى الخطوات المهمة في تقنين اختبار معين.
_ المعايير: تكوين المعايير احدى الخطوات المهمة في تقنين الاختبارات، والمعايير حسب Sax هي توزيع الدرجات في اختبار من الاختبارات المطبق على مجموعة مرجعية تم اختيار أفرادها بصورة تمثل المجتمع الأصلي (شحاتة، 2007).
_ الموضوعية: المقصود بها تجنب الذاتية والابتعاد عن الأحكام الذاتية في تقدير وتفسير درجات الاختبار من طرف القائمين على الاختبار.
2-تصنيف الاختبارات النفسية والتربوية : تختلف طريقة تصنيف الاختبارات باختلاف الأسس المتبعة، من حيث الغرض وطريقة البناء والتطبيق، وكذا طريقة تفسير النتائج، وقد ذكر Cronbach1990 أنه يمكن تصنيف الاختبارات بعامة في مقاييس الأداء الأقصى أو في مقاييس الأداء المميز (Reynolds & Livingston, 2013)
2-1. اختبارات الأداء الأقصى: وتسمى أيضا اختبارات القدرة، وهي متضمنة اختبارات التحصيل، تُقدّر درجة مفردات الاختبار هنا على أساس أن إجابة المفردة إما "صحيحة " أو "خاطئة". تصمم هذه الاختبارات لقياس الحدود العليا للفرد وقدراته، أين يحث المختبرين على بذل أقصى قدرتهم في أدائهم، مثلا: نصمم اختبار لقياس مدى اتقان المتعلم لنطاق محتوى دراسي معين (قياس درجة التحكم في تقنيات الاعلام الآلي لطلبة الجامعة). وفي إطار اختبارات الأداء الأقصى توجد تقسيمات فرعية متعددة وهي:
أ-الاختبارات التحصيلية واختبارات الاستعدادات: تصمم الاختبارات التحصيلية لقياس معارف ومهارات فرد معين في نطاق محتوى قُدم له فيه تعليم معين أي تقدير ما حصّله من منهج دراسي أو برنامج دراسي (عباس، 2001) أما اختبارات الاستعدادات تكون أكثر اتساعا في منظورها، وتصمم لقياس المهارات والقدرات المعرفية، والمعارف التي تجمعت لدى الفرد نتيجة لخبراته مدى حياته. غير أن الفرق بين اختبارات الاستعدادات والتحصيل هو فرق نسبي، حيث أن كلاّ منهما يمكن استخدامه في ظروف معينة لتقرير تأثير الخبرة وللتنبؤ بالتحصيل (عباس، 2001)
ب. الاختبارات الموضوعية والذاتية: تشير الموضوعية إلى استبعاد أثر العوامل الذاتية أو الشخصية في عملية تقدير الدرجة في الاختبار، وتلغي احتمال ظهور أي خلاف بين المقدّرين نظرا لتوافر مفتاح تصحيح يضمن التجرّد من التحيزات الشخصية. ومفردات هذا النوع من الاختبارات تكون على شكل: اختيار من متعدد، الصواب والخطأ، المزاوجة، أما الاختبارات الذاتية فهي تعتمد في تقدير درجاتها على الاحكام الذاتية للقائمين على عملية التقدير، ويطلق عليها عادة اختبارات المقال.
ج.اختبارات السرعة واختبارات القوة : تهدف اختبارات السرعة Speed testإلى معرفة الفروق في سرعة الأداء أو التنفيذ لدى المختبرين، فقراتها تكون سهلة نسبيا، غير أن الزمن المخصص للإجابة يكون محددا. في حين اختبارات القوة Power Test يكون الزمن المتاح كاف للإجابة على جميع فقراته.
2-2-اختبارات الأداء المميز : يطلق عليها أيضا اختبارات الشخصية، وهي أدوات لقياس الخصائص الانفعالية والدافعية والبيشخصية و الاتجاهات (Anastasi & Uraina, 1997)) حينما نستخدم أحد اختبارات الشخصية فإننا نكون مهتمين بمعرفة النمط أو الأسلوب الذي يتصرف وفقا له شخص معين في المواقف المختلفة، وليس هناك إجابة صحيحة او خاطئة للعبارات التي تصف سلوكه (شحاتة، 2007)). لذا نجد البعض يستخدم مصطلحات مثل: مقياس Scale أو استبيان inventory على أدوات الاستجابة المميزة.
ويمكن تقسيم اختبارات الشخصية إلى اختبارات موضوعية واختبارات إسقاطيه، هذ التقسيم يقوم على أساس طبيعة المثير الذي يقدم للمفحوص وشكل الاستجابة المتوقعة منه:
أ.الاختبارات الموضوعية للشخصية : هي تلك الاختبارات التي لا تتأثر بالأحكام الشخصية للقائم بتقدير درجات الاختبار، حيث يكون هناك اتفاق بين مقدّري الدرجات بحكم وجود مفتاح التصحيح مسبقا، وبنية المثيرات محددة. إذ تستخدم عدد محدد من البدائل في الفقرة الواحدة و يقرر المختبر ما يراه منها منطبقا عليه (علام ، 2000) فمثلا: مقياس Rosenberg لتقدير الذات Self-Esteem Scale ، يشتمل على مفردات تستخدم عدد محدد من البدائل (موافق بقوة، موافق بدرجة بسيطة، بين الموافقة وعدمها، غير موافق بدرجة بسيطة، غير موافق بشدة) و تقابلها تقديرات تدريجية من( 04) لموافق بقوة إلى صفر لبديل غير موافق بشدة ، مثل : "أشعر بأنني شخص له قيمة أو على الأقل مساوي للآخرين" فالفرد في هذه الفقرة يستجيب ببساطة في ضوء البدائل المحددة سابقا، فحينما يختار البديل "موافق بقوة" سيحصل في هذه الفقرة على درجة تقديرية تساوي (04)، وهذا ما يمنع من التحيّز بين المقدّرين عند التقيّد بمفتاح التصحيح.
ب.الاختبارات الإسقاطية للشخصية : ترتكز هذه الاختبارات على تقديم مثيرات غير محددة البنية أو غامضة، وينتج عن هذه المثيرات تقريبا عددا لا متناهيا من الاستجابات من قبل المفحوصين، كما تتميز هذه الاختبارات أنها لا تفرض قيودا على طريقة أو كيفية استجابة المفحوص. أما عملية تقدير درجة الاستجابة تعتمد بصورة كبيرة على ذاتية القائم على الاختبار، وهذا هو الأساس الذي يميزها عن الاختبارات الموضوعية للشخصية. فمثلا "اختبار تفهم الموضوع" T.A.T الذي يستخدم في دراسة الشخصية، يقوم حول تقديم عدد من الصور الغامضة نوعا ما للمختبرين (عباس، 2001) ويطلب منهم تكوين أو إنشاء قصة تصف ما يدور بالصورة وتتحدث عن أحوال الأشخاص والأحداث التي تجري فيها، وبعد ذلك يقوم الفاحص بدراسة وتقدير استجابة المختبر وهذا التقدير يقترب بدرجة كبيرة إلى الذاتية، أي يتأثر بالأحكام الذاتية للمقدرين.
يبقى هذا التصنيف الذي استعرضناه لمختلف أنواع الاختبارات غير شامل، بالرغم من تفرده بالتصنيف الأساسي للأنواع الرئيسية للاختبارات النفسية والتربوية، حيث توجد تصنيفات أخرى يمكن اعتمادها أيضا ونورد أهمها:
2-3_ التصنيف حسب طريقة تفسير النتيجة :
_ الاختبارات معيارية المرجع، تركز على الوضع النسبي للفرد في علاقته بالآخرين.
_ الاختبارات محكية المرجع، تركز على مقارنة أداء الفرد بمحك أو مستويات أداء متوقعة
2-4_ التصنيف حسب الجهة التي تعد الاختبار
_ اختبارات مقننة، يكون تطبيقها وتصحيحها، تفسير درجاتها بطريقة معيارية
_ اختبارات غير مقننة (من إعداد المعلم).
2-5_ التصنيف حسب أسلوب تقديم الإجابة :
_ اختبارات لفظية ن تكون فيها الإجابة تحريرية (ورقة وقلم) أو شفوية
_ اختبارات الأداء العملي، مثل إجراء تجربة علمية.
2-6_ التصنيف حسب طريقة التطبيق :
_ اختبارات جماعية (اختبارات الورقة والقلم).
_ اختبارات فردية (شفوية).
في ضوء هذه التصنيفات لمختلف أنواع وأشكال الاختبارات، يمكن لاختبار واحد أن يتبع أكثر من تصنيف، فاختبار التحصيل يمكن أن يكون مقنن وموضوعي، يفسر تفسير محكي المرجع واختبار قوة من نوع أقصى الأداء.
3-خطوات بناء الاختيار :
الاختبارات النفسية في كثير من الأحيان قياسات تتمحور حول موضوع ما (أي سمة معينة) وتتبع بعض المبادئ التوجيهية الصارمة في عملية البناء، الاعداد، التصحيح والتفسير، والهدف الأساسي لتطوير مقياس جديد هو الحصول على قياس صادق وثابت، وقد ذكر (Singh, Junnarkar, & Kaur, 2016) في كتابهم "القياس في علم النفس الإيجابي"، أن كل من (Crocker & Algina, 1986) حددا عشرة خطوات يمكن اتباعها في عملية البناء:
1.تحديد الغرض الأساسي الذي ستستخدم فيه درجات الاختبار (اختبار تنبؤي، تشخيصي، انتقائي...).
2.تحديد السلوكات التي تمثل البناء النفسي أو نطاقه (تحويل البناء النفسي إلى مجموعة سلوكات أو بنود خاصة) مراجعة الأبحاث، الملاحظات المباشرة، أحكام الخبراء، الأهداف التدريسية. استخدام تحليل المحتوى.
3إعداد مجموعة مواصفات للاختبار تصف بدقة نسبة البنود أو الفقرات الممثلة لكل نوع من أنواع السلوكات المحددة في الخطوات الثانية. أي ضمان عينة مناسبة من البنود داخل كل مجال من المجالات الرئيسية للسمة (عدد البنود يكون متناسب مع أهمية كل مجال).
4.إنشاء ملف أولي للبنود أو الفقرات، على مطوري الاختبار هنا اختيار الصياغة المناسبة للبنود وتجنب البنود التي تحمل الايحاءات أو التأويل في الفهم، على العموم هنالك شكلين من الصياغة نجدهما أكثر انتشارا في الاختبارات النفسية والتربوية، بنود ذات الإجابة الثنائية (صحيح، خطأ)، (نعم، لا) وسلالم التقدير على شكل مقياس ليكرت الثلاثي أو أكثر.
5.مراجعة البنود وتعديلها من حيث الدقة والصياغة والغموض ودرجة الملاءمة من خلال الاستعانة بالمختصين. إذ يجدر الأمر هنا الانتباه إلى استخدام لغة متداولة وبسيطة في الصياغة، ومراعاة المستوى القرائي للمختبرين، الأصل العرقي والمرحلة العمرية وكذا النوع (ذكور، إناث)
6.إجراء تجريب أولي للبنود على عينة من المفحوصين (15- 20 فرد)،
7.مراجعة البنود بعد التجريب الأولي وتعديلها إذا تطلب ذلك قبل طبعها نهائيا وتحليلها إحصائيا من حيث الصعوبة والتباين والتمييز.
8.تطبيق الفقرات على عينة كبيرة ممثلة لمجتمع المفحوصين (الأفراد الذين أعد الاختبار لهم)
9.تحديد الخصائص الإحصائية لدرجات بنود الاختبار (مؤشرات الصعوبة والتمييز، الثبات)، وحذف الفقرات التي لا تتفق مع المعايير المحددة مسبقا.
10تصميم وإجراء دراسات الصدق والثبات للصيغة النهائية للاختبار للتحقق من مدى توفرها على الخصائص السيكومترية الضرورية.
11.وضع دليل الاختبار الذي يفيد في التطبيقات والتصحيح وتفسير الدرجات (مثل الجداول المعيارية، اقتراح توصيات مثل معايير الأداء، درجات القطع وغيرها) (Matlock-Hetzel, 1997)