ق ن ت: تحليل البنود (مؤشر الصعوبة، مؤشر التمييز، الثبات)

1-تحليل البنود : بعد الانتهاء من الخطوات الأولى في بناء الاختبار ، والحصول على الصياغة الأولية لبنود الاختبار أو المقياس ، ونتائج التطبيق على عينة التقنين وفق الخطوات التي حددها (Crocker & Algina, 1986) تأتي مرحلة تحليل البنود وفحص الخصائص القياسية الإحصائية لها، من خلال استخدام مؤشرات ومعاملات نتحصل عليها من البنود، هذه المؤشرات والمعاملات تسمح للقائمين على بناء الاختبار بالحكم على قيمة وصلاحية بنود الاختبار، والحصول على بنود تتوافر على الموصفات الاحصائية المطلوبة يمهد للحصول على اختبار جيد وموثوق فيه، وتتضمن هذه الإجراءات الإحصائية ثلاث عناصر ( Legendre, 1998):

- التحقق من التطابق بين البنود والأهداف، ومعقولية خيارات الإجابة، بالإضافة إلى جوانب الصدق والثبات.

- حساب مؤشرات (المتوسط، الانحراف المعياري، مؤشر الصعوبة، التمييز ...)

- اتخاذ القرار بمراجعة البنود أو استبدالها أو الاحتفاظ بها. _

1-1. مؤشر الصعوبة Indices de difficulté d’items: يعد مؤشر صعوبة البند واحد من الأساليب الإحصائية الأكثر استخداما وأهميةً في تحليل بنود الاختبارات، وهو تعبير عن نسبة المختبرين الذين أجابوا إجابة صحيحة على البند إلى المجموع الكلي للمختبرين. والذي نرمز له بـــــ P:

حيث: P مؤشر صعوبة البند P_iعدد الأفراد الذين نجحوا في الإجابة على البند، nالعدد الكلي لأفراد المجموعة.

تتراوح قيمة P بين (0 و1) فحينما تكون قيمة P مرتفعة جدا أكبر من 0.90، يشير إلى أنَّ نسبة كبيرة من المختبرين نجحوا في الإجابة على البند (90%)، ومنه البند سهل جدا. وحينما تكون قيمP أقل من 0,20 البند سهل جدا (20%)، وتمثل القيمة (0,50) أن البند متوسط السهولة. ويتم تحويل قيمة p إلى نسبة مئوية، ووفقا لــــ (Thorndike, Cunningham, Thorndike, & Hagen, 1991) نقلا عن ( Quaigrain & Ato , 2017)البنود التي تتراوح قيمتها بين 20 و90٪ تعتبر جيدة ومقبولة. والتي تتراوح قيمتها بين 40 و60٪ ممتازة، أما البنود ذات القيمة p (مؤشر الصعوبة) أقل من 20٪ (صعبة للغاية) وأكثر من 90٪ (سهلة جدًا) تكون غير مقبولة أو تحتاج إلى تعديل. إن البنود التي تتراوح قيمها بين 0,4و0,6 تناسب اختبارات معيارية المرجع في حين الاختبارات المحكية المرجع تتطلب بنود تكون غالبية مؤشرات صعوبتها0,90 فما أكثر.

يمكن الحصول أيضا على مؤشر السهولة للبند والذي نرمز له بـــــــــ Q من خلال قيمة مؤشر الصعوبة عن طريق المعادلة التالية:

Q=1-p

حيث: Q = نسبة عدد الأفراد الذين أجابوا إجابة خاطئة على البند.

تجدر الإشارة هنا إلى أن هذه المعادلة المعتمدة في حساب مؤشر صعوبة البند تصلح حينما تكون طريقة تصحيح البند ثنائية (1,0). ولعل حساب مؤشر الصعوبة في حالات الإجابات الثنائية (إجابة صحيحة أو إجابة خاطئة) يبدوا بسيطا لأنه يقوم على عدِّ الإجابات الصحيحة المسجلة في البند من خلال الأفراد المختبرين وتقسيم عدد الإجابات الصحيحة على المجموع الكلي للأفراد المختبرين. لكن هذا المؤشر لا يعكس بالضرورة وبدقة الإجابات الصحيحة الناتجة عن الكفاءة الحقيقية للمختبر في حالة البنود ذات الاختيار من متعدد أو صحيح/ خطأ، حيث يمكن أن نسجل إجابات صحيحة عن طريق الصدفة أو الحظ والذي يطلق عليه التخمين وهو نجاح الفرد في البند دون ما يعرف الإجابة الصحيحة، للتقليل من أثر التخمين في الإجابة على البند وعزل الأسباب التي تساهم في زيادته هناك عدة إجراءات يمكن اتباعها:

- رفع عدد البدائل في البند، فكلما زاد عدد البدائل في البند يقل أثر التخمين، يكون أثر التخمين في البند الذي يحمل بديلين (0,50) وفي حالة أربع بدائل ينخفض ليصبح (0,20).

- اضافة بدائل مموهة تحمل عبارات "كل الإجابات صحيحة" "كل الإجابات خاطئة" "السؤال الحالي غير منطقي"

- استخدام طريقة الخصم (-1) في حالة الإجابة الخاطئة.

كما يمكن تصحيح مؤشر الصعوبة من أثر التخمين الذي أشرنا إليه سابقا، باعتماد معامل التصحيح لمؤشر الصعوبة من أثر التخمين عن طريق المعادلة التالية:

P^c

حيث: P^cمؤشر الصعوبة المصحح من أثر التخمين.

Pمؤشر الصعوبة قبل التصحيح من أثر التخمين.

Mعدد احتمالات الإجابة (البدائل).

أما حساب مؤشر الصعوبة في حالة عدم الإجابة على البند من طرف بعض أفراد العينة (البنود المتروكة)، خاصة البنود التي تأتي في آخر الاختبار بسبب ضيق الوقت (اختبارات السرعة) أو في حالة اختبارات القوة إذ تتضمن أيضا عامل الزمن، فلا ينبغي أن نتعامل مع هذه البنود المتروكة بنفس منطق التحليل الذي نطبقه على البنود التي تأتي في بداية الاختبار. المعادلة التالية تسمح لنا بتقدير مؤشر صعوبة البند في هذه الحالة:

𝑃=𝑝𝑖𝑛−𝑘

Kعدد الأفراد الذين تركوا البند (لم يجيبوا عن البند)

أهمية حساب مؤشر صعوبة البند: حساب مؤشر صعوبة البند يساهم في الحصول على بنود مناسبة ومميزة وتحسين بناء الاختبار بشكل عام، ونورد أدناه الفائدة العملية لهذا الإجراء في ضوء ما أشار إليه (Coaley , 2010).

- اختيار البنود المناسبة من حيث الصعوبة والسهولة تمهيدا للحصول على بنود تميز بين الفئة الأعلى والفئة الأدنى، بين الفئة المتمكنة وغير المتمكنة، فالقيم المتطرفة سواءً التي أجاب عنها جميع المختبرين أو التي لم يتمكن أحد من الإجابة عليها يوصى بحذفها في الصيغة النهائية للاختبار، أو مراجعتها لعلّ بها خلل في الصياغة اللغوية أو مبهمة وغير مفهومة.

- يضمن لنا توازن في صعوبة بنود الاختبار.

- يفيدنا ذلك في ترتيب البنود من السهل إلى الصعب بهدف تحفيز المختبرين على الإجابة. وتحديد البنود التي توقف عندها المختبر ولم يجيب عنها بسبب صعوبتها أو ضيق الوقت، وهناك قاعدة نتبعها في ذلك تتمثل في التوقف عن احتساب البنود على أنها متروكة بسبب عدم معرفة الإجابة خاصة في اختبارات QCM واعتبارها متروكة بسبب ضيق الوقت وذلك بعد ثلاث بنود متتالية متروكة.

- تحديد الأخطاء الشائعة والإجابات غير المعتادة.

- استبعاد البنود المتحيزة وغير العادلة حيث يمكن أن تجيب مجموعة على بند معين في حين تظهر استجابات مختلفة تماما للمجموعة الأخرى.

1-2. مؤشر تمييز البند Indices de discrimination des items: يُعرّف مؤشر التمييز الخاص بالبند بأنه "... الدرجة التي تميّز بها بين الطلاب ذوي الإنجازات العالية والمنخفضة" (Linn & Gronlund, 1995) حيث يكون للأفراد ذوي القدرات العالية أفضلية في الإجابة على البند، فمثلا إذا صمم اختبار لقياس فهم المنطوق، فتمييز المفردة هنا يعني قدرتها على إظهار الفرق بين التلاميذ ذوي مهارات جيدة في فهم المنطوق والتلاميذ ذوي مهارات ضعيفة في فهم المنطوق. فيجب أن يكون للبند إذن قدرة على التمييز بين الأفراد المختبرين في الخاصية المراد قياسها وإظهار الفروق الموجودة بينهم. وحسبAnastasi وUrbina طُورت أكثر من خمسين طريقة في تقدير مؤشر تمييز البند، ومعظم هذه المؤشرات تؤدي إلى قيم متقاربة (Reynolds & Livingston, 2013) ونستعرض فيما يلي أكثر المداخل استخداما في تقدير تمييز البند.

تتخذ معاملات التمييز قيما تتراوح ما بين (-1 و+1)، وتشير أي قيمة إلى دلالة معينة، حيث اقترح (Ebel & Frisbie , 1991) قيما مرجعية لتفسير معاملات التمييز:

0.40 أو أكثر : البند مميزا جيدا 0.30 -0.39 : بند مميز

0.20-0.29 : بند أقل تمييزا 0.10-0.19 : بند محدود ينبغي تحسينه

أقل من 0.10: لا فائدة منه في الاختبار

-طريقة المقارنة الطرفية: تعد من الطرق الشائعة في حساب مؤشر تمييز البند، وتعتمد على الفرق بين أداء المجموعتين (الأعلى، الأدنى) وهناك طرق متعددة في اختيار المجموعتين، منها الطريقة التي تعتمد على ترتيب أفراد العينة بناءً على الدرجة الكلية في الاختبار ترتيبا تصاعديا، ثم اختيار (27%) من الفئة الأعلى و(27%) من الفئة الأدنى (Richard & Sheila , 1999) وبعدها نقوم بحساب صعوبة البند لكل فئة، وبعدها نطرح مؤشر صعوبة الفئة الأدنى من مؤشر صعوبة الفئة الأعلى باعتماد الصيغة الرياضية التالية:

𝐷= 𝑃+ −𝑃−

حيث: D = مؤشر تمييز البند.

𝑃+ = مؤشر صعوبة البند في الفئة الأعلى. 𝑃− = مؤشر صعوبة البند في الفئة الأدنى.

مثال: نفترض تطبيق اختبار القدرة اللغوية يتكون من (40) بند على عينة من التلاميذ (200)، وأردنا حساب مؤشر تمييز البند رقم3. بعد تصحيح الاختبار والحصول على الدرجة الكلية لكل فرد، نقوم بترتيب الأفراد تصاعديا، ثم نحسب مؤشر الصعوبة للفئة الأعلى والذي يمثل (27%) ومؤشر الصعوبة للفئة الأدنى (%27) باتباع الطريقة التالية:

200 (العينة) 100%

54 27% من الفئة الأعلى.

54 27% من الفئة الأدنى.

حيث:

- عدد الذين أجابوا صحيح على البند رقم 3 من الفئة الأعلى 39. ومنه 0,72 = P₊₌₃₉₅₄

- عدد الذين أجابوا صحيح على البند رقم 3 من الفئة الأدنى 20. ومنه 0,37 = P_{- =2054}

وبالتعويض في المعادلة السابقة:

D=0,72-0,37=0,35

قيمة مؤشر تمييز البند رقم 03 هي: 0,35 وهذا يدل على أن البند مميز ويمكن الاحتفاظ به في الصيغة النهائية للاختبار.

-طريقة معاملات الارتباط:

هناك ثلاث طرق تعتمد على معاملات الارتباط تستخدم في تقدير مؤشر تمييز البند، معامل الارتباط ثنائي التسلسل الخاص، معامل ثنائي التسلسل، ومعامل فاي. ويكون قياس تمييز البند بحساب درجة الارتباط بين متغيرين، واحد منهم ثنائي التقسيم (0،1) (درجات البند) والآخر متصل أي على مستوى مجال ويقصد به الدرجة الكلية للاختبار، وأهم مزايا هذه الطريقة استخدامها لدرجات كل المختبرين في حساب المعامل، عكس الطريقة السابقة التي تستخدم 54% فقط (27% أعلى،27%أدنى) (Ebel & Frisbie , 1991)

الارتباط المرتفع بين درجة المفردة(البند) والدرجة الكلية في الاختبار يشير إلى أن البند يقيس نفس الخاصية (التكوين الفرضي) الذي يقيسه الاختبار ككل، كذلك البند يميز بين الأفراد ذوي الإنجاز المرتفع والإنجاز المنخفض في السمة.

-معامل الارتباط ثنائي التسلسل الحقيقي: يشير معامل الارتباط المستخرج بهذه الطريقة إلى القدرة التمييزية للبند، يعتمد على إيجاد الارتباط بين الأداء على البند والاختبار (الارتباط بين درجة البند والدرجة الكلية للاختبار). ويفترض أن الذين يجيبون عن البند إجابة صحيحة هم من فئة المتقنين بينما الذين يجيبون عن البند إجابة خاطئة هم من فئة الأفراد غير المتقنين، ويستخدم هذا النوع من معاملات الارتباط حينما يكون أحد المتغيرين يقع في المستوى الفئوي أو النسبي (الدرجة الكلية للاختبار) والآخر يقع في المستوى الاسمي ذو تقسيم ثنائي حقيقي (صحيح، خطأ) للبند. والصيغة التالية تسمح لنا بالتقدير الكمي لتمييز البند المعتمد على (Henning, 1987):

حيث:

M₊= متوسط توزيع الدرجات الكلية للمجموعة التي أجابت إجابة صحيحة على البند.

M_x= متوسط توزيع الدرجات الكلية للمجموعة في الاختبار .

𝐒_𝐱 = الانحراف المعياري للدرجات الكلية في الاختبار لجميع أفراد العينة.

𝑷 = ترمز إلى نسبة الأفراد الذين أجابوا صحيح على البند (مستوى صعوبة البند).

=q ترمز إلى نسبة ع الأفراد الذين أجابوا إجابة خاطئة على البند (مستوى سهولة البند).

أما في حالة تقسيم درجة البند تقسيما اصطناعيا، نستخدم معامل الارتباط ثنائي التسلسل.

-معامل الارتباط فايPhi: يستخدم معامل فاي Phi في تقدير تمييز المفردة عن طريق حساب الارتباط بين درجات البند محل دراسة صدقه(التجريب) حيث يستخدم في حالة بنود ثنائية التقسيم (صحيح، خطأ أو 0,1) ودرجات محك ثنائية أيضا وهو من الطرق التي يتم فيها تطبيق الاختبار مرة واحدة على مجموعة واحـدة مـن الأفراد، كما يمكن استخدامه في تحديد درجة استقرار في استجابات البند نفسها ثنائية التصحيح للأفراد نفسهم في موقف آخر، وهناك عدة صيغ لحساب Phi نذكر منها:

نفترض أن:

إلى النسبة المشتركة للأفراد الذين أجابوا على الفقرتين j و K إجابة صحيحة..

نسبة الأفراد الذين أجابوا على البند j إجابة صحيحة.

ترمز إلى نسبة الأفراد الذين أجابوا على البند k إجابة صحيحة.

ترمز إلى نسبة الأفراد الذين أجابوا على البند j إجابة خاطئة.

ترمز إلى نسبة الأفراد الذين أجابوا على البند k إجابة خاطئة.

3-1.ثبات البنود:

يعتمد ثبات الاختبار اعتمادا مباشرا على ثبات بنوده، ويشير ثبات البند إلى استقرار استجابات الأفراد على نفس البند باختلاف الظروف. وهناك طرق متعددة في تقدير ثبات بنود الاختبار يمكن تلخيصها فيما يلي:

- طريقة التطبيق-إعادة التطبيق:

يمكننا استخدام معامل Phi لتحديد درجة استقرار استجابات ثنائية التصحيح في البند نفسها للأفراد في موقف آخر (Knapp , 2009) حيث تتطلب هذه الطريقة تطبيق البند على نفس الأفراد في فترتين مختلفتين وفقا للخطوات التالية:

- تطبيق بنود الاختبار على عينة من الأفراد.

- إعادة تطبيق نفس البنود على نفس عينة الأفراد بفاصل زمني.

- رصد استجابات الأفراد على كل بند من بنود الاختبار، حيث تسجل نتائج التطبيق الأول ونتائج التطبيق الثاني في شكل جدول تكراري.

-حساب معامل ارتباط فاي بين درجات الاستجابة في التطبيق والتطبيق الثاني.

يقدر معامل ثبات البند وفقا للصيغة التالية:

حيث: a، b، c، d ترمز إلى خلايا الجدول الرباعي.

- كما يمكن تطبيق معامل الارتباط الرباعي في حساب معامل ثبات البند وفقا للصيغة التالية:

- كلما ارتفعت قيمة معامل ارتباط البند بين التطبيقين كلما دل على ثبات البند، والعكس كلما انخفضت قيمة معامل ارتباط البند دل على عدم استقرار أو ثبات البند.

- طريقة الاحتمال المنوالي:

تصلح هذه الطريقة لحساب ثبات البنود التي تعتمد إجاباتها على اختيار إجابة من إجابتين أو اختيار من إجابات متعددة، تتلخص صيغتها فيما يلي:

ترمز k إلى عدد بدائل الإجابة،

وترمز إلى أكبر احتمال نسبي في احتمالات الإجابة (أكبر تكرار نسبي).

آخر تعديل: الأربعاء، 15 مايو 2024، 5:39 PM