الصفحة الرئيسية تحميل البرنامج إهداء ارشيف English Version
الفصل 10
     10     9     8     7     6     5     4     3     2     1          <<   |   >>  

الفصل 10
ما هو فارق الخطأ

عندما تنقل نتائج المسح الإحصائي في وسائل الإعلام، غالباً ما تشمل بياناً مثل:

"تفضل 55 بالمئة من المجيبين السيدة سميث في الانتخابات البلدية القادمة. وفارق الخطأ هو 3 بالمئة."

ماذا يعني مثل هذا البيان؟ يحاول هذا الفصل الإجابة على هذا السؤال وتقديم بعض التحذيرات حول استعمال "فارق الخطأ" كالقياس الوحيد للشك في المسح الإحصائي.

يتم تصميم المسح الإحصائي عادةً لإعطاء تقدير للقيمة الحقيقية لخاصية أو أكثر من خصائص مجموعة سكانية في وقت معين. وقد تكون غاية المسح الإحصائي

  • معدل قيمة كمية قابلة للقياس، مثل الدخل السنوي لعام 1998 أو علامات اختبار قبول الطلبة لمجموعة معينة.
  • نسبة، مثل نسبة الناخبين المحتملين ذوي وجهة نظر معينة في انتخاب بلدي.
  • النسبة المئوية للأطفال دون سن الثالثة الملقحين ضد شلل الأطفال عام 1997.

ومن غير المرجح أن يكون تقدير من مسح إحصائي معادلاً بالضبط للكمية الحقيقية التي تهم مجموعة سكانية لمختلف الأسباب. وأحد الأسباب هو أن الأسئلة قد تكون مصاغة بشكل سيء. والسبب الآخر هو أن بعض الأشخاص الذين من المفترض أن يكونوا في العينة قد لا يكونون في المنزل، أو حتى لو كانوا، قد يرفضون المشاركة أو قد لا يقولون الحق. وهذه مصادر "خطأ غير أخذ العينات".

لكن التقدير سيزال ربما يختلف عن القيمة الحالية، حتى لو أمكن التخلص من كافة أخطاء غير أخذ العينات. ويعود سبب ذلك إلى أن البيانات في مسح إحصائي يتم جمعها من مجرد بعض، ولا جميع، أعضاء المجموعة السكانية لجعل عملية جمع البيانات أقل كلفة أو أسرع، وعادة كلاهما.

افترض في استطلاع الانتخابات البلدية المذكور آنفاً، أننا أخذنا عينة مؤلفة من 100 شخص ينوي الانتخاب وأن 55 شخصاً يؤيد السيدة سميث بينما يؤيد 45 شخصاً السيد جونز. ويبدو ذلك أنه يقترح أن أكثرية ناخبي البلدة، بمن فيهم الأشخاص غير الخاضعين للعينة لكن الذين سينتخبون في الانتخابات، يؤيدون السيدة سميث.

وطبعاً، من باب الصدفة فقط، قد تؤيد أكثرية في عينة معينة السيدة سميث حتى لو أن أكثرية السكان تريد السيد جونز. وقد ينشأ هذا الحدث بسبب "خطأ أخذ العينات"، أي أن النتائج في العينة تختلف عن كمية السكان المستهدفة، بمجرد سبب "حظ اليانصيب"، أي التي أختير بموجبها 100 شخص ليكونوا في العينة.

هل يجعل خطأ أخذ العينات من المسح الإحصائي عديم الجدوى؟ لحسن الحظ، إن الجواب على هذا السؤال هو "لا"، لكن كيف علينا أن نوجز قوة المعلومات في مسح إحصائي؟ ذلك أحد الأمور لفارق الخطأ.

تحديد فارق الخطأ

"فارق الخطأ" هو موجز شائع لخطأ أخذ العينات، يشار إليه بإنتظام في وسائل الإعلام ويحتسب عدم التأكد من نتيجة المسح الإحصائي. ويمكن تفسير فارق الخطأ من خلال استعمال الأفكار من قوانين الاحتمالية أو "قوانين الصدفة"، كما يطلق عليها أحياناً.

وغالباً ما يجرى المسح الإحصائي من خلال البدء بقائمة (معروفة بـ"إطار أخذ العينات") بكافة الوحدات في المجموعة السكانية وإختيار عينة. وفي إستطلاعات الرأي، غالباً ما تتألف هذه القائمة من كافة أرقام الهواتف الممكنة في منطقة جغرافية معينة (أرقام مدرجة وغير مدرجة على حد سواء).

وفي مسح إحصائي علمي، لدى كل وحدة في السكان بعض الإحتمال الإيجابي المعروف لإختيارها للعينة، ويمكن إحتساب إحتمال إختيار أي عينة معينة. وحسنة عينة الإحتمال مزدوجة الحد. فهي تتجنب التحيزات التي قد تنشأ لو تم إختيار العينات بناءً على نزوات مجري المقابلة، بالإضافة إلى أنها توفر أساساً لتقدير مدى خطأ أخذ العينات. وهذه الخاصية الأخيرة هي ما يمكن مجري المقابلة من احتساب "فارق الخطأ". ومن باب التحديد، تمكننا قوانين الإحتمال من إحتساب فواصل فارق الخطأ +/- للتقدير الشكلي.

ويشار إلى هذه الفواصل في بعض الأحيان بفواصل نسبة 95 بالمئة من الثقة ويتم التوقع منها أن تحتوي على القيمة الحقيقية للكمية المستهدفة (في غياب أخطاء غير أخذ العينات) في ما لا يقل 95 بالمئة من الوقت. وأحد العوامل الهامة في تحديد فارق الخطأ هو حجم العينة. ومن المرجح أن تؤدي العينات الأكبر إلى نتائج قريبة من كمية السكان المستهدفة وبالتالي إلى فوارق خطأ أصغر من العينات ذات الحجم الأصغر.

في حال الاستطلاع البلدي حيث يؤيد 55 من أصل 100 فرد من العينة السيدة سميث، يكون تقدير العينة أن نسبة 55 بالمئة تؤيد السيدة سميث، إلا أن فارق الخطأ يبلغ 10 بالمئة. لذا تكون نسبة 95 بالمئة لفاصل الثقة للنسبة المئوية المؤيدة للسيدة سميث (55%-10%) إلى (55%+10%) أو (45 بالمئة، 65 بالمئة)، مما يقترح أن التأييد في المنطقة الأوسع للسيدة سميث قد يتراوح ظاهرياً بين 45 بالمئة و65 بالمئة. وبسبب حجم العينة الصغير، يعني هذا نسبة كبيرة من عدم التأكد من التأييد الفعلي الذي تحظى به السيدة سميث من أكثرية سكان البلدة.

وبدلاً من ذلك، لو أجري مسح إحصائي على ألف شخص، وأيد 550 منهم السيدة سميث، لكان تقدير العينة من جديد 55 بالمئة، لكن فارق الخطأ الآن لتأييد السيدة سميث يكون فقط 3 بالمئة تقريباً. وبالتالي يكون فاصل ثقة الـ 95 بالمئة للنسبة المؤيدة للسيدة سميث (55%-3%) إلى (55%+3%) أو (52 بالمئة، 58 بالمئة)، مما يعطي تأكيداً أكبر على أنه أكثرية ناخبي البلدة تؤيد السيدة سميث.

ما يؤثر على فارق الخطأ

يبدو أن ثلاثة أمور تؤثر على فارق الخطأ هي حجم العينة، ونوع العملية التي تجرى لأخذ العينات، وحجم السكان.

حجم العينة—كما تمت الإشارة آنفاً، إن حجم العينة عامل أساسي يؤثر على فارق الخطأ. ففي عملية أخذ العينات، ولمحاولة تقدير نسبة من السكان—مثل ما في الاستطلاعات الهاتفية—ستنتج عينة من 100 فارق خطأ لا يفوق 10 بالمئة تقريباً، وستنتج عينة من 500 فارق خطأ لا يفوق 4.5 بالمئة تقريباً، وستنتج عينة من 1000 فارق خطأ لا يفوق 3 بالمئة تقريباً. وهذا يدل على وجود إعادات متدنية عند محاولة تخفيض فارق الخطأ بزيادة حجم العينة. على سبيل المثال، يتطلب تخفيض فارق الخطأ إلى 1.5% حجم عينة تفوق 4 آلاف.

تصاميم أخذ عينات محتملة—يتحكم باحث المسح الإحصائي أيضاً بتصميم العينة، مما قد يؤثر على فارق الخطأ. والأنواع الشائعة الثلاثة هي أخذ العينات عشوائياً والاتصال الرقمي العشوائي وأخذ العينات الطبقية.

  • التصميم البسيط لأخذ العينات عشوائياً هو تصميم تكون فيه كل عينة لحجم معين معادلة من حيث احتمال اختيارها. وفي هذه الحالة، يمكن اختيار أفراد للانضمام إلى عينة بناءً على جهاز للاختيار العشوائي يعطي كل فرد فرصة اختياره. وغالباً ما تستعمل أجهزة الكمبيوتر لمحاكاة سلسلة عشوائية من الأرقام لدعم هذه العملية.
  • غالباً ما يعتمد المسح الإحصائي الهاتفي الذي يحاول بلوغ الأشخاص ذوي أرقام الهاتف المدرجة وأيضاً ذوي أرقام الهاتف غير المدرجة على تقنية الاتصال الرقمي العشوائي.
  • تشمل التصاميم الطبقية لأخذ العينات التعرف على المجموعات أو الطبقات بناءً على الخصائص المعروفة لكل شخص ضمن المجموعة السكانية، ثم أخذ عينات مستقلة ضمن كل طبقة. ويقدم مثل هذا التصميم المرونة، وحسب طبيعة الطبقة، يستطيع أيضاً تحسين دقة تقديرات الكميات المستهدفة (أو بالتالي، تخفيض فارق الخطأ فيه).

ومن بين الأنواع الثلاثة من أخذ العينات المحتملة، تقدم العينات الطبقية خصوصاً مميزات عندما لا يكون هدف المسح الإحصائي بالضرورة تقدير النسبة من كامل السكان ذات وجهة نظر معينة إنما تقدير الاختلافات في وجهات النظر بين مختلف المجموعات. على سبيل المثال، في حال وجود رغبة في مقارنة المواقف بين سكان ولاية ألسكا الأصليين والأمريكيين الآخرين حول رأيهم المتعلق بالتنقيب عن النفط على أرض فدرالية، سيكون من المنطقي أن تؤخذ عينة بسيطة عشوائياً لجميع الأمريكيين للإجابة على هذا السؤال لكن من المرجح ألا تشمل هذه العينة إلا عدداً قليلاً جداً من سكان ولاية ألسكا الأصليين. وبدلاً من ذلك، قد يكون من المفضل أخذ عينة طبقية يشكل فيها سكان ولاية ألسكا الأصليين نصف العينة بينما يشكل غير سكان ولاية ألسكا الأصليين النصف الآخر.

وفي بعض الأحيان، يتم استخراج العينات على شكل مجموعات حيث تؤخذ عينات لمقاطعات أو مدن قليلة فقط، أو يزور مجري المقابلة شوارع قليلة. ويميل هذا إلى زيادة فارق الخطأ وعلى من يحتسب الخطأ في أخذ العينات أن يأخذه بالاعتبار.

حجم السكان—قد يفاجئ البعض أن العامل الذي يخلف بشكل عام القليل من التأثير على فارق الخطأ هو حجم السكان، أي أن فارق خطأ حجم عينة بالغ الـ100 ضمن مجموعة سكانية مؤلفة من 10 آلاف سيكون معادلاً تقريباً لحجم عينة بالغ الـ100 ضمن مجموعة سكانية مؤلفة من 10 ملايين.

تفسير فارق الخطأ

من الناحية العملية، تحدث أخطاء غير أخذ العينات تستطيع أن تجعل فارق الخطأ منقولاً لاستطلاع أصغر من ما يجب أن يكون لو عكس كافة مصادر عدم التأكد. على سبيل المثال، ربما كان بعض المجيبين على المسح الإحصائي البلدية غير مؤهلين للانتخاب لكنهم ربما أجابوا على أي حال، بينما ربما ضلل آخرون مجري المقابلة حول تفضيلاتهم.

لما لا يتم تعديل فارق الخطأ ليعكس الشكوك المتعلقة بأخذ العينات وغير أخذها؟ الجواب هو أن، خلافاً لخطأ أخذ العينات، لا يمكن عادة تقييم مدى خطأ غير أخذ العينات من العينة بحد ذاتها، حتى لو كانت العينة عينة احتمال.

وتشمل بعض الأمور التي تساعد على تقييم الشكوك غير المتعلقة بأخذ العينة، في حال وجودها، النسبة المئوية من المجيبين الذين يجيبون بـ"لا أعلم" أو "غير مقرر". واحترس عندما تكون هذه الكميات غير معينة. فهي كافة الحالات تقريباً، هناك أشخاص لم يتخذوا قراراً بعد. وقد تؤدي طريقة معالجة هذه الحالات إلى فرق كبير. وقد يكون مجرد فصلها بالتناسب مع آراء هؤلاء الذين أعطوا رأياً مضللاً في بعض الظروف.

من الهام معرفة إذا كانت نتائج المسح الإحصائي هي فعلاً من عينة احتمال على الإطلاق. فمسوح إحصائية كثيرة تقوم بها وسائل الإعلام مبنية على ما يشار إليه بعينات الأنصبة، وبالرغم من أن فروقات الخطأ تنقل منها، إلا أنها لا تنطبق بشكل صارم.

لقد نمت نسبة عدم الإجابة على المسح الإحصائي بشكل إجمالي خلال السنوات الأخيرة ويتزايد أخذها بالاعتبار في تفسير النتائج المنقولة. ولا تعطي التقارير الاعلامية عادةً نسبة الإجابة، بالرغم من أنها قد تكون دون 50 بالمئة بكثير. وعندما تهمك النتائج، حاول دائماً معرفة نسبة عدم الإجابة وما تم القيام به بالنسبة لها.

احترس مما يتم تقديره

من الشائع أن تفيد استطلاعات الآراء السياسية بأن فارق الخطأ زائد أو ناقص 3 بالمئة، إلا أنه قد يصادف في استطلاعين منفصلين بين جونز وسميث، أن يكون جونز في أحد الاستطلاعين متفوقاً بنسبة 2 بالمئة بينما يبين الاستطلاع الآخر أن جونز يسبق بنسبة 10 بالمئة. فكيف يتم ذلك؟

إن إحدى المميزات المضللة المتعلقة بأحدث التقارير الإعلامية حول استطلاعات الآراء السياسية هي أنها تبلغ عن فارق الخطأ المرتبط بالنسبة المؤيدة لمرشح معين، وليس فارق خطأ تفوق مرشح معين على الآخر. ولشرح المشكلة، افترض أن استطلاعاً للآراء يجد أن السيد جونز يحظى بتأييد بنسبة 45 بالمئة، بينما تحظى السيدة سميث بتأييد بنسبة 42 بالمئة، ولا تزال نسبة 14 بالمئة بدون قرار، وهناك فارق خطأ بنسبة 3 بالمئة لكل فئة.

وإذا أشرنا إلى أن السيد جونز قد يحظى بتأييد بنسبة تتراوح بين 42 بالمئة و48 بالمئة في مجموعة الناخبين، بينما قد تحظى السيدة جونز بنسبة تتراوح بين 38 بالمئة و44 بالمئة من التأييد، فلن تكون المفاجأة هائلة لو ينقل استطلاع آخر تقدم السيد جونز بنسبة 10 بالمئة (مثل 48 بالمئة مقابل 38 بالمئة) مقابل تقدم السيدة سميث بنسبة 2 بالمئة (مثل 44 بالمئة مقابل 42 بالمئة).

وبعبارات فنية أكثر، يملي قانون الاحتمال أن الفرق بين نسبتين غير مؤكدتين (أي تقدم مرشح معين على آخر في استطلاع للأراء السياسية حيث يتم تقدير كلاهما) يرتبط به شك أكثر من أي من النسبتين وحدهما.

ووفقاً لذلك، يجب أن يكون فارق الخطأ المرتبط بتقدم مرشح معين على آخر أكبر من فارق الخطأ المرتبط بنسبة واحدة، وهذا ما تذكره عادة التقارير الإعلامية (ومن هنا الحاجة إلى الاحتراس مما يتم تقديره!).

إلى حين تنظيم الهيئات الإعلامية للإجراءات التي تتخذها في نقل التقارير بالتماشي مع الفروقات الفعلية في النتائج بين كافة استطلاعات الآراء السياسية، فإن حكم التجربة هو ضرب فارق الخطأ المنقول حالياً بـ1.7 للحصول على فارق الخطأ لتقدم مرشح معين على آخر. وهكذا يصبح فارق الخطأ البالغ نسبة 3 بالمئة 5 بالمئة تقريباً، وتصبح نسبة 4 بالمئة من فارق الخطأ المبلغ 7 بالمئة تقريباً عندما يؤخذ حجم التقدم بالاعتبار.

أين أستطيع الحصول على المزيد من المعلومات

هناك المزيد الكثير الذي يمكن قوله عن استعمال مصطلح "فارق الخطأ". وما يثير العجب هو أن معناه يثير بعض الجدل. ولهؤلاء المعنيين بقراءة المزيد عن هذا الجدل، فقد تكون نقطة الانطلاق الجيدة هي مقالة ريتشارد مورن في صحيفة واشنطن بوست "حكمة غير اعتيادية" بتاريخ الأحد 14 يونيو/حزيران 1998.

وبما أن معظم الاستطلاعات لا تزال تجرى على الهاتف، قد تنشأ قضايا كثيرة متعلقة بأخطاء غير أخذ العينات وإعتبارات أخرى لفارق الخطأ مثل تلك المجسدة في فارق الخطأ. ويقدم الفصل 4 المزيد عنها.


قانوني
إتصل بنا

ما هو الاستقصاء

What is a Survey?