إنَّ الفكرةَ المركزيّة في الإحصاء هي أنَّه يمكنك أن تقول شيئًا عن التعداد السُكّانيّ من خلال النظر لعيّنةٍ صغيرةٍ فقط.
وبدون هذه الفكرة لن تكون هنالك استطلاعاتٌ للرأي أو توقّعاتٌ للانتخابات، لن يكون هنالك أيُّ وسيلة لاختبار العقاقير الطبيّة الجديدة، أو سلامة الجسور وما إلى ذلك.
إنّها نظريّة (الحدّ المركزيّ – central limit theorem ) والتي هي إلى حدٍّ كبيرٍ مسؤولة عن حقيقةُ أنَّه بإمكانِنا أن نفعل كُلَ تلكَ الأمور ونُسيطرَ على الشكوكِ المعنيّة.
ولكي نرى كيف تعمل هذه النظريّة، تخيّل أنك تريد أن تعرف متوسّط وزن السُكّان في المملكة المتحدة.
يمكنك الخروج وقياس أوزانِهم، على سبيل المثال، 100 شخص كنت قد اخترتهم عشوائيًّا وقُمت بحساب متوسِط وزنهم وأسميتَ هذه المجموعة بـ (متوسّط العيّنة)، الآن من المفترض أن تُعطيكَ هذه العيّنة فكرةً جيّدةً عن متوسّط وزن سكان البلد.
ولكن، ماذا لو حدثَ أنكَ قد اخترت في العيّنة الأشخاص ذوي الوزن الثقيل فقط أو النحيلين فقط؟
لمعرفة مدى دقة تمثيل متوسط الأوزان التي حصلت عليه، فأنت بحاجةٍ إلى معرفةِ الإختلاف بين السكّان ومتوسّط وزن عيّنات المئة شخص: فإذا كنت قد أخذت الكثير والكثير من عيّنات المئة شخص وعمِلت على إيجاد متوسط الوزن لكلٍّ منهم، عندها ما مدى تغيّر هذه المجموعة من الأرقام؟
وماذا سيكون متوسّطها ( متوسّط المتوسّطات) بالمقارنة مع متوسّط الوزن الحقيقي لدى السكان؟
على سبيل المثال، افترض أنك تعرف أنه إذا أخذت الكثير والكثير من عيّنات المئة شخص وكتبت أسفلها متوسّط وزن كل عيّنة، فستكون قد حصلتَ على كل القيم من 10 كغ وحتّى 300 كغ وذلك ضمن نسبةٍ متساويّة.
وبعد ذلك سيخبرك بأنّ طريقة تقدير المتوسّط العام من خلال أخذ عيّنة واحدة من 100 شخص ليست جيّدة جدًا، لأن هناك الكثير من التبايُن، فمن المُحتمَل أن تحصل على أيٍ من القيِم المُحتملة، وقد لا تعرِف أي واحدٍ هو الأقرب إلى متوسّط الوزن الحقيقي للسكّان.
لذا كيف يمكننا أن نقول أيّ شيءٍ عن توزيع متوسّطات المئة شخص والذي يسمّى (توزيع العيّنات) عندما لا نعرف أيّ شيء عن توزيع الوزن بين السكّان؟
هنا يأتي دور نظريّة الحد المركزي حيث تقول النظريّة: « بالنسبة لعيّنةٍ كبيرة بما فيه الكفاية فإنَّ توزيع العينات يكون بتقريب التوزيع الطبيعي، حيث يأخذ هذا التوزيع شكل الجرس».
(والجدير بالذكر أن المُتفق عليه أنَّ العينة تكون جيّدةً بما فيه الكفاية عندما تكون بحجم 30).
تُظهر الصورة أمثلة مُختلفة للتوزيع الطبيعي، مع متوسّطات وتبايُنات مُختلفة.
إن المتوسّط من هذا التوزيع الطبيعي ( متوسّط المتوسّطات المقابلة لرأس الجرس) هو نفس متوسّط وزن السّكان.
والتباين في هذا التوزيع الطبيعي أي مدى اختلافه عن المتوسّط ( المُشار إليه بعرض الجرس) يعتمد على حجم العيّنة: فكلّما كانت العيّنة أكبر، كلّما كان الفرق أصغر.
وهنالك مُعادلة تعطي العلاقة بالضبط.
لذا إن كان حجم العيّنة لديكَ كبيرًا بما فيه الكفاية ( أكبر من 30 ) لذا فإنَّ التباين الصغير نسبيًا في التوزيع الطبيعي معناه أنَّ متوسّط الوزن الذي قُمت بأخذه قريبٌ من متوسّط التوزيع الطبيعي (طالما أنّ الجرس ضيّقٌ جدًا).
وبما أنَّ متوسّط هذا التوزيع الطبيعي يساوي متوسّط الوزن الحقيقي بينَ السكّان، فإنَ المتوسّط الذي أخذتَه هو تقريبٌ جيّد للمتوسّط الحقيقي.
وبإمكانكَ جعلُ كل هذا دقيقًا، فعلى سبيل المثال، يمكنك أن تقول بالضبط مدى ثِقتَك من أنّ المتوسّط الحقيقي هو ضمنَ مسافة معيّنة من متوسّط العيّنة الخاص بك، بإمكانك أيضًا استخدام النتيجة لحساب كَم عيّنةٍ تحتاج للحصول على تقدير من دقّة مُعطاة.
إنّها نظريّة الحد المركزيّ والتي تُضفي الدِّقةَ على فنِ الإستدلال الإحصائيّ، وإنها أيضًا وراء حقيقة أن التوزيع الطبيعيّ هو واسعُ الإنتشارِ وكُلِّيُ الوجود.
- ترجمة: رامي الحرك
- تدقيق: أسمى شعبان
- تحرير: ناجية الأحمد
- المصدر