مفهوم قضیه حد مرکزی (حل مثال در R)

Understanding the Central Limit Theorem Using R

در این مقاله قصد دارم به مفهوم قضیه حد مرکزی با ارائه مثال بپردازم.

قضیه حد مرکزی (Central limit theorem) چیست ؟

نام قضیه حد مرکزی در حال حاضر برای نتایج مختلفی از رفتار توزیع مجموع (یا میانگین) متغیرهای تصادفی یا عناصر تصادفی که مقادیری در فضاهای گوناگون، انتخاب می کنند به کار برده می شود. به طور کلی یکی از مسائل مهم و قابل توجه در نظریه احتمالات، تعیین شرایط لازم و کافی برای تقریب قانون مجموع (یا میانگین) متغیرهای تصادفی با توزیع نرمال است. صفت مرکزی توسط (پولیا، 1920) بدین علت داده شده است که این قضیه نقشی مرکزی در نظریه احتمالات ایفا می کند و نه بدین دلیل که رفتار مرکز توزیع را در مقابل کناره های آن توضیح می دهد. قضیهی حدّ مرکزی نشان میدهد که بسیاری از پدیدههای طبیعی، با تقریب خوبی یک توزیع نرمال استاندارد هستند.

تعریف قضیه حد مرکزی :

“زمانی که حجم نمونه به اندازه کافی بزرگ باشد توزیع میانگین نمونه ای

از متغیر تصادفی با هر توزیعی تقریبا دارای توزیع نرمال می باشد.”

آیا می توان نتیجه گرفت که هر زمان که تعداد نمونه ها زیاد باشد متغیر مورد نظر دارای توزیع نرمال است ؟ برای پاسخ به این سوال لازم به ارائه مثال است که در ادامه آورده شده است.

آیا زمانی که حجم نمونه زیاد باشد داده ها نرمال می شوند ؟

متاسفانه این مفهوم در ذهن برخی دانشجویان و محققین شکل گرفته است که در زمانی که حجم نمونه زیاد باشد بر اساس قضیه حد مرکزی داده های مورد نظر از توزیع نرمال پیروی می کنند. در صورتی که این چنین نیست و قضیه حد مرکزی در خصوص زیاد بودن اندازه نمونه در میانگین های نمونه ای صحبت می کند. برای این که مفهوم قضیه حد مرکزی را برایتان باز کنم ابتدا لازم است که مثال زیر را با هم ببینیم :

تولید اعداد تصادفی از توزیع نمایی

در این مثال با استفاده از نرم افزار R از توزیع نمایی (با نرخ 2) با اندازه نمونه به ترتیب 10، 100، 1000 و 10000 عدد تصادفی تولید کرده و مانند شکل زیر به ترتیب برای اعداد تصادفی تولید شده نمودار هیستوگرام رسم کرده ایم :

مثال هیستوگرام توزیع نمایی

همانطوری که مشاهده می شود وقتی توزیع متغیر تصادفی نمایی باشد هر چقدر هم که حجم نمونه زیاد شود باز هم توزیع نمایی باقی می ماند. در شکل فوق هیستوگرام متغیر تصادفی نمایی با حجم 1000 و 10000 بیانگر این صحبت می باشد.

تولید اعداد تصادفی از توزیع یونیفرم

همین کار را برای توزیع یکنواخت (یونیفرم) نیز انجام می دهیم. با استفاده از نرم افزار R از توزیع یونیفرم (3 و 3-)، با اندازه نمونه به ترتیب 10، 100، 1000 و 10000 عدد تصادفی تولید کرده و مانند شکل زیر به ترتیب برای اعداد تصادفی تولید شده نمودار هیستوگرام رسم کرده ایم :

مثال هیستوگرام از متغیر تصادفی یکنواخت

همانطوری که در نمودار بالا می بینیم با افزایش نمونه توزیع متغیر تصادفی از یونیفرم به توزیع نرمال تبدیل نشد ! پس توزیع متغیر مورد نظر ما چه نمایی باشد، چه یونیفرم و یا هر توزیع دلخواه دیگری به غیر از توزیع نرمال داشته باشد با افزایش نمونه هیچگاه نرمال نمی شود. طبیعی است که هر چه قدر حجم نمونه از توزیع دوجمله ای زیاد باشد باز هم توزیع متغیر مورد نظر دوجمله ای باقی می ماند.

“اگر جامعه نرمال باشد برای هر تعداد از حجم نمونه توزیع میانگین نمونه ها نرمال خواهد بود.”

برای بیان مفهوم نرمال بودن توزیع میانگین های نمونه ای در قضیه حد مرکزی در نمونه های با حجم زیاد مثال زیر را ارائه می دهیم :

توزیع میانگین نمونه ای از متغیر تصادفی نمایی

در این مثال با استفاده از نرم افزار R، از توزیع نمایی (با نرخ 2) به ترتیب 40، 400، 4000 و 40000 بار نمونه های 1000 تایی گرفته و میانگین آن ها را محاسبه می کنیم. حال برای این میانگین های نمونه ای از توزیع نمایی نمودار هیستوگرام رسم می کنیم که به صورت زیر می باشد :

مثال توزیع نمونه ای در قضیه حد مرکزی

با توجه به شکل بالا مشاهده می شود که با افزایش حجم نمونه، توزیع میانگین های نمونه ای از توزیع نمایی به سمت توزیع نرمال میل می کند. همچنین با توجه به این که از توزیع نمایی با نرخ 2 نمونه گیری کردیم، میانگین نمونه ای بایستی برابر 0.5 باشد که همانطور در نمودارهای هیستوگرام مشاهده می کنیم، مرکز نمودار تقریبا بر روی مقدار 0.5 قرار دارد و مقدار میانگین نمونه ای را به طور تقریبی نشان می دهد.

توزیع میانگین نمونه ای از متغیر تصادفی یکنواخت

به عنوان مثالی دیگر، همین کار را برای توزیع یونیفرم انجام می دهیم. بدین صورت که با استفاده از نرم افزار آر، از توزیع یکنواخت (3 و 3-) به ترتیب 40، 400، 4000 و 40000 بار نمونه های 1000 تایی گرفته و میانگین آن ها را محاسبه می کنیم. حال برای این میانگین های نمونه ای از توزیع یکنواخت نمودار هیستوگرام رسم می کنیم که به صورت زیر می باشد :

مثال توزیع نمونه ای یونیفرم در قضیه حد مرکزی

با توجه به شکل بالا مشاهده می شود که با افزایش حجم نمونه، توزیع میانگین های نمونه ای از توزیع یونیفرم به سمت توزیع نرمال میل می کند. همچنین با توجه به این که از توزیع یکنواخت (3 و 3-) نمونه گیری کردیم، انتظار داریم میانگین نمونه ای برابر صفر باشد، همانطور که در نمودارهای هیستوگرام مشاهده می کنیم، مرکز نمودارها تقریبا بر روی مقدار صفر قرار دارد و مقدار میانگین نمونه ای را به طور تقریبی نشان می دهد.

جمع بندی

همانطوری که مشاهده کردیم، افزایش نمونه هر چه میزان که می خواهد باشد توزیع متغیر تصادفی را تغییر نمی دهد. این توزیع میانگین نمونه ای از است که با افزایش نمونه به سمت توزیع نرمال میل می کند. پس در هنگامی که داده های مورد استفاده در یک تحقیق از توزیع نرمال پیروی نکند (اگر اختلاف به صورت فاحش باشد) بهتر است از روش های ناپارامتری برای اعلام نتایج استفاده شود. همچنین برای مطالعه بیشتر می توانید کتاب مبانی احتمال، نویسنده : شلدون راس را مطالعه بفرمایید.

همچنین برای دریافت مشاوره آماری رایگان اینجا کلیک کنید.

امتیاز ۰ از ۵ – ۰ رای
spinner در حال ثبت رای
برچسب ها

مسعود علی مردی

بیش از 6 ساله که تحلیل گر آماری هستم. جای خالی یک مرجع تخصصی آماری را به شدت حس می کردم و تصمیم گرفتم مرجعی کامل برای هموطنان عزیزم ایجاد کنم.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا