آموزش تحلیل واریانس در SPSS

Analysis Of Variance (ANOVA)

مقدمه آموزش تحلیل واریانس

این مقاله به آموزش تحلیل واریانس (ANOVA) اختصاص دارد. قصد داریم پیشفرض های تحلیل واریانس، زمان استفاده و نحوه انجام آنووا در نرم افزار SPSS را با ارائه مثال و به صورت کاملا کاربردی آموزش دهیم. اجازه دهید آموزش را با دو مثال شروع کنیم :

مثال کاربردی اول در تحلیل واریانس

در یک مطالعه ممکن است ابتدا گروهی از افراد را انتخاب کنید. سپس این افراد را به طور تصادفی به سه یا چند گروه کوچکتر تقسیم کنید. به گونه ای که هر شرکت کننده به یک و فقط یک گروه اختصاص داشته باشد. سپس این افراد را در شرایط مختلف قرار دهید و متغیر مد خود را اندازه ­گیری و بررسی کنید. به عنوان مثال، یک محقق می­ خواهد بداند آیا استراتژی­ های مختلف گام برداشتن بر زمان اتمام مارتن تاثیر می­ گذارد یا خیر. محقق به طور تصادفی داوطلبان را به گروه ­های مختلف تقسیم می­ کند. در اینجا زمان اتمام ماراتن، متغیر وابسته است. برای مقایسه زمان اتمام ماراتن در بین سه گروه می توانیم از آزمون تحلیل واریانس استفاده کنیم.

الف) گروهی که آهسته شروع به دویدن می کنند و سپس سرعتشان را افزایش می دهند.

ب) گروهی که سریع شروع به دویدن می کنند و سپس سرعت خود را کم می­ کنند.

ج) گروهی که با سرعت ثابت در تمام مدت حرکت می­ کنند.

مثال کاربردی دوم در تحلیل واریانس

طرح مطالعه دوم به این شکل است که گروهی از افراد را انتخاب و سپس بر اساس برخی متغیر­های مستقل، به گروه­ های مختلف تقسیم می­ شوند. باید توجه داشت که باز هم هر فرد فقط به یک گروه اختصاص داشته باشد. به عنوان مثال تقسیم بندی بر اساس سطح تحصیلات می تواند باشد. سپس در هر گروه متغیر وابسته مورد نظر را اندازه گیری می­ کنیم. مثلا یک محقق علاقه مند است که آیا تفاوتی بین افراد در تحصیلات کارشناسی، کارشناسی ارشد و دکتری از نظر IQ وجو دارد یا نه. (جهت پاسخ به این سوال از تحلیل واریانس استفاده می کنیم). در اینجا IQ به عنوان متغیر وابسته اندازه گیری می­ شود.

تحلیل واریانس جهت مقایسه میانگین یک متغیر کمی در چند گروه مستقل استفاده می شود.

کاربرد تحلیل واریانس (ANOVA)

از تحلیل واریانس یک طرفه (یک راهه) برای تعیین اینکه آیا بین میانگین ­های سه یا چند سطح از متغیر مستقل، تفاوت معناداری وجود دارد یا خیر استفاده می­ شود. به عنوان مثال می ­توانیم برای بررسی عملکرد تحصیلی بر اساس سطح اضطراب دانش آموزان از تحلیل واریانس یک ­طرفه استفاده کنیم. اضطراب دانش آموزان (متغیر مستقل) را به سه گروه  کم استرس، متوسط و پر استرس تقسیم می ­کنیم. سپس تفاوت عملکرد تحصیلی بین دانش آموزان سه گروه را با استفاده از آزمون تحلیل واریانس مورد بررسی قرار می دهیم.

توجه داشته باشید که آنووا تنها این اطلاع را به شما می­ دهد که حداقل بین دو گروه اختلاف معنی داری وجود دارد. همچنین مشخص نمی کند که این دو گروه، کدام هستند. در صورتی که ممکن است گروه های بیشتری در مطالعه خود داشته باشید و بخواهید اختلاف دو گروه دلخواه خودتان را بررسی کنید. لذا تعیین اینکه کدام گروه ها متفاوت هستند نکته مهمی است که  شما می ­توانید این کار را  با استفاده از آزمون های تعقیبی انجام دهید.

نکته : اگر در مطالعه شما علاوه بر یک متغیر مستقل و یک متغیر وابسته، متغیر سومی (متغیر کووریت) نیز وجود داشته باشد که می­ خواهید تاثیر آن را در نتایج کنترل کنید. لازم است برای بررسی از آزمون تحلیل کوواریانس (ANCOVA) استفاده کنید.

آموزش آنووا تحلیل واریانس

تفاوت آنالیز واریانس (آنووا) یکطرفه و دو طرفه

تحلیل واریانس یک طرفه، اساساً برای بررسی اختلاف میانگین بین سه یا چند سطح یا گروه استفاده می شود. در حالی که آنووا دو طرفه برای بررسی روابط متقابل دو متغیر مستقل بر روی یک متغیر وابسته طراحی استفاده می شود. تحلیل واریانس یک طرفه فقط شامل یک عامل یا متغیر مستقل است. در حالی که در تحلیل واریانس دو طرفه دو متغیر مستقل وجود دارد.

همچنین می توان بیش از دو متغیر مستقل در مدل آنووا استفاده شود. این یک آزمون تحلیل واریانس n طرفه (n-way ANOVA) است. (n تعداد متغیرهای مستقل می باشد). به عنوان مثال، اختلاف در نمرات ضریب هوشی را می توان به طور همزمان در تحصیلات، جنسیت، گروه سنی، قومیت و غیره بررسی نمود.

آزمون فرض های تحلیل واریانس (ANOVA)

درست مانند هر نوع آزمون آماری دیگری که ممکن است مطالعه کرده باشید، تحلیل واریانس ANOVA نیز دارای یک فرض صفر و یک فرض یک می باشد.

فرض صفر : بین میانگین گروه های مورد مطالعه اختلاف معنی داری وجود ندارد.

فرض یک : بین میانگین گروه های مورد مطالعه اختلاف معنی داری وجود دارد.

فرض صفر در تحلیل واریانس زمانی تایید می شود که تمام میانگین­ ها برابر باشند. یا تفاوت معناداری نداشته باشند. فرضیه یک (فرض مقابل) زمانی برقرار است که حداقل میانگین دو گروه با هم اختلاف معنی داری داشته باشند.

چرا گروه­ ها را با چندین آزمون T مقایسه نمی­ کنیم ؟

جواب : به دلیل سهولت و عدم افزایش خطای نوع اول !

با هر بار انجام آزمون تی این احتمال وجود دارد که شما خطای نوع اول را انجام دهید. این خطا معمولا 5 درصد در نظر گرفته می ­شود. با اجرای دو یا چند آزمون تی بر روی داده ­های مشابه، احتمال خطای نوع اول را افزایش می دهید. تحلیل واریانس این خطا را کنترل می­ کند. تا خطای نوع اول در سطح 5 درصد باقی بماند و اطمینان حاصل می کند که نتایج از نظر آماری قابل قبول هستند.

پیشفرض های تحلیل واریانس

در این قسمت قصد داریم پیش فرض های تحلیل واریانس را آموزش دهیم :

هنگامی که تصمیم می ­گیرید داده ­های خود را با استفاده از تحلیل واریانس تحلیل کنید. بخشی از این فرایند صرف بررسی این می ­شود که آیا داده­ های شما با این روش قابل تحلیل هستند یا خیر. این کار با بررسی شش پیشفرضی که در ادامه آورده شده؛ ممکن می ­شود. در صورت برقرار بودن پیش فرض ها شما می­ توانید مطمئن باشید که نتایج حاصل از تحلیل واریانس معتبر و قابل اطمینان است.

قبل از اینکه این شش فرض را به شما معرفی کنیم، توجه داشته باشید اگر هنگام تجزیه و تحلیل داده های خود با استفاده از SPSS یک یا چند مورد از این پیش فرض ها نقض شوند، تعجب نکنید. چرا که هنگام کار با داده ­های واقعی این یک اتفاق معمول است. با این حال نگران نباشید چرا که اغلب راه ­حل هایی وجود دارد. بیایید این شش پیشفرض را مورد بررسی قرار دهیم :

پیش فرض یکم : متغیر وابسته باید پیوسته باشد.

متغیر وابسته شما باید پیوسته (فاصله ای یا نسبتی) باشند مانند زمان (با واحد ساعت)، هوش (با واحد نمره ضریب هوشی)، نمره آزمون (از 0-20) و وزن ( با واحد کیلوگرم).

پیش فرض دوم : متغیر پیوسته باید کیفی (طبقه بندی شده) باشد.

متغیر مستقل باید شامل دو یا چند سطح مستقل طبقه بندی شده باشد. (متغیر اسمی یا متغیر ترتیبی)، از جمله متغیر های اسمی­ توان به جنسیت (مرد و زن)، قومیت (امریکایی، اسپانیایی و افریقایی) و حرفه (جراح، پزشک، پرستار و دندانپزشک) و متغیر ترتیبی مثل : غلظت کلسترول (2 گروه شامل 5 میلی مول در لیتر یا کمتر و بالاتر از 5 میلی مول در لیتر)، سطح فعالیت بدنی (سه گروه شامل کم، متوسط و زیاد) و شاخص توده بدنی (چهار گروه شامل کم وزن، طبیعی، اضافه وزن و چاق) اشاره کرد.

پیش فرض سوم : گروه ها بایستی از هم مستقل باشند.

گروه های مستقل بایستی کاملا از هم مستقل باشند برای مثال اگر دو گروه زن و مرد داشته باشیم. واضح است که زن ها نسبت مرد ها کاملا جدا و مستقل هستند. برای مثال برای مقایسه میانگین سطح کلسترول خون افراد قبل از مصرف داروی خاص، یک ماه، دو ماه و سه ماه بعد دیگر نمی توان از آزمون تحلیل واریانس استفاده کرد. چرا که سطح کلسترول خون افراد یکسانی در چهار دوره زمانی مورد بررسی قرار گرفته است. جهت بررسی این اختلاف بایستی از طرح اندازه های مکرر در حالت پارامتری و آزمون فریدمن در حالت ناپارامتری استفاده کرد.

پیش فرض چهارم : نباید داده پرت داشته باشیم.

در بین داده های پژوهش نباید داده پرت قابل توجهی وجود داشته باشد. چرا که وجود داده پرت ممکن است بر نتایج بدست آمده از تحلیل واریانس تاثیر منفی بگذارد و از اعتبار نتایج آن کاهش دهد. خوشبختانه هنگام استفاده از SPSS برای اجرای تحلیل واریانس به راحتی ­ می ­توانید داده­ های پرت را تشخیص دهید.

پیش فرض پنجم : متغیر وابسته باید دارای توزیع نرمال باشد.

متغیر وابسته در هر گروه از متغیر مستقل  باید دارای توزیع نرمال باشد. (از نظر تکنیکی، این باقیمانده ها هستند که باید دارای توزیع نرمال باشند، اما نتایج یکسان خواهد بود). بنابراین، به عنوان مثال، اگر بخواهیم قدرت پای سه گروه (بازیکنان آماتور فوتبال، نیمه حرفه ای و حرفه ای) را مقایسه کنیم. مقادیر قدرت پای آن ها (متغیر وابسته) باید برای گروه بازیکنان آماتور به طور نرمال توزیع شود برای نیمه حرفه­ ای­ ها و حرفه ­ای­ ها نیز باید به همین صورت باشد.

پیش فرض ششم : پراکندگی متغیر وابسته در گروه ها همسان باشد.

این بدان معنی است که واریانس در همه گروه ها برابر باشد. هنگام اجرای تحلیل واریانس (آنووا)، نتایج آزمون لون برای همگنی واریانس­ ها را در خروجی خواهید دید.

در صورت نقض پیش فرض های آنووا چکار کنیم ؟

با استفاده از نرم افزار SPSS می توانید پیش فرض های چهارم تا ششم را جهت اجرای تحلیل واریانس بررسی کنید. قبل از انجام این کار، باید اطمینان حاصل کنید که داده های شما با پیش فرض های اول تا سوم تطابق دارد. اگر چه برای این کار نیازی به SPSS نیست.

به یاد داشته باشید که اگر آزمون­ های آماری را بر روی این پیش فرض ها به درستی اجرا نکنید، ممکن است نتایجی که هنگام اجرای تحلیل واریانس (ANOVA) بدست می آورید معتبر نباشند. به همین دلیل ما تعدادی راه حل برای چنین مواقعی ارئه می ­دهیم. فرض اول تا سوم که مربوط به طراحی مطالعه است، راه حل های جایگزین برای پیشفرض های دیگر در ادامه آمده است.

در صورتی که در تحلیل واریانس داده ها نرمال نباشد چکار کنیم ؟

تحلیل واریانس (آنووا) یک آزمون مقاوم در برابر فرض نرمالیتی در نظر گرفته است. این بدین معنی است که آزمون آنووا ANOVA می ­تواند با داده های غیر نرمال (داده ­های چوله یا کشیده) ازمون را انجام دهد. فقط ممکن است تاثیر اندکی بر روی خطای نوع اول داشته باشد. با این حال زمانی که اندازه گروه ­های شما کوچک باشد. دو گزینه برای شما وجود دارد : اول این که داده های خود را با استفاده از الگوریتم های مختلف تبدیل کنید تا شکل توزیع شما به توزیع نرمال تغییر کند. دوم این که از آزمون نا پارامتری Kruskal-Wallis H استفاده کنید که نیازی به فرض نرمال بودن ندارد.

در صورتی که واریانس گروه ها همگن نباشد چکار کنیم ؟

در صورت نقض فرض همگنی واریانس ها، دو آزمون وجود دارد که می توانید اجرا کنید: اول آزمون Welch و دوم آزمون Brown and Forsythe. همچنین شما می توانید از آزمون کراسکال والیس (Kruskal-Wallis) استفاده کنید. در بیشتر شرایط نشان داده شده است که آزمون Welch بهترین است. هر دو آزمون Welch و Brown and Forsythe داخل SPSS در دسترس هستند.

آموزش اجرای تحلیل واریانس (ANOVA) در نرم افزار SPSS

روش های مختلفی برای اجرای تحلیل واریانس ANOVA وجود دارد. با این حال، در این مقاله راهنمای جامع و گام به گام در مورد چگونگی انجام این کار با استفاده از نرم افزار SPSS ارائه می شود. در ادامه به شما نحوه انجام آزمون تحلیل واریانس و همچنین آزمون های تعقیبی را در این نرم افزار آموزش خواهیم داد.

مثال انجام شده تحلیل واریانس در SPSS به همراه تفسیر

در مطالعه ای میزان استرس ناشی از اپیدمی کرونا در بین کارکنان یک شرکت تولیدی در استان تهران مورد بررسی قرار گرفته است. در این مطالعه اطلاعات 68 نفر جمع آوری شده است. در این مطالعه قصد داریم میزان استرس ناشی از کرونا (متغیر وابسته) را سنین مختلف (متغیر مستقل) مورد بررسی قرار داده و اختلاف آن ها را شناسایی کنیم.

توجه داشته باشید که متغیر مستقل مد نظر ما (سن) دارای چهار سطح می­ باشد. در این مطالعه 22 نفر زیر 30 سال، 32 نفر بین 30 تا 45 سال، 11 نفر بین 46 تا 60 سال و 3 نفر دارای سن 60 سال به بالا می ­باشند. تصویر زیر نمایی از فایل دیتای مورد استفاده می باشد.

آموزش ورود دیتا در تحلیل واریانس

پس از ورود داده ها به نرم افزار SPSS برای انجام این آزمون می توانیم مانند شکل زیر، از طریق منوی Analyze به کادر مربوط به آنووا دسترسی پیدا کنیم.

مسیر اجرای تحلیل واریانس در SPSS

نحوه انجام تحلیل واریانس در SPSS

سپس با انتخاب گزینه One-Way ANOVA کادر زیر ظاهر می ­شود.

پنجره آنووا در SPSS

همان طور که می­ دانید در این مطالعه یک متغیر وابسته به اسم استرس ناشی از کرونا داشتیم.

  • متغیر وابسته استرس ناشی از کرونا را به باکس Dependent list منتقل می کنیم.
  • سپس متغیر مستقل سن را به باکس Factor انتقال می ­دهیم.
  • با کلیک بر روی گزینه post Hoc کادری برای شما به نمایش در می ­آید.
  • برای انجام آزمون تعقیبی ما آزمون LSD را انتخاب می­ کنیم.

نحوه انجام آزمون تعقیبی در SPSS

از آنجایی که هنوز نمی‌دانیم فرض برابری واریانس‌ها رد یا پذیرفته می شود. گزینه LSD از قسمت فرض برابری واریانس‌ها و Tamhane’s T2 را از قسمت نابرابری واریانس‌ها انتخاب می ­کنیم. کار ما در این قسمت تمام شده است. بنابراین بر روی گزینه continue کلیک کرده تا کادر فوق بسته شود. سپس بر روی گزینه options کلیک می ­کنیم تا کادر زیر باز شود.

نحوه انجام آزمون لوین در SPSS

در قسمت تنظیمات اختیاری گزینه‌های مرتبط با تحلیل واریانس، گزینه آمار توصیفی (Descriptive) و آزمون برابری واریانس‌ها (Homogeneity of variance test) را فعال می نماییم. در نهایت با کلیک بر روی گزینه OK آزمون تحلیل واریانس را اجرا می­ کنیم. چندین جدول در خروجی داده می شود. در ادامه نحوه تفسیر این جداول را به شما خواهیم گفت.

اولین جدول، جدول شاخص های توصیفی است. این جدول برخی از شاخص های مفید از جمله میانگین، انحراف معیار و فاصله اطمینان 95 درصدی برای متغیر وابسته به تفکیک هر سطح (سطوح مختلف سنی)  ارائه می­ دهد. این ارقام زمانی که به توصیف داده ­های خود نیاز داشته باشید مفید است.

نحوه تفسیر خروجی های تحلیل واریانس

بر اساس مقادیر فاصله اطمینان نیز می‌توان حدس‌هایی در مورد برابری استرس ناشی از کرونا در گروه های سنی مختلف مطرح کرد. به نظر می‌رسد که کمترین استرس ناشی از کرونا مربوط به رده سنی زیر 30 سال بوده است. در حالی که بیشترین میزان در اختیار گروه سنی 60 سال به بالا قرار گرفته است. ولی با توجه به نمونه تصادفی گرفته شده باید برای اثبات این فرضیه، دست به انجام آزمون آماری یا همان تحلیل واریانس زد.

آموزش تحلیل واریانس [تفسیر خروجی آزمون لوین]

یکی از روش‌های سنجش و انجام آزمون برابری واریانس‌ها، استفاده از آماره لوین است. در جدول مشاهده می شود سطح معنی داری آزمون لوین بیشتر از 0.05 است. در نتیجه فرض برابری واریانس ها در گروه های سنی تایید می شود.

تفسیر نتایج آزمون لوین

جدول فوق مربوط به خروجی آزمون تحلیل واریانس می ­باشد. این خروجی مهمترین قسمت در آنالیز واریانس یا ANOVA است. در ستون آخر و همچنین ستون F که در تصویر دیده می‌شود، مشخص است که فرض صفر یعنی برابری میانگین در بین گروه ­های سنی رد می‌شود. مقدار معنی داری (sig) کمتر از 0.05 بوده است. در نتیجه، حداقل بین دو گروه سنی اختلاف معنی داری از نظر استرس ناشی از کرونا وجود دارد.

تفسیر خروجی آزمون های تعقیبی در تحلیل واریانس

تفسیر نتایج آزمون های تعقیبی

با توجه به سطح معنی داری در جدول فوق ملاحظه می شود. بین گروه سنی زیر 30 سال با بقیه گروه های سنی از نظر میزان استرس ناشی از کرونا اختلاف معنی داری وجود دارد. در صورتی که سایر گروه های سنی با هم اختلاف معنی داری ندارند.

خلاصه و جمع بندی آموزش تحلیل واریانس

در این مقاله به کمک مراحل مشخص شده، آنالیز واریانس در SPSS را اجرا و نتایج حاصل را تفسیر  و تحلیل کردیم. به کارگیری آنالیز واریانس یا ANOVA دارای پیشفرض هایی است. بعضی از آن‌ها هنگام انجام آنووا باید مورد بررسی قرار گیرند. تا صحت نتایج بدست آمده، مشخص شود.

منتظر ادامه آموزش باشید…

امتیاز ۵ از ۵ – ۱ رای
spinner در حال ثبت رای
برچسب ها

مسعود علی مردی

بیش از 6 ساله که تحلیل گر آماری هستم. جای خالی یک مرجع تخصصی آماری را به شدت حس می کردم و تصمیم گرفتم مرجعی کامل برای هموطنان عزیزم ایجاد کنم.

‫2 نظرها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا