فهرست مطالب
آموزش تحلیل واریانس چندمتغیری

آموزش MANOVA

امتیاز ۵ از ۵ – ۱ رای
spinner در حال ثبت رای

آزمون تحلیل واریانس چندمتغیره (MANOVA) یک روش آماری است که برای بررسی تفاوت‌های گروهی در یک مجموعه از متغیرهای وابسته (متغیرهای پیامد) استفاده می‌شود. این آزمون در واقع یک گسترش از تحلیل واریانس (ANOVA) تک متغیره به چند متغیره است.

در ANOVA، تفاوت‌های گروهی در یک متغیر وابسته را بررسی می‌کنیم، اما در MANOVA، ما با داشتن چندین متغیر وابسته به صورت همزمان، تفاوت‌های گروهی را بررسی می‌کنیم و تأثیر تعاملات بین این متغیرها را نیز مورد بررسی قرار می‌دهیم.

هدف اصلی MANOVA، بررسی این است که آیا میانگین متغیرهای وابسته در گروه‌های مختلفی که توسط یک متغیر مستقل (یا چندین متغیر مستقل) تعریف می‌شوند، متفاوت هستند یا خیر. با استفاده از MANOVA، می‌توانیم تأثیر هر متغیر وابسته را به طور مستقل بررسی کنیم و همچنین تعاملات بین این متغیرها را نیز بررسی کنیم.

فرضیه صفر در MANOVA این است که میانگین متغیرهای وابسته در گروه‌های مختلف برابر است، در حالی که فرضیه جایگزین این است که حداقل یکی از متغیرهای وابسته تفاوت‌های گروهی معنادار دارد.

پیش فرض های آزمون MANOVA

در آزمون MANOVA، پیش‌فرض‌های اصلی عبارتند از :

1. استقلال: باید باقیمانده‌ها (خطاها) به صورت آماری مستقل باشند.

2. پیش‌فرض توزیع نرمال: این پیش‌فرض بیان می‌کند که متغیرهای وابسته در هر گروه دارای توزیع نرمال باشند. این پیش‌فرض برای استفاده از آماره‌هایی مانند آزمون F در MANOVA ضروری است.

3. پیش‌فرض همگنی کوواریانس: این پیش‌فرض بیان می‌کند که ماتریس کوواریانس متغیرهای وابسته در همه گروه‌ها یکسان است، به عبارت دیگر، واریانس متغیرهای وابسته در همه گروه‌ها یکسان است. این پیش‌فرض برای استفاده از آماره‌های MANOVA ضروری است.

توجه کنید که عدم رعایت هر یک از این پیش‌فرض‌ها می‌تواند تأثیر مستقیمی بر نتایج MANOVA و تفسیر آن داشته باشد. قبل از انجام MANOVA، مهم است که این پیش‌فرض‌ها را بررسی کنید و در صورت نقض آن‌ها، روش‌های جایگزین مانند آزمون‌های ناپارامتریک را در نظر بگیرید.

بررسی پیش فرض نرمال بودن چند متغیره

لازم به ذکر است که پیش فرض نرمال بودن چندمتغیره با استفاده از SPSS قابل آزمون نیست و به همین دلیل تنها راه‌حل عملی این است که فرض نرمال بودن تک متغیره باقیمانده را به صورت جداگانه برای هر متغیر وابسته بررسی کنیم. این راه‌حل عملی است (زیرا پیاده‌سازی آن آسان است) و مفید (زیرا نرمال بودن یک متغیره شرط ضروری برای نرمال بودن چندمتغیره است)، اما تضمینی برای نرمال بودن چندمتغیره فراهم نمی‌کند.

پیش فرض همگنی ماتریس کوواریانس

این فرض می‌تواند با استفاده از آزمون باکس (Box’s test) آزمایش شود که در صورتی که ماتریس‌ها مشابه باشند، باید غیر معنی دار باشد (0.05<p). آزمون باکس به طور عمده نسبت به انحرافات از نرمال بودن چندمتغیره حساس است و به همین دلیل ممکن است غیر معنی دار باشد نه به این دلیل که ماتریس‌ها مشابه هستند، بلکه به این دلیل که فرضیه نرمال بودن چندمتغیره پذیرفته نمی شود. همچنین، همانند هر آزمون آماری دیگری، در نمونه‌های بزرگ، آزمون باکس ممکن است معنی‌دار باشد (0.05>p) حتی زمانی که ماتریس‌های کوواریانس به نسبت مشابه هستند.

زمانی که پیش فرض های MANOVA رد شدند چکار کنیم ؟

نسخه ناپارامتری از MANOVA در نرم افزار SPSS ارائه نمی‌شود؛ با این حال، بر اساس داده‌های رتبه‌ ای، برخی ایده‌ها مطرح شده‌اند. تکنیک‌هایی وجود دارند که زمانی که پیش فرض های نرمال بودن چندمتغیره یا همگنی ماتریس‌های کوواریانس رعایت نمی شود، می‌توانند مفید باشند. علاوه بر این، روش‌های مقاوم برای طرح ساده با چند متغیر وابسته وجود دارند، مانند روش مونزل–برانر، که در نرم‌افزار R قابل اجرا است. اگرچه در جعبه گفت‌وگوی MANOVA در SPSS یک دکمه بوت استرپ مشاهده می‌شود، اما تست‌های اصلی را بوت‌استراپ نمی‌کند و در نهایت ناامید کننده است.

چندبار استفاده از ANOVA به جای MANOVA ؟

وقتی که چند متغیر وابسته داریم، می‌توانیم از ANOVA برای هر متغیر وابسته به صورت جداگانه استفاده کنیم. اما این کار موجب افزایش خطای نوع اول می شود. همچنین، اگر مدل‌های جداگانه برای هر متغیر وابسته اعمال شوند، هر گونه رابطه بین این متغیرهای وابسته نادیده گرفته می‌شود.

در MANOVA، تمام متغیرهای وابسته را در یک مدل در نظر می‌گیریم و رابطه بین آن‌ها را نیز بررسی می‌کنیم. این روش به ما کمک می‌کند تا بفهمیم آیا گروه‌ها در کل متغیرهای وابسته تفاوت دارند یا خیر، نه فقط در یک متغیر وابسته. با استفاده از MANOVA، ما می‌توانیم اطلاعات مهمی را درباره رابطه بین معیارها بدست آوریم که در روش مدل‌های جداگانه از دست می‌دهیم.

به عنوان مثال، ممکن است بتوانیم افراد مجرد، متاهل و بیوه را بر اساس خوشبختی‌شان مقایسه کنیم. ‘خوشبختی’ ساختار پیچیده‌ای دارد، بنابراین ممکن است بخواهیم خوشبختی آن‌ها را از نظر 1-وضعیت شغل، 2-اجتماعی، 3-روابط جنسی و 4-عزت نفس اندازه‌گیری کنیم. احتمالاً نمی‌توان افراد مجرد، متاهل و بیوه را تنها بر اساس یک جنبه از خوشبختی مقایسه کرد (که این امر در مدل تک‌متغیره ANOVA آزمایش می‌شود)، اما این گروه‌ها ممکن است توسط ترکیبی از شاخص های چهارگانه خوشبختی (که این امر در MANOVA آزمایش می‌شود) تفاوت داشته باشند. به این معنا که MANOVA توانایی بیشتری دارد تا اثری را تشخیص دهد.

آموزش تحلیل واریانس چندمتغیره دو راهه – Two Way MANOVA

در آنالیز واریانس چندمتغیره یا MANOVA تعداد متغیرهای وابسته یا Dependent Variable بیش از یک عدد خواهد بود یا به عبارتی D>1 است. به عنوان مثال اگر بخواهیم اثر فعالیت بدنی سالمندان را به طور همزمان بر روی چربی خون (کلسترول خون) و وزن آن ها بسنجیم باید از آنالیز واریانس چندمتغیره یا به عبارت دقیق‌تر از آنالیز واریانس چند متغیره یک طرفه (مانوا یک طرفه) استفاده کنیم در این حالت تعداد متغیرهای مستقل یا عامل (فاکتور) برابر یک است F=1 و D>1 ( در این مثال D=2 ) است.

اگر در همین مثال سالمندان عامل جنسیت را با دو سطح مرد و زن در معادله تحلیلی خود اضافه کنیم کنیم (متغیرهای مستقل شامل جنسیت و فعالیت بدنی باشد) آنگاه خواهیم داشت F=2 و D=2 در این صورت باید از آنالیز واریانس چندمتغیره دو طرفه (مانوا دوطرفه) برای تحلیل داده‌های خود استفاده کنیم. در ادامه به انجام تحلیل مثال فعالیت بدنی سالمندان می پردازیم.

مثال (فعالیت بدنی سالمندان)

می خواهیم اثر فعالیت بدنی سالمندان را بر روی سطح کلسترول خون و وزن آنها بسنجیم. برای این منظور تعداد 54 سالمند مرد و زن ( 27 مرد و 27 زن) انتخاب نموده و بر اساس فعایت بدنی روزانه آنها را  در سه سطح فعالیت بدنی 1- کم 2- متوسط 3- زیاد دسته بندی نمودیم. سپس میزان چربی کلسترول خون و وزن آنها ثبت نمودیم می خواهیم این فرضیه را آزمون کنیم که آیا بین میانگین چربی خون و وزن سالمندان تفاوت معنی داری وجود دارد یا به عبارتی اثر فعالیت بدنی و جنسیت سالمندان بر چربی خون و وزن سالمندان اثر معنی داری دارد؟

طرح آزمایش این مثال شامل:

متغیر مستقل (عامل یا فاکتور):

1- فعالیت بدنی با سه سطح (کم، متوسط، زیاد)

2- جنسیت با دو سطح (مرد، زن)

متغیر وابسته:

1- چربی کلسترول خون (متغیر کمی)

2- وزن (متغیر کمی)

در این طرح F=2 و D=2 یا به عبارتی D>1 است به عبارتی طرح آنالیز واریانس چندمتغیره (MANOVA) است و چون تعداد فاکتورها یا متغیرهای مستقل طرح برابر 2 است. طرح آنالیز واریانس چندمتغیره دوطرفه محسوب می شود.

نحوه ورود داده ها در نرم افزار SPSS برای هر آنالیزی نقش مهمی در تحلیل صحیح داده ها دارد که در شکل 1 به آن اشاره شده است. دو ستون اول نشانگر دو متغیر مستقل و ستون سه و چهار نشانگر متغیرهای وابسته طرح هستند اگر با نحوه ورود داده ها در نرم افزار SPSS آشنا نیستید می توانید از آموزش های مربوط به این موضوع که در همین سایت تحت عنوان نحوه وارد کردن دیتا در SPSS استفاده کنید.

آزمون تحلیل واریانس چندمتغیره

نحوه انجام MANOVA دو طرفه

به منظور انجام MANOVA دو طرفه از مسیر زیر وارد می شویم:

Analyze > General Linear Model > Multivariate

متغیرهای مستقل یا عامل های فعالیت بدنی و جنسیت را در قسمت Fixed Factor(s) و متغیرهای وابسته وزن و کلسترول را در قسمت Dependent Variable (s) همانند شکل ۲ وارد می کنیم.

آموزش تحلیل واریانس چندمتغیری

شکل (2) نحوه انجام مانووا دو طرفه

در صفحه مانوا یا Multivariate چندین دکمه وجود دارد که بهتر است مروری بر آنها داشته باشیم. ابتدا به منظور بررسی پیش فرض همگنی واریانس گروه ها از دکمه options، گزینه گزینه Homogeneity tests را فعال می کنیم همچنین گزینه Descriptive statistics به منظور دریافت آمار توصیفی و گزینه Estimates of effect size به منظور گزارش اندازه اثر آزمون مطابق شکل 3 فعال می کنیم.

تنظیمات تحلیل واریانس چندمتغیره

شکل (3) گزینه های تب Options

در تب plots می توان برای رسم نمودارها مطابق شکل 4 اقدام کرد.

نمودار مانووا

شکل (4) گزینه های تب Plots

در تب Post Hoc می توان آزمون های تعقیبی را درخواست کرد که در این مثال قصد داریم از آزمون تعقیبی دانکن (Duncan) استفاده کنیم. پس از انجام مراحل بالا با زدن دکمه OK آزمون را اجرا می کنیم.

آزمون دانکن در مانووا

شکل (5) گزینه های تب Post-Hoc

خروجی آمار توصیفی آنالیز واریانس به شرح زیر است:

آمار توصیفی در تحلیل واریانس چندمتغیره

شکل (6) خروجی آمار توصیفی در مانووا

بررسی پیش فرض های MANOVA دو راهه

آزمون لون (Levene’s test) نتایج همگنی واریانس گروه ها را برای دو عامل فعالیت بدنی و جنسیت نشان می دهد. مطابق شکل 7 و ردیف اول گزارش که بر مبنای Mean گزارش شده مقدار sig متغیر وزن و چربی کلسترول به ترتیب برابر 0.054 و 0.057 و بزرگتر از 0.05 است به عبارتی فرض برابری واریانس گروه ها پذیرفته می شود. در ادامه آزمون ام باکس (M-Box) پیش فرض همگنی کوواریانس گروه ها را بررسی می کند.

آزمون همگنی واریانس ها در SPSS

شکل (7) خروجی آمار توصیفی در مانووا

در ادامه آزمون ام باکس (M-Box) پیش فرض همگنی کوواریانس گروه ها را بررسی می کند.

آزمون ام باکس

شکل (8) بررسی پیش فرض همگنی کوواریانس گروه ها

مطابق شکل 8 در صورتی که فرض همگنی کوواریانس گروه ها پذیرفته شود یا به عبارتی در آزمون BOX’ S M مقدار sig. بزرگتر از 0.05 باشد از آزمون Pillai’s Trace یا اثر پیلایی برای تفسیر نتایج خود در جدول چند متغیره یا Multivariate استفاده می کنیم و در غیر این صورت نتایج سایر آزمون ها را گزارش می کنیم. در مثال سالمندان مطابق شکل 8 چون sig=0.000 و کمتر از 0.05 است از نتایج سایر آزمون ها مانند آماره Wilk’s Lambda که نسبت به سایر گزینه ها مشهورتر است استفاده می کنیم.

آموزش تحلیل واریانس دو طرفه

شکل (9) نتایج چند متغیره مانوا دوطرفه

مطابق جدول شکل 9 و نتایج آماره Wilk’s Lambda یا لامبدای ویلک برای دو متغیر سطح فعالیت بدنی یا Physical_Activity و جنسیت یا Gender که هر دو برابر 0.000 و کمتر از 0.01 است با 99% اطمینان نتیجه گیری می کنیم که اثر سطح فعالیت بدنی و جنسیت بر روی متغیرهای وابسته وزن و کلسترول به طور همزمان معنی دار است. اما اثر توام فعالیت بدنی × جنسیت یا به عبارتی که به آن اثر متقابل هم می گویند و به صورت Gender × Physical_Activity نشان داده می شود و سطح معنی داری 0.121 که بزرگتر از 0.05 است معنی دار نیست به عبارتی جنسیت و سطح فعالیت اثر توام بر روی وزن و کلسترول سالمندان ندارند.

عبارت intercept در جدول بیانگر بررسی مقدار ثابت در مدل رگرسیون است با توجه به مقدار (sig =0.000) این عبارت در جدول نتیجه گرفته می شود که اثر مقدار ثابت در مدل رگرسیون معنی دار است. پس از بررسی جدول Multivariate به بررسی جدول Tests of Between-Subjects Effects می پردازیم این جدول اثر فاکتور یا متغیرهای مستقل را به صورت جداگانه بر روی متغیر وابسته یا پاسخ می سنجد.

شکل (10) نتایج بین گروهی مانوا دوطرفه

مطابق شکل 10 اثر سطح فعالیت بدنی بر روی وزن سالمندان معنی دار بوده (sig =0.000) و اندازه اثر 0.950 است یعنی 95 درصد تغییرات وزن سالمندان به وسیله تغییرات سطح فعالیت بدنی تبیین می شود. اثر سطح فعالیت بدنی بر روی چربی کلسترول سالمندان معنی دار بوده (sig =0.000) و اندازه اثر 0.866 است یعنی 86.6% تغییرات کلسترول سالمندان به وسیله تغییرات سطح فعالیت بدنی تبیین می شود.

اثر جنسیت بر روی وزن سالمندان معنی دار بوده (sig =0.000) و اندازه اثر 0.306 است یعنی 30.6% تغییرات وزن سالمندان به وسیله تغییرات جنسیت تبیین می شود. اثر جنسیت بر روی چربی کلسترول سالمندان معنی دار بوده (sig =0.002) و اندازه اثر 0.176 است یعنی 17.6% تغییرات کلسترول سالمندان به وسیله تغییرات جنسیت تبیین می شود. اثر متقابل جنسیت و سطح فعالیت بدنی بر روی وزن سالمندان معنی دار نبوده (sig =0.118). اثر متقابل جنسیت و سطح فعالیت بدنی بر روی کلسترول سالمندان معنی دار نبوده (sig =0.176)

اثر متقابل یعنی این که به عبارتی به عنوان مثال نمی توان گفت سطح فعالیت بدنی بالا در مردان بر روی وزن و کلسترول اثر معنی داری داشته ولی سطح فعالیت بدنی بالا در زنان بر روی وزن و کلسترول اثر معنی داری نداشته است.

عبارت Corrected Model در جدول بیانگر این مساله است که آیا مدل به خوبی برازش شده است یا خیر؟ برای متغیر وزن داریم (sig =0.000) و کمتر از 0.01 و اندازه اثر برابر است با 0.951 یعنی مدل به خوبی برازش شده و 95.1% تغییرات متغیر وزن به وسیله تغییرات متغیرهای مستقل مدل یعنی فعالیت بدنی و جنسیت تبیین می شود.برای متغیر کلسترول داریم (sig =0.000) و کمتر از 0.01 و اندازه اثر برابر است با 0.871 یعنی مدل به خوبی برازش شده و 87.1% تغییرات متغیر کلسترول به وسیله تغییرات متغیرهای مستقل مدل یعنی فعالیت بدنی و جنسیت تبیین می شود.

تفسیر آزمون های تعقیبی

با انتخاب گزینه Duncan از تب post Hoc آزمون تعقیبی دانکن اجرا و نتایج زیر به دست می آید:

شکل (۱۱) آزمون دانکن سطح فعالیت بدنی برای متغیر وزن

مطابق شکل ۱۱ وزن سالمندان بر اساس سطح فعالیت بدنی آنها در سه زیر گروه تقسیم بندی شده است. افراد با سطح فعالیت کم بیشترین وزن را به خود اختصاص داده اند (میانگین وزن 86.94) یا به عبارتی از سایر سالمندان چاق تر هستند.بعد از آنها افراد با سطح فعالیت بدنی متوسط قرار دارند با میانگین وزن 68.94 و سپس افراد با سطح فعالیت زیاد قرار دارند با میانگین وزن 56.22 به عبارتی می توان گفت افزایش سطح فعالیت بدنی باعث کاهش وزن سالمندان شده است.

شکل ۱۲ آزمون دانکن سطح فعالیت بدنی برای متغیر کلسترول

مطابق شکل ۱۲ چربی کلسترول سالمندان بر اساس سطح فعالیت بدنی آنها در سه زیر گروه تقسیم بندی شده است. افراد با سطح فعالیت کم بیشترین میزان کلسترول را به خود اختصاص داده اند (میانگین کلسترول 274.61) .بعد از آنها افراد با سطح فعالیت بدنی متوسط قرار دارند با میانگین کلسترول 221.94 و سپس افراد با سطح فعالیت زیاد قرار دارند با میانگین کلسترول 188.33 به عبارتی می توان گفت افزایش سطح فعالیت بدنی باعث کاهش چربی کلسترول سالمندان شده است.

لازم به ذکر است نرم افزار برای متغیر جنسیت آزمون تعقیبی انجام نمی دهد زیرا برای انجام آزمون دانکن متغیر باید حداقل 3 سطح داشته باشد در واقع نیازی هم برای انجام این آزمون در متغیر جنسیت وجود ندارد و بایک مقایسه ساده میانگین دو گروه زن و مرد می توان نتیجه لازم را به دست آورد. مطابق جدول (13) میزان میانگین وزن مردان و زنان برابر مقادیر زیر است:

جدول (13) مقادیر وزن و چربی کلسترول به تفکیک جنسیت

مطابق جدول بالا به وضوح مشخص است که میانگین وزن زنان بیشتر از مردان است و به عبارتی زنان نسبت به مردان چاق تر هستند. همچنین میانگین کلسترول خون زنان 234.74 و بیشتر از مردان با مقدار 221.85 است.

شکل 14 نمودار مقایسه LSD (زوجی) متغیر سطح فعالیت بدنی سالمندان را در ازای وزن و چربی کلسترول نشان می دهد. همانطور که ملاحظه می کنید در دو ردیف اول وزن افراد با سطح فعالیت کم با افراد با سطح فعالیت متوسط و زیاد مقایسه شده و تفاوت هر دو آن ها معنی دار است به عبارتی وزن سالمندان در ازای سطح فعالیت به سه زیر گروه تقسیم می شود و همین طور کلسترول سالمندان.

شکل 14 آزمون LSD سطح فعالیت بدنی

تفسیر نمودارهای تحلیل واریانس چندمتغیری دو راهه

آموزش تحلیل واریانس چندمتغیری

شکل 15 نمودار وزن در برابر جنسیت

مطابق شکل ۱5 مردان به مراتب دارای وزن کمتری نسبت به زنان داشته اند.

شکل 16 نمودار وزن در برابر سطح فعالیت بدنی

مطابق شکل ۱6 سالمندان دارای فعالیت بدنی زیاد به مراتب دارای وزن کمتری نسبت به سالمندان با فعالیت بدنی متوسط و کم هستند.

در تب Plots در صورت ورود متغیر physical_activity در قسمت Horizontal Axis و ورود متغیر gender در قسمت separate Lines و زدن دکمه Add گزینه Gender × physical_activity در پنجره پایین ایجاد می شود که پس از اجرا نمودار زیر حاصل می گردد.

مطابق شکل 17 هم در زنان و هم در مردان سالمند با افزایش سطح فعالیت بدنی وزن سالمندان کاهش یافته است. دو نمودار آبی و قرمز همدیگر را قطع نکرده اند و این به این معنی است که اثر متقابل جنسیت و سطح فعالیت بدنی معنی دار نیست یا به عبارتی تفاوتی بین زن و مرد در کاهش وزن در ازای افزایش سطح فعالیت بدنی وجود ندارد.

رسم نمودار در تحلیل واریانس چند متغیره

شکل ۱7 نمودار وزن در برابر سطح فعالیت بدنی × جنسیت

شکل 18 نمودار چربی کلسترول در برابر جنسیت

مطابق شکل ۱8 مردان به مراتب دارای چربی کلسترول کمتری نسبت به زنان داشته‌اند.

شکل 19 نمودار چربی کلسترول در برابر سطح فعالیت بدنی

مطابق شکل 19 سالمندان دارای فعالیت بدنی زیاد به مراتب دارای چربی کلسترول کمتری نسبت به سالمندان با فعالیت بدنی متوسط و کم داشته اند. تفسیر نمودار چربی کلسترول سالمندان بر حسب سطح فعالیت بدنی × جنسیت :

در تب Plots در صورت ورود متغیر physical_activity در قسمت Horizontal Axis و ورود متغیر cholesterol در قسمت separate Lines و زدن دکمه Add گزینه cholesterol × physical_activity در پنجره پایین ایجاد می شود که پس از اجرا نمودار زیر حاصل می گردد.

رسم نمودار در آزمون مانووا

شکل 20 نمودار وزن در برابر سطح فعالیت بدنی × کلسترول

مطابق شکل 20 هم در زنان و هم در مردان سالمند با افزایش سطح فعالیت بدنی، چربی کلسترول سالمندان کاهش یافته است. دو نمودار آبی و قرمز همدیگر را قطع نکرده اند و این به این معنی است که اثر متقابل کلسترول و سطح فعالیت بدنی معنی دار نیست یا به عبارتی تفاوتی بین زن و مرد در کاهش وزن در ازای افزایش سطح فعالیت بدنی وجود ندارد.

امین اصفهانی

در مورد امین اصفهانی ….

مسعود علی مردی

مسعود علی مردی
هزاران داده تجزیه و تحلیل کردم تا به هدفم برسم و این داستان همچنان ادامه داره …

8 اردیبهشت 1403

آموزش نرم افزار SPSS

بازدید: 322