مفهوم نسبت شانس ها (Odds Ratio)
در آمار، نسبت شانس (OR) جهت اندازه گیری قدرت ارتباط بین دو متغیر باینری را نشان می دهد. معمولاً در رگرسیون لجستیک و مطالعات اپیدمیولوژی برای تعیین میزان رابطه قرار گرفتن در معرض یک عامل خطر (کشیدن سیگار) و وقوع یک پیامد (سرطان ریه) استفاده می شود.
نسبت شانس ها (OR) به صورت نسبت شانس وقوع یک رخداد در یک گروه به شانس وقوع همان رخداد در گروه دیگر تعریف می شود. OR به صورت زیر محاسبه می شود:
که در آن a تعداد افراد بیمار در گروه مواجهه، b تعداد موارد غیر بیمار در گروه مواجهه، c تعداد افراد بیمار در گروه بدون مواجهه و d تعداد افراد غیر بیمار در گروه بدون مواجهه است.
نسبت شانس می تواند از 0 تا بی نهایت باشد. مقدار 1 نشان دهنده عدم ارتباط بین عامل خطر و پیامد است. مقدار بیشتر از 1 نشان دهنده یک ارتباط مثبت است (یعنی عامل خطر شانس رخداد را افزایش می دهد)، در حالی که مقدار کمتر از 1 نشان دهنده یک ارتباط منفی است (یعنی عامل خطر شانس رخداد را کاهش می دهد).
به عنوان مثال، فرض کنید ما در حال مطالعه ارتباط بین سیگار کشیدن و سرطان ریه هستیم. ما شانس ابتلا به سرطان ریه را در گروهی از افراد سیگاری با شانس ابتلا به سرطان ریه در گروهی از افراد غیر سیگاری مقایسه می کنیم. اگر نسبت شانس 2 باشد، احتمال ابتلا به سرطان ریه در گروه سیگاری ها در مقایسه با گروه غیر سیگاری دو برابر بیشتر است. در رگرسیون لجستیک، نسبت شانس اغلب برای تفسیر اثرات متغیرهای پیش بینی کننده بر شانس رخداد استفاده می شود.
اکسپونشیال (exp) ضریب رگرسیونی در مدل رگرسیون لجستیک، همان نسبت شانس است. به طور خاص، اگر یک مدل رگرسیون لجستیک به فرم زیر داشته باشیم:
در مدل بالا مقدار p همان احتمال وقوع رخداد است، x1 تا xk متغیرهای پیشبینیکننده هستند و b0 تا bk ضرایبی هستند که توسط مدل برآورد میشوند. نسبت شانس برای متغیر پیشبین x1 به صورت زیر محاسبه میشود:
برای مثال، فرض کنید یک مدل رگرسیون لجستیک داریم که احتمال حمله قلبی را بر اساس سن و سطح کلسترول یک فرد پیشبینی میکند و ضرایب زیر را به دست آورده ایم:
این بدان معناست که به ازای هر یک سال افزایش سن، احتمال حمله قلبی با ضریب 1.04 افزایش می یابد، در حالی که سطح کلسترول ثابت باقی بماند.
این بدان معناست که به ازای هر یک واحد افزایش سطح کلسترول، احتمال حمله قلبی با ضریب 2.44 افزایش می یابد، در حالی که سن ثابت باشد.
پیش فرض های رگرسیون
شاخص های آماری
نمونه گیری
با سلام واحترام
در مثالهایی که زدید ضرایب را چطور تفسیر کرده اید؟
وقتی ضریب سن 0.04 (چهار صدم) هست، چرا انرا 1.04 در نظر گرفته اید؟ مگر زیر یک نیست؟
سلام عرض ادب، برای محاسبه نسبت شانس ها طبق توضیحات باید عدد e را به توان ضریب رگرسیونی در رگرسیون لوجستیک برسانید.