آموزش آزمون تی در R و RStudio
به آموزش آزمون تی در R خوش آمدید. آزمونهای آماری ابزار ضروری برای تجزیهوتحلیل دادهها هستند که ما را قادر میسازند تا براساس نمونهای از دادهها، در مورد یک جامعه آماری نتیجهگیری داشته باشیم. در این فصل، انواع مختلف آزمون تی را که میتوان در R و RStudio انجام داد، معرفی میشوند.
آزمون تی تک نمونهای در R
برای انجام آزمون تی تک نمونهای میتوانید از تابع () t.test استفاده کنید. برای مثال فرض کنید اطلاعات مربوط به وزن 10 نفر از نوجوانان پسر را در یک بردار x دارید و میخواهید آزمون کنید که آیا میانگین وزن نوجوانان پسر تفاوت معنیداری با مقدار فرضی 50 کیلوگرم دارد یا خیر.
# ایجاد بردار دادههای وزن نوجوانان
x <- c(56, 48, 52, 60, 49, 51, 57, 55, 50, 58)
# انجام آزمون تی تک نمونهای
t.test(x, mu = 50)
تابع () t.test دو شناسه میگیرد: 1-بردار دادهها و 2-میانگین جمعیت فرضی (در اینجا mu برابر 50). بهطور پیشفرض، تابع فرض میکند که فرضیه مقابل یک فرضیه دوطرفه است (یعنی میانگین جامعه با مقدار فرضی برابر نیست) و خطای نوع اول برابر 0.05 است. خروجی تابع t.test شامل آماره t، درجه آزادی، p-value و یک فاصله اطمینان برای میانگین جامعه خواهد بود.
One Sample t-test
data: x
t = 2.7485, df = 9, p-value = 0.02253
alternative hypothesis: true mean is not equal to 50
: 95 percent confidence interval
50.63704 56.56296
: sample estimates
mean of x
53.6
خروجی نشان میدهد که مقدار آماره تی برابر 2/74، درجه آزادی 9 و سطح معنیداری برابر 0/022 است. ازآنجاییکه مقدار معنیداری کمتر از سطح معنیداری 0.05 است، میتوان فرضیه صفر را رد کرد و نتیجه گرفت که میانگین وزن نوجوانان پسر جامعه با 50 تفاوت معناداری دارد.
آزمون تی زوجی در R
آزمون t زوجی آزمونی است که میانگین دو جامعه وابسته را با هم مقایسه میکند. فرض صفر این است که تفاوت معناداری بین میانگین دو نمونه وابسته وجود ندارد. فرضیه جایگزین این است که بین میانگینها تفاوت معناداری وجود دارد. از آزمون t زوجی میتوان برای مقایسه انواع مختلف نمونههای مرتبط استفاده کرد، مانند اندازهگیریهای قبل و بعد، مانند وزن قبل و بعد از برنامه رژیم غذایی – اندازهگیریهای زوجی در مورد یک موضوع، مانند فشارخون قبل و بعد از مصرف دارو – نمونههای همسان، مانند نمرات آزمون دوقلوهای همسان که از روشهای مختلف مطالعه استفاده کردند برای انجام آزمون t زوجی ابتدا میانگین اختلاف بین نمونههای جفت شده را محاسبه میکنیم. سپس خطای استاندارد اختلاف میانگین را محاسبه کرده و از آن برای محاسبه آماره t استفاده میکنیم.
در نهایت آماره t را با یک توزیع t با n-1 درجه آزادی مقایسه میکنیم (که n تعداد جفتها است) و مقدار p را محاسبه میکنیم. اگر مقدار p کمتر از سطح معنیداری انتخابی ما باشد (معمولاً 0/05)، فرض صفر را رد میکنیم و نتیجه میگیریم که بین میانگینهای دو نمونه وابسته تفاوت معناداری وجود دارد. فرض کنید اطلاعاتی در مورد فشارخون 50 بیمار قبل و بعد از مصرف دارو دارید. میخواهید بدانید که آیا مصرف دارو باعث تغییر معنیدار فشارخون افراد شده است یا خیر. برای این کار از آزمون تی زوجی استفاده میشود.
مقادیر فشار خون قبل از مصرف دارو #
bp_before <- c(120, 130, 125, 140, 132, 138, 135, 128, 136, 130, 124, 132, 126, 142, 130, 134, 128, 138, 132, 130, 127, 131, 136, 133, 128, 129, 142, 127, 130, 136, 135, 129, 133, 137, 131, 132, 129, 135, 137, 130, 134, 138, 136, 130, 139, 132, 137, 135, 129, 133)
مقادیر فشار خون بعد از مصرف دارو #
bp_after <- c(115, 125, 120, 130, 122, 128, 125, 118, 126, 120, 114, 122, 116, 132, 120, 124, 118, 128, 122, 120, 117, 121, 126, 123, 118, 119, 132, 117, 120, 126, 125, 119, 123, 127, 121, 122, 119, 125, 127, 120, 124, 128, 126, 120, 129, 122, 127, 125, 119, 123)
ساخت دیتافریم #
data <- data.frame(before = bp_before, after = bp_after)
آزمون t زوجی را با استفاده از تابع () t.test انجام میدهیم. در ادامه دستور انجام تست t زوجی آمده است:
t.test(data$before, data$after, paired = TRUE)
Paired t-test
data: data$before and data$after
t = 57.182, df = 49, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
: 95 percent confidence interval
9.359109 10.040891
: sample estimates
mean of the differences 9.7
در این مثال، مقدار معنیداری بسیار کوچک و کمتر از 0.05 است، که نشان میدهد بین دو مجموعه داده تفاوت معنیداری وجود دارد. میتوان نتیجه گرفت که مصرف دارو بر فشارخون بیماران تأثیر بسزایی داشته است. میانگین فشارخون قبل از مصرف دارو 132.4 و میانگین فشارخون بعد از مصرف دارو 122.7 با میانگین اختلاف 9.7 بود.
آزمون تی مستقل در R
فرض کنید اطلاعات وزن 20 زن و 20 مرد در دسترس است. میخواهیم بدانیم وزن کدام گروه بیشتر است. برای این کار از آزمون تی مستقل استفاده میشود.
مقادیر وزن مردها #
weight_men <- c(70, 72, 75, 78, 73, 76, 80, 77, 81, 79, 85, 86, 84, 83, 80, 82, 88, 90, 91, 92)
مقادیر وزن زن ها #
weight_women <- c(55, 57, 59, 61, 63, 65, 67, 69, 71, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92)
ساخت دیتافریم #
data <- data.frame(weight = c(weight_men, weight_women), gender = rep(c(“men”, “women”), each = 20))
توجه داشته باشید که دیتافریم ساخته شده دارای دو ستون مقادیر وزن و جنسیت است. تعداد سطرها برابر 60 نفر است.
weight gender
1 70 men
2 72 men
3 75 men
4 78 men
5 73 men
6 76 men
7 80 men
8 77 men
9 81 men
10 79 men
11 85 men
12 86 men
13 84 men
14 83 men
15 80 men
16 82 men
17 88 men
18 90 men
19 91 men
20 92 men
21 55 women
22 57 women
23 59 women
24 61 women
آزمون t مستقل با استفاده از تابع () t.test انجام میشود. در اینجا دستور انجام آزمون t مستقل آمده است:
t.test(weight ~ gender, data = data)
نتایج به صورت زیر قابلمشاهده است.
Welch Two Sample t-test
data: weight by gender
t = 2.6236, df = 29.736, p-value = 0.01359
alternative hypothesis: true difference in means between group men and group women is not equal to 0
: 95 percent confidence interval
1.692896 13.607104
: sample estimates
mean in group men mean in group women
81.10 73.45
در این مثال، مقدار معنیداری کمتر از 0.05 است که نشان میدهد بین میانگین وزن زنان و مردان تفاوت معناداری وجود دارد. براساس خروجی میتوان نتیجه گرفت که بین میانگین وزن زنان و مردان تفاوت معناداری وجود دارد. میانگین وزن مردان 81.10 و میانگین وزن زنان 73.45 است.
منبع این آموزش
این آموزش از کتاب آموزش RStudio به نویسندگی مسعود علی مردی و رقیه زارع برگرفته شده است.
علی مردی، مسعود. زارع، رقیه. (1402). آموزش RStudio. انتشارات دیباگران.
مسعود علی مردی
هزاران داده تجزیه و تحلیل کردم تا به هدفم برسم و این داستان همچنان ادامه داره …
دیدگاه خود را بنویسید