آموزش آزمون تی در R و RStudio

به آموزش آزمون تی در R خوش آمدید. آزمون‌های آماری ابزار ضروری برای تجزیه‌وتحلیل داده‌ها هستند که ما را قادر می‌سازند تا براساس نمونه‌ای از داده‌ها، در مورد یک جامعه آماری نتیجه‌گیری داشته باشیم. در این فصل، انواع مختلف آزمون تی را که می‌توان در R و RStudio انجام داد، معرفی می‌شوند.

آزمون تی تک نمونه‌ای در R

برای انجام آزمون تی تک نمونه‌ای می‌توانید از تابع () t.test استفاده کنید. برای مثال فرض کنید اطلاعات مربوط به وزن 10 نفر از نوجوانان پسر را در یک بردار x دارید و می‌خواهید آزمون کنید که آیا میانگین وزن نوجوانان پسر تفاوت معنی‌داری با مقدار فرضی 50 کیلوگرم دارد یا خیر.

# ایجاد بردار داده‌های وزن نوجوانان
x <- c(56, 48, 52, 60, 49, 51, 57, 55, 50, 58)

# انجام آزمون تی تک نمونه‌ای
t.test(x, mu = 50)

تابع () t.test دو شناسه می‌گیرد: 1-بردار داده‌ها و 2-میانگین جمعیت فرضی (در اینجا mu برابر 50). به‌طور پیش‌فرض، تابع فرض می‌کند که فرضیه مقابل یک فرضیه دوطرفه است (یعنی میانگین جامعه با مقدار فرضی برابر نیست) و خطای نوع اول برابر 0.05 است. خروجی تابع t.test شامل آماره t، درجه آزادی، p-value و یک فاصله اطمینان برای میانگین جامعه خواهد بود.

One Sample t-test
data: x
t = 2.7485, df = 9, p-value = 0.02253
alternative hypothesis: true mean is not equal to 50
: 95 percent confidence interval
 50.63704 56.56296
 : sample estimates
mean of x
 53.6

خروجی نشان می‌دهد که مقدار آماره تی برابر 2/74، درجه آزادی 9 و سطح معنی‌داری برابر 0/022 است. ازآنجایی‌که مقدار معنی‌داری کمتر از سطح معنی‌داری 0.05 است، می‌توان فرضیه صفر را رد کرد و نتیجه گرفت که میانگین وزن نوجوانان پسر جامعه با 50 تفاوت معناداری دارد.

آزمون تی زوجی در R

آزمون t زوجی آزمونی است که میانگین دو جامعه وابسته را با هم مقایسه می‌کند. فرض صفر این است که تفاوت معناداری بین میانگین دو نمونه وابسته وجود ندارد. فرضیه جایگزین این است که بین میانگین‌ها تفاوت معناداری وجود دارد. از آزمون t زوجی می‌توان برای مقایسه انواع مختلف نمونه‌های مرتبط استفاده کرد، مانند اندازه‌گیری‌های قبل و بعد، مانند وزن قبل و بعد از برنامه رژیم غذایی – اندازه‌گیری‌های زوجی در مورد یک موضوع، مانند فشارخون قبل و بعد از مصرف دارو – نمونه‌های همسان، مانند نمرات آزمون دوقلوهای همسان که از روش‌های مختلف مطالعه استفاده کردند برای انجام آزمون t زوجی ابتدا میانگین اختلاف بین نمونه‌های جفت شده را محاسبه می‌کنیم. سپس خطای استاندارد اختلاف میانگین را محاسبه کرده و از آن برای محاسبه آماره t استفاده می‌کنیم.

در نهایت آماره t را با یک توزیع t با n-1 درجه آزادی مقایسه می‌کنیم (که n تعداد جفت‌ها است) و مقدار p را محاسبه می‌کنیم. اگر مقدار p کمتر از سطح معنی‌داری انتخابی ما باشد (معمولاً 0/05)، فرض صفر را رد می‌کنیم و نتیجه می‌گیریم که بین میانگین‌های دو نمونه وابسته تفاوت معناداری وجود دارد. فرض کنید اطلاعاتی در مورد فشارخون 50 بیمار قبل و بعد از مصرف دارو دارید. می‌خواهید بدانید که آیا مصرف دارو باعث تغییر معنی‌دار فشارخون افراد شده است یا خیر. برای این کار از آزمون تی زوجی استفاده می‌شود.

مقادیر فشار خون قبل از مصرف دارو #

bp_before <- c(120, 130, 125, 140, 132, 138, 135, 128, 136, 130, 124, 132, 126, 142, 130, 134, 128, 138, 132, 130, 127, 131, 136, 133, 128, 129, 142, 127, 130, 136, 135, 129, 133, 137, 131, 132, 129, 135, 137, 130, 134, 138, 136, 130, 139, 132, 137, 135, 129, 133)

مقادیر فشار خون بعد از مصرف دارو #

bp_after <- c(115, 125, 120, 130, 122, 128, 125, 118, 126, 120, 114, 122, 116, 132, 120, 124, 118, 128, 122, 120, 117, 121, 126, 123, 118, 119, 132, 117, 120, 126, 125, 119, 123, 127, 121, 122, 119, 125, 127, 120, 124, 128, 126, 120, 129, 122, 127, 125, 119, 123)

ساخت دیتافریم #

data <- data.frame(before = bp_before, after = bp_after)

آزمون t زوجی را با استفاده از تابع () t.test انجام می‌دهیم. در ادامه دستور انجام تست t زوجی آمده است:

t.test(data$before, data$after, paired = TRUE)
Paired t-test
data: data$before and data$after
t = 57.182, df = 49, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
 : 95 percent confidence interval
 9.359109 10.040891
 : sample estimates
mean of the differences 9.7

در این مثال، مقدار معنی‌داری بسیار کوچک و کمتر از 0.05 است، که نشان می‌دهد بین دو مجموعه داده تفاوت معنی‌داری وجود دارد. می‌توان نتیجه گرفت که مصرف دارو بر فشارخون بیماران تأثیر بسزایی داشته است. میانگین فشارخون قبل از مصرف دارو 132.4 و میانگین فشارخون بعد از مصرف دارو 122.7 با میانگین اختلاف 9.7 بود.

آزمون تی مستقل در R

فرض کنید اطلاعات وزن 20 زن و 20 مرد در دسترس است. می‌خواهیم بدانیم وزن کدام گروه بیشتر است. برای این کار از آزمون تی مستقل استفاده می‌شود.

مقادیر وزن مردها #

weight_men <- c(70, 72, 75, 78, 73, 76, 80, 77, 81, 79, 85, 86, 84, 83, 80, 82, 88, 90, 91, 92)

مقادیر وزن زن ها #

weight_women <- c(55, 57, 59, 61, 63, 65, 67, 69, 71, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92)

ساخت دیتافریم #

data <- data.frame(weight = c(weight_men, weight_women), gender = rep(c(“men”, “women”), each = 20))

توجه داشته باشید که دیتافریم ساخته شده دارای دو ستون مقادیر وزن و جنسیت است. تعداد سطرها برابر 60 نفر است.

 weight gender
1 70 men
2 72 men
3 75 men
4 78 men
5 73 men
6 76 men
7 80 men
8 77 men
9 81 men
10 79 men
11 85 men
12 86 men
13 84 men
14 83 men
15 80 men
16 82 men
17 88 men
18 90 men
19 91 men
20 92 men
21 55 women
22 57 women
23 59 women
24 61 women

آزمون t مستقل با استفاده از تابع () t.test انجام می‌شود. در اینجا دستور انجام آزمون t مستقل آمده است:

t.test(weight ~ gender, data = data)

نتایج به صورت زیر قابل‌مشاهده است.

Welch Two Sample t-test
data: weight by gender
t = 2.6236, df = 29.736, p-value = 0.01359
alternative hypothesis: true difference in means between group men and group women is not equal to 0
: 95 percent confidence interval
1.692896 13.607104
 : sample estimates
mean in group men mean in group women
81.10 73.45

در این مثال، مقدار معنی‌داری کمتر از 0.05 است که نشان می‌دهد بین میانگین وزن زنان و مردان تفاوت معناداری وجود دارد. براساس خروجی می‌توان نتیجه گرفت که بین میانگین وزن زنان و مردان تفاوت معناداری وجود دارد. میانگین وزن مردان 81.10 و میانگین وزن زنان 73.45 است.

منبع این آموزش

این آموزش از کتاب آموزش RStudio به نویسندگی مسعود علی مردی و رقیه زارع برگرفته شده است.

علی مردی، مسعود. زارع، رقیه. (1402). آموزش RStudio. انتشارات دیباگران.

مسعود علی مردی

مسعود علی مردی

هزاران داده تجزیه و تحلیل کردم تا به هدفم برسم و این داستان همچنان ادامه داره …