المقارنات الثنائية


تعد المقارنات الثنائية اللاحقة جزءًا شائعًا جدًا من الروتين اليومي لعالم البيانات. كلما أجرينا اختبار ANOVA أو اختبار غير بارامترية مع أكثر من مجموعتين فهذا أمر لا مفر منه.

في مرحلة ما قد ترغب في الحصول على تصورات لطيفة لما هو مهم وما هو غير مهم. ربما مع كتابة قيم p-قيم p على الرسم البياني. بعد ذلك يمكنك التفكير في بعض الدوال المكتوبة بنفسك والتي تقوم بالمهمة. أو ربما قد تجد غبوبر الحزمة كحل سهل. وهنا يأتي الفخ. لا ينتج الرمز المعتاد المعطى كمثال قيم p-قيم معدلة لمقارنات متعددة! لنفترض أن لديك بعض استجابة y و 4 مجموعات A، B، C، D وتريد مقارنة y في المجموعات الأخرى مقابل y في المجموعة المرجعية A. ثم ينتهي بك الأمر برمز مثل هذا:


مكتبة(tidyverse)
مكتبة(rstatix)
مكتبة(ggpubr)
مكتبة(ggplot2)

مقارناتي <- قائمة( ج("أ"، "ب")، ج("أ"، "ج")، ج("أ"، "د"))

ggboxplot(data, x = "grouping.variable", y = "your.response",
          لوحة الألوان = "jco"، ملء="grouping.variable",order=c("A","B","C","D"),
          وسيلة الإيضاح="يمين")+
  stat_compare_means(المقارنات = my_comparisons, label.y = c(0.4, 0.5, 0.6),method="wilcox.test",p.adjust.method ="bonferroni")+
  معامل(y="استجابة Y",x="بعض متغيرات التجميع هنا",تعبئة="مجموعات")

والرسم البياني الذي لا يحتوي على قيم p-قيم معدلة!

الرمز الصحيح هو التالي:

stat.test %
  wilcox_test(your.response.your ~ grouping.variable,ref.group = "A") %>%
  Adjust_pvalue() %>%
  add_significance("p.adj")
إحصائيات الاختبار

stat.test %>% add_y_position()

ggboxplot(data, x = "grouping.variable", y = "your.response",
          لوحة الألوان = "jco"، ملء="grouping.variable",order=c("A","B","C","D"),
          وسيلة الإيضاح="يمين")+stat_pvalue_manual(stat.test, label = "p.adj",tip.length = 0.01)+
  مختبرات(y="استجابة Y",x="متغير تجميع هنا",تعبئة="مجموعات")

بالطبع المثال أعلاه هو مثال على اختبار ويلكوكسون غير البارامترى لكن الحزمة تقدم أيضًا اختبار t. إذا كنت ترغب في مقارنة "كل شيء مع كل شيء"، وليس فقط مع المجموعة A، فما عليك سوى إزالة ref.group = "A" من الكود:

stat.test %
  wilcox_test(your.response ~ grouping.variable) %>%
  Adjust_pvalue() %>%
  add_significance("p.adj")
stat.test

stat.test %>% add_y_position()

ggboxplot(data, x = "grouping.variable", y = "your.response",
          لوحة الألوان = "jco"، ملء="grouping.variable",order=c("A","B","C","D"),
          وسيلة الإيضاح="يمين")+stat_pvalue_manual(stat.test, label = "p.adj",tip.length = 0.01)+
  مختبرات(y="استجابة Y",x="متغير تجميع هنا",تعبئة="مجموعات")

وتحصل على:

لاحظ أن طريقة التعديل أعلاه ليست بونفروني بعد الآن. إنها طريقة هولم، وهي طريقة افتراضية مطبقة في R. استمتع!

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *


arArabic