Оптимизация оценки размера выборки для пропорций

Допустим, нам нужно рассчитать размер выборки для оценки одной доли (тестирования). Опуская математику и некоторую вариативность используемых формул, мы можем сделать это двумя способами:

Во-первых: используя мощность одного теста, а затем мы просто требуем, чтобы тест отклонял или нет гипотезу о том, что данная пропорция равна нулю (обычно на основе двустороннего теста).

Во-вторых: использование 95%CI и желаемой погрешности (погрешность = половина 95%CI). Проблема с фиксированной маржой заключается в том, что маржа 5% отличается при оценке доли 50% или 70% и отличается при оценке доли 20%.

Результаты первого подхода:

Это то, что мы получили в результате моделирования для разных значений мощности и величины эффекта для первого подхода.

Так, например, для оценки доли 0,2 нам потребуется n = 263 для двустороннего 95%CI и мощности 0,9.

Обратите внимание, что для этого метода допустимая погрешность для 95%CI не фиксируется (о чем некоторые люди явно не знают). Он растет с расчетной долей (см. Второй график ниже), что логично, поскольку нам не нужна маржа 5% для оценки доли 70% (обычно). Для 70% у нас есть маржа около 20%, которая сравнима с маржой 5% для доли 20%, больше меньше.

Таким образом, для нашего примера с 20% пропорция для оценки первого метода даст нам погрешность в точности 4.83%. Другими словами, для оценки минимальной ожидаемой доли 0,2 с погрешностью 4,83% с использованием 95%CI нам нужно 263 пациента.

Второй подход основан на исправлении маржинальной погрешности (третий график). Как вы можете видеть, функция размера выборки в этом случае всегда имеет максимум при p = 0,50. Итак, если вы хотите исправить маржу, вы можете выбрать максимальное n в качестве наихудшего сценария.

Несоответствие между этими двумя методами проистекает из того факта, что в первом подходе 95%CI оценивается настолько узко, насколько это необходимо для отклонения нулевой гипотезы. Запрашивая меньшую маржу во втором методе, вы платите за больший размер выборки, но за лучшую точность оценки.

Какой метод выбрать? Это зависит от вашей цели. Если вам нужен метод отбора пробы меньшего размера 1, но помните о погрешности. Если вам нужна лучшая оценка и вы можете собрать больше людей, тогда вам подойдет метод 2.

Несколько мыслей о расчете размера выборки для одной доли

Добавить комментарий Отменить ответ