Проценты в результатах исследований
Допустим у нас есть новость "Баклажан снижает риск импотенции на 50%!". Звучит круто, сразу хочется бежать и есть баклажаны, или давать их своему парню. Но тут часто используются обманчивые относительные цифры.
Допустим в этом исследовании приняло участие 2000 человек:
- 1000 ели баклажаны
- 1000 не ели
В первой группе импотенция развилась у 5 человек, а во второй у 10. Относительное снижение риска (RRR) будет 50%.
Дальше немного математики, для тех кому интересно. Формула для расчёта RRR такая:
\[ \text{RRR} = \frac{R_c - R_t}{R_c} \times 100\% \]
Где \(R_c\) — риск в контрольной группе, \(R_t\) — риск в группе с лечением. В нашем случае \(R_c = \frac{10}{1000} \times 100 = 1\%\), \(R_t = \frac{5}{1000} \times 100 = 0.5\%\). Подставляем: \(\text{RRR} = \frac{1 - 0.5}{1} \times 100 = 50\%\).
Но есть в том числе ещё понятие абсолютного снижения риска (ARR), и в нашем случае оно равно 0.5%. Уже совсем другие цифры. Для математиков:
\[ \text{ARR} = R_c - R_t \]
Также есть метрика, показывающая скольких нужно пролечить для эффекта (NNT — Number Need to Treat). Формула:
\[ \text{NNT} = \frac{1}{\text{ARR}} \]
В нашем случае это будет 200, т.е. условно 200 мужчин должны есть баклажаны, чтобы у одного счастливчика не было импотенции.
И теперь одну и ту же новость можно описать разными способами:
- 🎉 RRR — баклажан снижает риск импотенции на 50%
- 🤏 ARR — баклажан снижает риск импотенции на 0.5%
- 👬 NNT — если компания из 200 мужчин будет долго есть баклажаны, то возможно импотенция будет у одного, а не двоих
После двух последних новостей уже не так сильно тянет бежать за баклажанами.