Проценты в результатах исследований

Допустим у нас есть новость "Баклажан снижает риск импотенции на 50%!". Звучит круто, сразу хочется бежать и есть баклажаны, или давать их своему парню. Но тут часто используются обманчивые относительные цифры.

Допустим в этом исследовании приняло участие 2000 человек:

  1. 1000 ели баклажаны
  2. 1000 не ели

В первой группе импотенция развилась у 5 человек, а во второй у 10. Относительное снижение риска (RRR) будет 50%.

Дальше немного математики, для тех кому интересно. Формула для расчёта RRR такая:

\[ \text{RRR} = \frac{R_c - R_t}{R_c} \times 100\% \]

Где \(R_c\) — риск в контрольной группе, \(R_t\) — риск в группе с лечением. В нашем случае \(R_c = \frac{10}{1000} \times 100 = 1\%\), \(R_t = \frac{5}{1000} \times 100 = 0.5\%\). Подставляем: \(\text{RRR} = \frac{1 - 0.5}{1} \times 100 = 50\%\).

Но есть в том числе ещё понятие абсолютного снижения риска (ARR), и в нашем случае оно равно 0.5%. Уже совсем другие цифры. Для математиков:

\[ \text{ARR} = R_c - R_t \]

Также есть метрика, показывающая скольких нужно пролечить для эффекта (NNT — Number Need to Treat). Формула:

\[ \text{NNT} = \frac{1}{\text{ARR}} \]

В нашем случае это будет 200, т.е. условно 200 мужчин должны есть баклажаны, чтобы у одного счастливчика не было импотенции.

И теперь одну и ту же новость можно описать разными способами:

После двух последних новостей уже не так сильно тянет бежать за баклажанами.