Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.
Закон распределения
Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.
В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:
| 149 | 147 | 156 | 149 | 144 | 144 | 149 | 153 | 143 | 140 |
| 162 | 147 | 162 | 155 | 166 | 145 | 138 | 146 | 145 | 145 |
| 159 | 139 | 151 | 147 | 169 | 138 | 150 | 159 | 137 | 143 |
| 151 | 160 | 165 | 158 | 139 | 138 | 146 | 165 | 139 | 144 |
| 147 | 148 | 159 | 157 | 154 | 149 | 155 | 153 | 155 | 146 |
| 155 | 139 | 144 | 137 | 144 | 156 | 155 | 150 | 132 | 155 |
| 137 | 164 | 151 | 153 | 165 | 151 | 160 | 148 | 152 | 157 |
| 150 | 144 | 162 | 164 | 154 | 146 | 153 | 170 | 164 | 167 |
| 164 | 164 | 141 | 147 | 140 | 155 | 150 | 154 | 145 | 143 |
| 165 | 162 | 152 | 138 | 165 | 157 | 158 | 144 | 149 | 157 |
| Таблица 1. Исходные данные для проверки нормальности распределения | |||||||||
| # | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
|---|---|---|---|---|---|---|---|---|---|---|
| x | 1 | 11 | 6 | 20 | 11 | 13 | 15 | 9 | 11 | 2 |
| pi | 0.01 | 0.11 | 0.06 | 0.2 | 0.11 | 0.13 | 0.15 | 0.09 | 0.11 | 0.02 |
| Таблица 2. Количество элементов в каждом интервале | ||||||||||
Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.
Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:
μ = 151.34
σ = 8.78
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения
Нормальное распределение
Кривая нормального распределения для μ=151.34 и σ=8.78:
P(x) = e^[-0.5((x-151.34)/8.78)2] / [8.78√2π] Формула нормального распределения
Первое приближение
Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.
Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.
diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 32.51
S = 75.1
Δ = 43%
Отклонение составляет 43%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.
