Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.
Закон распределения
Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.
В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:
160 | 138 | 147 | 134 | 154 | 172 | 162 | 163 | 140 | 161 |
158 | 160 | 158 | 142 | 149 | 148 | 153 | 130 | 149 | 167 |
164 | 145 | 141 | 152 | 143 | 138 | 151 | 147 | 148 | 166 |
162 | 145 | 140 | 163 | 156 | 142 | 160 | 132 | 164 | 147 |
176 | 161 | 141 | 158 | 133 | 158 | 160 | 159 | 164 | 136 |
136 | 144 | 152 | 136 | 155 | 140 | 177 | 154 | 159 | 148 |
155 | 139 | 156 | 153 | 158 | 153 | 151 | 157 | 142 | 142 |
143 | 165 | 150 | 154 | 150 | 159 | 142 | 157 | 156 | 168 |
157 | 144 | 155 | 128 | 130 | 131 | 168 | 131 | 140 | 149 |
154 | 144 | 168 | 169 | 145 | 145 | 154 | 143 | 154 | 147 |
Таблица 1. Исходные данные для проверки нормальности распределения |
# | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
x | 6 | 5 | 14 | 14 | 12 | 18 | 16 | 8 | 5 | 1 |
pi | 0.06 | 0.05 | 0.14 | 0.14 | 0.12 | 0.18 | 0.16 | 0.08 | 0.05 | 0.01 |
Таблица 2. Количество элементов в каждом интервале |
Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.
Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:
μ = 151.04
σ = 10.92
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения
Нормальное распределение
Кривая нормального распределения для μ=151.04 и σ=10.92:
P(x) = e^[-0.5((x-151.04)/10.92)2] / [10.92√2π] Формула нормального распределения
Первое приближение
Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.
Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.
diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 21.13
S = 105.19
Δ = 20%
Отклонение составляет 20%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=151.04 и стандартным отклонением σ=10.92.