k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

132 153 168 155 152 153 147 161 152 160
142 153 157 147 150 155 145 166 145 129
132 151 167 159 165 141 140 134 154 148
134 144 151 159 162 156 150 139 140 160
142 154 150 146 160 159 158 143 161 172
156 154 141 149 143 160 131 167 141 166
133 156 155 147 143 140 155 141 154 141
155 164 159 158 152 128 145 146 160 135
142 153 148 162 137 160 167 143 138 144
158 159 154 144 133 147 138 139 168 154
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x551313918121572
pi0.050.050.130.130.090.180.120.150.070.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.16
σ = 10.19
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.16 и σ=10.19:

P(x) = e^[-0.5((x-150.16)/10.19)2] / [10.19√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.16, σ = 10.19

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 26.17
S = 104.59
Δ = 25%

Отклонение составляет 25%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=150.16 и стандартным отклонением σ=10.19.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 4 532

Рейтинг: 5 (5 голосов)