k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

160 138 147 134 154 172 162 163 140 161
158 160 158 142 149 148 153 130 149 167
164 145 141 152 143 138 151 147 148 166
162 145 140 163 156 142 160 132 164 147
176 161 141 158 133 158 160 159 164 136
136 144 152 136 155 140 177 154 159 148
155 139 156 153 158 153 151 157 142 142
143 165 150 154 150 159 142 157 156 168
157 144 155 128 130 131 168 131 140 149
154 144 168 169 145 145 154 143 154 147
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x651414121816851
pi0.060.050.140.140.120.180.160.080.050.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 151.04
σ = 10.92
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=151.04 и σ=10.92:

P(x) = e^[-0.5((x-151.04)/10.92)2] / [10.92√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 151.04, σ = 10.92

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 21.13
S = 105.19
Δ = 20%

Отклонение составляет 20%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=151.04 и стандартным отклонением σ=10.92.

Скачать статью в формате PDF.

Вам понравилась статья? /

Просмотров: 4 034

Рейтинг: 5 (4 голоса)

Читать далее:
Дисперсионный анализ