k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

154 147 138 157 133 147 153 145 156 144
140 145 145 151 150 152 139 141 155 145
135 158 141 152 153 131 160 145 145 147
138 167 156 157 158 159 143 150 132 158
139 155 129 174 136 145 153 156 139 137
133 165 144 167 155 145 137 157 165 143
157 142 157 148 147 140 153 144 156 144
147 152 160 163 151 173 129 145 155 149
173 157 142 159 151 132 145 152 166 151
154 145 148 139 156 151 169 156 153 147
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x741217161519162
pi0.070.040.120.170.160.150.190.010.060.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.54
σ = 9.88
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.54 и σ=9.88:

P(x) = e^[-0.5((x-149.54)/9.88)2] / [9.88√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.54, σ = 9.88

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 28.05
S = 88.63
Δ = 32%

Отклонение составляет 32%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 5 133

Рейтинг: 5 (5 голосов)

Читать следующую
Дисперсионный анализ