k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

140 153 129 147 161 140 140 167 169 135
169 140 142 135 147 156 169 139 139 144
146 135 152 138 152 153 144 142 144 133
145 167 156 142 153 152 149 143 145 166
149 146 154 137 150 136 148 159 145 155
149 150 142 164 137 147 161 159 147 160
150 138 147 155 162 150 142 144 141 147
153 163 162 159 155 149 159 146 160 153
159 154 161 143 166 144 136 144 140 142
129 173 140 138 143 131 147 138 162 133
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x571915161371043
pi0.050.070.190.150.160.130.070.10.040.03
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 148.71
σ = 10.1
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=148.71 и σ=10.1:

P(x) = e^[-0.5((x-148.71)/10.1)2] / [10.1√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 148.71, σ = 10.1

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 25.12
S = 80.37
Δ = 31%

Отклонение составляет 31%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 5 453

Рейтинг: 5 (5 голосов)

Читать следующую
Дисперсионный анализ