k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

163 166 153 156 150 137 167 146 147 142
151 145 161 152 144 151 148 143 140 143
150 138 159 148 152 142 145 156 147 152
148 138 151 139 142 146 158 152 154 141
158 132 138 158 160 162 146 156 156 156
153 136 145 149 166 145 137 142 151 152
136 156 155 144 147 155 124 144 130 161
146 145 143 140 152 143 154 131 166 135
146 158 163 147 145 159 153 151 166 136
135 131 154 152 140 135 145 151 161 154
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x146101813221276
pi0.010.040.060.10.180.130.220.120.070.06
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 148.5
σ = 9.14
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=148.5 и σ=9.14:

P(x) = e^[-0.5((x-148.5)/9.14)2] / [9.14√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 148.5, σ = 9.14

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 31.12
S = 68.92
Δ = 45%

Отклонение составляет 45%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 675

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ