k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

133 133 141 141 157 148 142 142 130 146
151 154 142 157 161 159 157 153 135 125
139 142 150 143 142 152 161 167 156 131
146 166 127 139 154 171 153 159 137 139
164 157 149 158 156 144 144 148 141 159
132 154 167 140 163 145 158 155 155 132
164 148 165 166 149 148 148 153 159 144
127 155 143 135 158 153 149 130 153 163
159 145 143 144 161 169 160 157 158 162
158 139 132 166 144 130 132 154 143 157
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x310317911201493
pi0.030.10.030.170.090.110.20.140.090.03
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.25
σ = 11.09
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.25 и σ=11.09:

P(x) = e^[-0.5((x-149.25)/11.09)2] / [11.09√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.25, σ = 11.09

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 43.22
S = 65.29
Δ = 66%

Отклонение составляет 66%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 7 117

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ