k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

169 168 149 151 132 142 163 137 142 148
144 151 139 160 149 152 139 140 138 138
147 162 148 148 161 147 157 147 146 147
130 144 143 134 144 161 153 146 146 143
163 150 154 150 135 156 165 142 144 161
141 152 140 138 142 152 151 150 148 163
144 165 161 137 128 157 134 143 163 143
144 159 166 159 166 147 158 145 159 168
147 157 164 168 147 152 163 166 147 150
162 142 159 154 156 131 152 157 158 162
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x439161614511138
pi0.040.030.090.160.160.140.050.110.130.08
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.42
σ = 9.93
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.42 и σ=9.93:

P(x) = e^[-0.5((x-150.42)/9.93)2] / [9.93√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.42, σ = 9.93

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 35.01
S = 83.11
Δ = 42%

Отклонение составляет 42%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 4 248

Рейтинг: 5 (5 голосов)