k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

143 153 141 140 143 165 149 158 152 141
135 164 146 163 149 139 170 143 149 164
134 151 150 144 139 141 155 160 153 150
131 167 149 163 156 152 149 133 151 151
171 144 167 156 158 169 143 155 163 155
142 144 162 137 159 154 147 143 158 140
160 140 176 174 159 145 168 152 150 131
159 155 161 149 159 160 141 139 147 166
161 139 158 145 148 147 152 140 145 154
153 157 140 147 162 145 158 145 134 131
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x75181119916761
pi0.070.050.180.110.190.090.160.070.060.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 151.05
σ = 10.29
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=151.05 и σ=10.29:

P(x) = e^[-0.5((x-151.05)/10.29)2] / [10.29√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 151.05, σ = 10.29

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 44.27
S = 55.73
Δ = 79%

Отклонение составляет 79%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 4 638

Рейтинг: 5 (5 голосов)

Читать следующую
Дисперсионный анализ