k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

157 161 133 142 137 156 161 156 143 151
163 138 139 143 140 140 148 131 161 157
163 137 160 155 168 152 143 148 144 141
161 143 131 153 174 146 160 159 145 159
139 152 143 161 143 163 160 146 151 149
144 142 163 144 159 159 134 133 146 140
148 169 144 167 154 133 135 141 140 163
137 160 138 149 173 150 135 161 141 145
150 146 164 159 164 148 155 156 140 137
149 138 153 158 136 167 149 146 146 141
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x810171610818741
pi0.080.10.170.160.10.080.180.070.040.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.55
σ = 10.43
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.55 и σ=10.43:

P(x) = e^[-0.5((x-149.55)/10.43)2] / [10.43√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.55, σ = 10.43

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 47.34
S = 52.66
Δ = 90%

Отклонение составляет 90%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 9 475

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ