k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

142 166 146 159 148 150 160 145 143 168
148 144 167 143 155 149 149 150 148 159
160 151 142 149 144 137 141 160 163 156
173 152 142 154 166 151 143 147 162 161
155 139 147 163 157 158 136 155 156 143
142 142 136 155 144 148 169 147 163 156
141 152 141 152 138 147 142 142 135 141
148 137 144 140 153 170 156 138 148 147
142 142 172 163 126 144 155 157 144 139
140 148 144 138 138 159 155 157 158 161
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x111224179151343
pi0.010.010.120.240.170.090.150.130.040.03
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.98
σ = 9.55
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.98 и σ=9.55:

P(x) = e^[-0.5((x-149.98)/9.55)2] / [9.55√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.98, σ = 9.55

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 55.43
S = 46.39
Δ = 119%

Отклонение составляет 119%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 6 631

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ