k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

148 160 138 148 144 149 161 156 155 147
139 158 145 151 150 159 160 167 165 153
147 132 141 148 148 130 145 138 145 156
137 141 172 161 145 139 132 158 161 141
162 153 165 157 158 145 140 141 157 131
133 144 136 143 164 144 133 167 148 143
162 155 144 135 153 166 155 136 163 141
146 157 149 141 162 148 158 142 147 151
143 151 152 163 157 160 141 157 173 149
149 170 148 158 145 140 140 159 162 149
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x661317167171052
pi0.060.060.130.170.160.070.170.10.050.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.11
σ = 10.06
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.11 и σ=10.06:

P(x) = e^[-0.5((x-150.11)/10.06)2] / [10.06√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.11, σ = 10.06

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 57.43
S = 42.57
Δ = 135%

Отклонение составляет 135%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Просмотров: 3 476

Рейтинг: 5 (4 голоса)

Читать далее:
Дисперсионный анализ