k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

151 167 139 134 140 143 172 149 161 140
141 147 139 154 162 154 157 148 155 143
161 155 144 143 148 147 137 139 148 163
159 142 139 139 147 159 152 134 136 159
157 133 146 157 141 136 152 160 160 148
142 132 157 151 144 135 165 139 159 140
165 145 160 160 140 148 162 156 149 149
168 160 140 126 165 138 158 154 137 142
151 148 158 150 167 165 166 134 172 138
137 145 151 131 127 154 153 138 148 149
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x2714151312131381
pi0.020.070.140.150.130.120.130.130.080.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.05
σ = 10.62
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.05 и σ=10.62:

P(x) = e^[-0.5((x-149.05)/10.62)2] / [10.62√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.05, σ = 10.62

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 32.02
S = 69.68
Δ = 46%

Отклонение составляет 46%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 6 512

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ