k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

153 165 155 132 157 165 150 156 150 157
147 147 132 152 151 143 150 170 128 139
148 146 163 151 151 147 142 146 146 159
153 152 153 158 140 140 134 160 135 143
156 142 160 167 160 154 154 141 135 148
162 139 146 145 138 133 159 157 148 165
133 157 148 138 144 148 159 149 162 169
147 127 158 146 136 152 128 146 161 154
160 142 148 153 159 162 152 149 152 159
146 154 165 165 156 141 141 138 146 146
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x376112013161292
pi0.030.070.060.110.20.130.160.120.090.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.71
σ = 9.78
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.71 и σ=9.78:

P(x) = e^[-0.5((x-149.71)/9.78)2] / [9.78√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.71, σ = 9.78

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 27.72
S = 73.32
Δ = 38%

Отклонение составляет 38%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 9 135

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ