k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

144 172 156 153 130 159 136 172 151 144
157 149 144 143 141 128 156 136 151 154
150 144 157 171 142 144 134 146 150 155
152 150 148 149 157 138 150 158 149 156
166 159 147 164 165 150 150 136 152 155
149 164 153 173 152 170 132 141 143 165
165 146 155 156 138 151 162 155 151 139
151 169 140 137 152 148 150 156 140 162
156 141 148 165 141 162 138 153 142 159
153 158 145 139 144 146 149 163 133 164
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x351211191418485
pi0.030.050.120.110.190.140.180.040.080.05
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.84
σ = 10.06
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.84 и σ=10.06:

P(x) = e^[-0.5((x-150.84)/10.06)2] / [10.06√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.84, σ = 10.06

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 29.38
S = 78.7
Δ = 37%

Отклонение составляет 37%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 818

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ