k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

171 137 135 157 133 144 141 143 140 146
158 141 153 153 141 160 143 170 143 147
165 160 150 149 141 148 162 138 160 152
135 150 150 158 162 134 160 152 141 163
148 140 151 130 150 151 136 143 148 143
141 149 145 157 145 128 141 148 166 136
153 145 144 131 128 134 146 141 157 166
167 143 144 144 141 147 143 158 147 162
139 142 156 163 141 133 154 145 130 151
165 151 160 151 141 148 135 151 141 140
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x5962812158862
pi0.050.090.060.280.120.150.080.080.060.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 147.6
σ = 9.97
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=147.6 и σ=9.97:

P(x) = e^[-0.5((x-147.6)/9.97)2] / [9.97√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 147.6, σ = 9.97

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 33.3
S = 92.18
Δ = 36%

Отклонение составляет 36%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 9 092

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ