k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

160 168 154 136 156 162 145 153 161 151
146 160 167 137 140 160 162 163 163 163
154 144 143 162 166 148 160 162 158 156
150 138 134 135 159 142 142 141 145 160
133 139 141 143 162 158 136 142 144 148
138 149 158 156 156 148 143 149 150 140
144 163 155 134 142 153 141 150 145 131
137 141 164 167 145 141 167 168 154 159
141 140 151 151 155 153 166 144 142 131
159 149 154 160 165 171 152 136 152 160
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x58151291291685
pi0.050.080.150.120.090.120.090.160.080.05
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.72
σ = 10.2
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.72 и σ=10.2:

P(x) = e^[-0.5((x-150.72)/10.2)2] / [10.2√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.72, σ = 10.2

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 32.92
S = 75.96
Δ = 43%

Отклонение составляет 43%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 4 856

Рейтинг: 5 (5 голосов)

Читать следующую
Дисперсионный анализ