k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

156 147 148 148 158 162 154 137 151 152
149 156 151 143 165 152 157 156 144 155
141 148 162 140 166 153 137 162 139 144
148 150 140 156 134 151 166 138 165 134
151 164 160 154 148 147 154 163 158 141
150 139 152 143 138 137 154 149 145 157
150 164 150 165 138 160 159 161 147 147
146 141 135 132 160 143 160 150 151 159
142 153 144 162 163 161 147 145 146 136
143 156 147 154 170 127 149 136 156 159
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x14101315161611112
pi0.010.040.10.130.150.160.160.110.110.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.33
σ = 9.21
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.33 и σ=9.21:

P(x) = e^[-0.5((x-150.33)/9.21)2] / [9.21√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.33, σ = 9.21

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 16.39
S = 85.13
Δ = 19%

Отклонение составляет 19%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=150.33 и стандартным отклонением σ=9.21.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 5 888

Рейтинг: 5 (6 голосов)

Читать следующую
Дисперсионный анализ