k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

158 146 153 145 158 142 134 166 155 145
145 146 149 135 143 146 134 165 136 154
157 162 152 153 167 152 156 147 158 139
148 163 159 157 145 147 149 152 155 160
171 166 147 167 148 164 155 139 147 159
164 166 167 158 149 126 141 150 172 143
159 163 148 140 162 141 155 141 153 144
152 150 141 144 134 148 151 149 150 163
160 157 161 158 155 158 150 154 172 148
159 155 150 154 169 139 153 149 147 153
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x144101720199122
pi0.010.040.040.10.170.20.190.090.120.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 152.21
σ = 9.38
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=152.21 и σ=9.38:

P(x) = e^[-0.5((x-152.21)/9.38)2] / [9.38√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 152.21, σ = 9.38

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 16.47
S = 102.02
Δ = 16%

Отклонение составляет 16%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=152.21 и стандартным отклонением σ=9.38.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 725

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ