k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

149 169 133 133 155 164 140 157 154 150
149 149 144 165 137 151 169 147 150 158
156 161 140 143 142 150 127 156 163 139
150 161 150 150 157 152 164 151 144 144
157 148 162 150 145 137 160 167 163 159
156 153 138 155 149 150 147 137 130 153
144 153 156 162 156 160 173 156 140 147
150 157 155 149 170 167 146 156 141 157
142 148 147 165 157 168 130 152 169 161
134 134 147 156 142 140 153 142 144 135
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x35912131819974
pi0.030.050.090.120.130.180.190.090.070.04
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 151
σ = 10.09
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=151 и σ=10.09:

P(x) = e^[-0.5((x-151)/10.09)2] / [10.09√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 151, σ = 10.09

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 15.67
S = 98.58
Δ = 16%

Отклонение составляет 16%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=151 и стандартным отклонением σ=10.09.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 821

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ