k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

155 150 144 151 160 135 168 152 148 150
152 143 147 159 167 137 165 154 144 138
134 153 164 156 143 148 153 136 129 148
152 137 166 145 132 165 147 141 142 147
144 157 164 142 147 138 145 147 153 162
161 162 151 148 133 142 144 156 136 137
168 151 145 139 136 164 140 154 130 159
152 152 152 165 156 156 153 175 165 139
164 156 143 145 151 156 164 151 139 152
157 148 156 157 145 135 149 145 150 148
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x411818152171140
pi0.040.110.080.180.150.210.070.110.040
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.88
σ = 9.84
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.88 и σ=9.84:

P(x) = e^[-0.5((x-149.88)/9.84)2] / [9.84√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.88, σ = 9.84

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 32.87
S = 122.4
Δ = 27%

Отклонение составляет 27%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=149.88 и стандартным отклонением σ=9.84.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 792

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ