k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

128 144 138 140 138 154 164 154 148 146
127 152 133 167 148 131 161 143 159 132
132 149 157 153 157 156 132 137 141 155
139 164 159 158 149 147 148 165 145 154
153 150 141 147 153 153 145 153 157 160
149 160 163 163 145 138 150 156 165 149
171 150 143 144 167 137 157 154 135 157
159 128 153 158 152 158 138 145 161 134
140 156 128 153 132 149 163 146 149 146
162 150 149 146 155 153 152 147 159 150
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x57961423141272
pi0.050.070.090.060.140.230.140.120.070.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.4
σ = 10.08
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.4 и σ=10.08:

P(x) = e^[-0.5((x-149.4)/10.08)2] / [10.08√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.4, σ = 10.08

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 35.93
S = 131.89
Δ = 27%

Отклонение составляет 27%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=149.4 и стандартным отклонением σ=10.08.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 028

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ