k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

149 167 161 154 150 138 173 155 174 142
146 138 159 138 153 162 150 157 142 140
130 164 130 148 147 143 141 136 157 140
154 141 161 126 149 149 145 165 152 136
150 157 150 156 157 148 162 140 135 153
145 139 169 148 150 143 130 168 155 152
149 166 159 163 150 138 149 136 167 153
144 147 169 157 144 166 145 130 151 143
150 140 140 141 146 132 151 153 147 145
150 168 139 124 160 146 139 170 159 158
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x25816152111984
pi0.020.050.080.160.150.210.110.090.080.04
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.53
σ = 10.99
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.53 и σ=10.99:

P(x) = e^[-0.5((x-149.53)/10.99)2] / [10.99√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.53, σ = 10.99

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 21.31
S = 116.05
Δ = 18%

Отклонение составляет 18%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=149.53 и стандартным отклонением σ=10.99.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 7 814

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ