k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

157 139 140 143 152 155 161 154 127 159
164 147 149 159 141 158 142 165 142 140
157 162 155 156 142 134 148 139 170 131
158 151 139 141 147 152 142 148 164 167
138 130 153 158 152 156 156 163 144 155
154 129 156 165 145 150 166 147 157 145
161 164 149 143 156 144 140 149 155 155
147 155 137 159 155 156 166 156 134 138
153 153 148 154 162 161 166 158 158 137
142 141 145 154 155 145 160 167 160 144
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x42716118251385
pi0.040.020.070.160.110.080.250.130.080.05
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.98
σ = 9.71
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.98 и σ=9.71:

P(x) = e^[-0.5((x-150.98)/9.71)2] / [9.71√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.98, σ = 9.71

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 55.33
S = 44.67
Δ = 124%

Отклонение составляет 124%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 9 366

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ