k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

148 142 145 156 158 144 156 159 136 144
139 145 151 172 155 140 139 149 150 163
155 137 170 150 156 143 154 163 152 134
148 157 153 150 150 151 157 169 154 165
159 152 169 148 135 132 146 134 138 128
160 142 136 135 156 152 148 163 151 134
145 152 158 166 157 141 136 153 146 153
160 151 137 139 155 136 145 157 154 132
152 167 145 150 139 151 133 150 135 138
147 141 153 157 146 142 145 149 168 162
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x3111112102314834
pi0.030.110.110.120.10.230.140.080.030.04
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.2
σ = 9.95
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.2 и σ=9.95:

P(x) = e^[-0.5((x-149.2)/9.95)2] / [9.95√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.2, σ = 9.95

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 41.82
S = 133.87
Δ = 31%

Отклонение составляет 31%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 9 409

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ