k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

149 147 156 149 144 144 149 153 143 140
162 147 162 155 166 145 138 146 145 145
159 139 151 147 169 138 150 159 137 143
151 160 165 158 139 138 146 165 139 144
147 148 159 157 154 149 155 153 155 146
155 139 144 137 144 156 155 150 132 155
137 164 151 153 165 151 160 148 152 157
150 144 162 164 154 146 153 170 164 167
164 164 141 147 140 155 150 154 145 143
165 162 152 138 165 157 158 144 149 157
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x1116201113159112
pi0.010.110.060.20.110.130.150.090.110.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 151.34
σ = 8.78
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=151.34 и σ=8.78:

P(x) = e^[-0.5((x-151.34)/8.78)2] / [8.78√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 151.34, σ = 8.78

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 32.51
S = 75.1
Δ = 43%

Отклонение составляет 43%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 674

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ