k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

154 168 157 143 145 140 144 166 129 147
161 143 142 130 149 148 159 143 159 142
148 150 155 154 159 142 148 156 158 143
156 163 158 146 151 166 150 152 170 137
140 149 151 151 169 145 144 143 147 147
152 137 143 150 130 133 164 159 157 167
158 142 134 157 135 140 149 161 160 155
164 143 154 127 149 145 150 143 132 146
172 159 154 158 152 147 147 164 165 161
154 137 168 150 145 140 140 140 155 157
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x44914181118984
pi0.040.040.090.140.180.110.180.090.080.04
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.18
σ = 10.06
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.18 и σ=10.06:

P(x) = e^[-0.5((x-150.18)/10.06)2] / [10.06√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.18, σ = 10.06

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 38.49
S = 61.51
Δ = 63%

Отклонение составляет 63%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 012

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ