k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

154 141 150 144 136 142 162 147 133 146
145 133 141 162 154 160 137 156 145 138
154 138 138 148 127 146 144 151 141 154
156 136 173 143 163 164 144 154 138 137
155 139 167 148 144 153 134 147 164 144
163 138 155 151 131 162 148 156 139 154
151 152 148 156 149 130 160 137 159 148
134 123 151 150 147 147 136 155 147 144
171 138 161 157 156 143 158 152 151 153
130 137 144 157 162 156 150 144 161 158
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x2311121916191151
pi0.020.030.110.120.190.160.190.110.050.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 148.3
σ = 10.08
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=148.3 и σ=10.08:

P(x) = e^[-0.5((x-148.3)/10.08)2] / [10.08√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 148.3, σ = 10.08

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 19.87
S = 82.22
Δ = 24%

Отклонение составляет 24%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=148.3 и стандартным отклонением σ=10.08.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 258

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ