k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

135 146 143 168 159 157 159 159 160 157
149 129 137 154 152 162 151 169 164 155
159 142 164 140 133 158 171 158 169 131
148 141 167 152 164 157 152 142 147 145
135 148 160 136 157 146 143 149 155 148
149 148 153 162 168 141 160 155 146 149
163 134 162 144 142 141 161 155 170 127
169 155 137 153 138 145 155 165 166 166
151 156 152 149 138 174 141 154 145 139
151 138 143 157 139 149 149 154 151 156
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x3512101519131192
pi0.030.050.120.10.150.190.130.110.090.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 151.47
σ = 10.52
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=151.47 и σ=10.52:

P(x) = e^[-0.5((x-151.47)/10.52)2] / [10.52√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 151.47, σ = 10.52

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 18.65
S = 106.01
Δ = 18%

Отклонение составляет 18%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=151.47 и стандартным отклонением σ=10.52.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 432

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ