k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

158 158 162 142 140 141 168 153 167 158
138 148 147 168 161 156 153 134 142 165
150 146 159 158 133 155 145 148 134 147
147 139 150 159 165 163 151 153 141 130
154 148 159 145 140 142 152 154 158 147
142 150 152 132 162 146 155 151 167 141
160 141 139 163 147 165 158 160 170 153
160 136 158 169 140 170 148 160 156 142
166 157 139 145 168 133 131 160 142 137
164 143 147 155 124 141 147 156 150 142
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x15419617141697
pi0.010.050.040.190.060.170.140.160.090.07
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.71
σ = 10.56
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.71 и σ=10.56:

P(x) = e^[-0.5((x-150.71)/10.56)2] / [10.56√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.71, σ = 10.56

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 29.67
S = 97.05
Δ = 31%

Отклонение составляет 31%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 2 332

5 2

Читать далее:
Дисперсионный анализ