k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

147 153 145 130 161 169 142 151 137 139
139 156 161 166 159 156 150 139 144 151
147 146 140 142 150 137 151 139 141 132
146 132 148 143 161 161 165 135 158 136
151 161 145 151 167 143 142 163 155 148
155 134 149 139 168 151 156 147 161 159
152 156 173 138 155 162 139 149 150 141
133 148 147 140 144 153 141 162 156 150
148 141 161 136 163 131 167 150 160 174
135 134 139 151 135 149 142 146 154 153
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x781911191341251
pi0.070.080.190.110.190.130.040.120.050.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.08
σ = 10.29
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.08 и σ=10.29:

P(x) = e^[-0.5((x-149.08)/10.29)2] / [10.29√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.08, σ = 10.29

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 33.94
S = 83.41
Δ = 41%

Отклонение составляет 41%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 3 150

5 3

Читать далее:
Дисперсионный анализ