k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

146 154 144 143 168 150 144 132 138 165
155 163 159 158 145 151 134 156 151 144
158 155 145 155 157 136 164 157 148 148
144 142 147 136 152 153 160 141 139 155
148 148 150 149 162 149 147 139 161 134
146 148 140 159 155 145 137 143 160 155
153 131 143 145 164 142 166 143 153 152
134 162 148 146 137 160 161 152 147 161
142 162 160 149 162 157 159 158 161 146
149 143 140 151 161 137 146 143 145 151
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x568151812813122
pi0.050.060.080.150.180.120.080.130.120.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.89
σ = 8.76
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.89 и σ=8.76:

P(x) = e^[-0.5((x-149.89)/8.76)2] / [8.76√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.89, σ = 8.76

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 34.11
S = 70.7
Δ = 48%

Отклонение составляет 48%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 492


Читать далее:
Дисперсионный анализ