k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

139 157 158 151 143 162 133 154 147 134
133 137 159 159 150 151 145 142 144 162
161 135 150 169 160 155 149 162 167 158
141 162 151 136 144 157 147 151 149 139
147 154 133 161 151 152 161 141 133 125
164 144 138 153 159 138 145 163 154 140
145 133 143 157 155 170 170 152 156 163
166 153 156 145 162 152 160 152 148 153
139 143 132 146 135 165 155 137 162 142
141 160 156 157 151 158 153 137 144 140
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x1691015111713133
pi0.010.060.090.10.150.110.170.130.130.03
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.03
σ = 10.19
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.03 и σ=10.19:

P(x) = e^[-0.5((x-150.03)/10.19)2] / [10.19√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.03, σ = 10.19

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 38.44
S = 61.56
Δ = 62%

Отклонение составляет 62%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 2 033

5 2

Читать далее:
Дисперсионный анализ