k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

146 148 163 152 150 146 138 147 142 149
155 150 138 128 137 164 147 142 170 150
149 134 141 141 145 169 136 175 128 156
159 152 132 151 154 141 146 149 152 145
136 123 149 147 165 162 145 153 153 155
161 158 130 153 153 165 156 150 150 144
150 167 167 132 150 150 151 138 145 149
162 168 154 152 163 135 160 141 136 146
154 162 149 159 166 134 164 158 153 151
141 134 152 155 135 143 134 139 157 148
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x33139143010971
pi0.030.030.130.090.140.30.10.090.070.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.29
σ = 10.62
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.29 и σ=10.62:

P(x) = e^[-0.5((x-149.29)/10.62)2] / [10.62√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.29, σ = 10.62

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 57.16
S = 156.02
Δ = 37%

Отклонение составляет 37%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 2 489

5 2

Читать далее:
Дисперсионный анализ