k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

157 156 161 156 149 156 157 167 150 176
165 143 141 157 151 152 144 167 156 153
159 122 157 148 144 160 155 159 157 142
146 154 144 149 141 157 131 148 162 139
151 154 135 147 147 138 135 163 143 157
165 154 153 158 143 154 158 163 149 162
154 145 140 151 137 162 140 159 147 148
161 144 157 137 158 142 139 157 153 143
141 150 145 140 166 145 150 132 147 132
146 141 147 133 150 139 145 141 160 153
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x136171820201130
pi0.010.030.060.170.180.20.20.110.030
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.94
σ = 9.53
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.94 и σ=9.53:

P(x) = e^[-0.5((x-149.94)/9.53)2] / [9.53√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.94, σ = 9.53

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 15.82
S = 89.83
Δ = 18%

Отклонение составляет 18%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=149.94 и стандартным отклонением σ=9.53.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 1 633

5 1

Читать далее:
Дисперсионный анализ