k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

158 152 153 152 145 146 138 150 156 144
144 162 154 145 147 139 150 138 141 158
143 160 157 164 139 169 161 134 157 165
130 154 153 163 133 125 148 155 131 140
157 149 144 160 130 164 154 149 171 143
147 141 139 145 143 155 146 158 168 147
150 157 143 148 153 165 153 173 149 158
147 155 160 143 143 153 137 166 139 132
165 163 134 147 133 158 138 148 141 151
160 155 148 140 150 156 163 157 153 163
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x188141416191072
pi0.010.080.080.140.140.160.190.10.070.02
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.1
σ = 10.23
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.1 и σ=10.23:

P(x) = e^[-0.5((x-150.1)/10.23)2] / [10.23√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.1, σ = 10.23

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 18.18
S = 85.33
Δ = 21%

Отклонение составляет 21%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=150.1 и стандартным отклонением σ=10.23.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 805


Читать далее:
Дисперсионный анализ