k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

140 149 142 157 136 142 139 127 139 142
158 147 156 140 140 162 140 142 140 156
166 129 158 152 157 136 148 162 161 163
130 164 139 156 138 165 145 151 145 156
144 158 152 140 141 158 142 150 155 151
168 159 134 157 155 163 151 146 153 142
139 161 159 145 154 154 159 145 136 148
168 150 140 159 140 136 132 166 156 130
138 147 162 131 142 145 157 150 151 145
162 146 145 141 145 136 151 161 143 136
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x521218131171794
pi0.050.020.120.180.130.110.070.170.090.04
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 148.45
σ = 10.05
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=148.45 и σ=10.05:

P(x) = e^[-0.5((x-148.45)/10.05)2] / [10.05√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 148.45, σ = 10.05

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 41.99
S = 66.31
Δ = 63%

Отклонение составляет 63%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 443


Читать далее:
Дисперсионный анализ