k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

173 137 156 138 148 160 178 152 144 143
164 153 152 143 152 156 146 156 144 161
149 161 169 135 148 149 133 151 144 137
143 143 157 164 143 161 141 145 161 161
145 144 160 166 134 160 146 148 150 163
159 148 140 138 145 151 151 139 143 155
143 161 168 155 164 145 137 137 148 163
145 147 137 172 167 149 143 161 158 139
163 147 148 161 146 145 158 166 162 146
132 130 166 161 149 146 152 169 167 163
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x41014239818940
pi0.040.10.140.230.090.080.180.090.040
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 151.52
σ = 10.52
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=151.52 и σ=10.52:

P(x) = e^[-0.5((x-151.52)/10.52)2] / [10.52√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 151.52, σ = 10.52

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 53.38
S = 47.92
Δ = 111%

Отклонение составляет 111%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 669


Читать далее:
Дисперсионный анализ