k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

161 144 130 164 144 160 152 160 152 144
147 141 140 166 152 164 123 143 149 154
147 169 158 155 131 156 161 168 149 154
139 148 149 169 146 159 150 152 148 154
148 144 149 142 158 159 146 170 144 144
155 168 161 158 146 148 133 128 153 146
163 150 158 140 167 142 165 160 132 155
149 144 133 153 134 151 156 131 134 137
149 148 135 160 152 146 148 165 158 144
149 143 165 151 144 163 131 171 147 149
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x16661621151486
pi0.010.060.060.060.160.210.150.140.080.06
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.24
σ = 10.6
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.24 и σ=10.6:

P(x) = e^[-0.5((x-150.24)/10.6)2] / [10.6√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.24, σ = 10.6

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 22.72
S = 115.18
Δ = 20%

Отклонение составляет 20%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=150.24 и стандартным отклонением σ=10.6.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 557


Читать далее:
Дисперсионный анализ