k-tree
Пссс..! рисуешь?
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

147 151 143 152 166 154 145 151 141 147
148 153 143 160 145 133 150 152 154 138
161 131 162 159 157 148 156 142 150 167
134 135 151 145 158 152 157 151 159 143
148 142 140 161 150 128 148 157 146 132
137 141 165 145 134 154 139 152 137 137
160 165 136 164 156 146 136 148 163 138
148 164 159 139 152 142 151 152 141 144
146 159 136 149 159 147 162 168 149 162
163 149 125 156 163 158 148 134 143 157
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x23101112161514106
pi0.020.030.10.110.120.160.150.140.10.06
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.21
σ = 9.81
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.21 и σ=9.81:

P(x) = e^[-0.5((x-149.21)/9.81)2] / [9.81√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.21, σ = 9.81

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 15.61
S = 90.25
Δ = 17%

Отклонение составляет 17%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=149.21 и стандартным отклонением σ=9.81.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 620


Читать далее:
Дисперсионный анализ