k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

152 140 160 148 156 144 145 140 150 138
144 161 156 146 160 149 139 163 168 146
149 150 169 146 141 161 161 135 163 148
156 148 134 157 161 152 160 135 156 162
144 146 165 163 139 139 150 149 158 157
160 149 150 136 134 147 151 168 162 153
127 160 140 159 166 138 144 143 156 134
131 141 154 166 162 137 146 167 168 152
148 162 160 144 146 148 141 161 146 140
138 160 158 149 169 143 153 136 153 164
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x25991418912137
pi0.020.050.090.090.140.180.090.120.130.07
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.79
σ = 10.17
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.79 и σ=10.17:

P(x) = e^[-0.5((x-150.79)/10.17)2] / [10.17√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.79, σ = 10.17

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 23.28
S = 107.04
Δ = 22%

Отклонение составляет 22%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=150.79 и стандартным отклонением σ=10.17.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 1 197

5 1

Читать далее:
Дисперсионный анализ