k-tree
биология

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

137 145 156 148 148 141 152 134 175 157
139 151 134 162 140 134 149 150 140 152
166 142 146 150 144 132 147 149 151 154
141 161 154 137 157 150 168 154 153 161
141 166 157 166 163 125 132 145 133 154
150 137 158 153 164 160 160 154 132 135
158 138 160 147 142 155 148 136 154 159
144 169 144 152 157 139 146 142 138 148
168 149 158 157 151 134 146 157 146 145
136 153 145 143 151 146 170 155 145 152
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x181012192113861
pi0.010.080.10.120.190.210.130.080.060.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.29
σ = 10.1
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.29 и σ=10.1:

P(x) = e^[-0.5((x-149.29)/10.1)2] / [10.1√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.29, σ = 10.1

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 20.19
S = 110.88
Δ = 18%

Отклонение составляет 18%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=149.29 и стандартным отклонением σ=10.1.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 1 032

5 1

Читать далее:
Дисперсионный анализ