k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

154 143 131 154 146 138 148 147 158 138
147 139 151 141 154 169 146 148 162 137
150 159 153 152 135 164 158 150 158 159
142 143 153 145 134 137 155 135 168 160
135 158 142 135 146 154 163 160 140 164
145 141 160 157 141 129 154 144 161 156
152 152 152 146 152 170 160 134 137 144
132 137 150 165 146 153 145 137 147 156
146 154 133 150 168 164 155 136 149 161
142 162 138 147 156 142 161 172 155 154
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x4128171116131044
pi0.040.120.080.170.110.160.130.10.040.04
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.58
σ = 10.06
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.58 и σ=10.06:

P(x) = e^[-0.5((x-149.58)/10.06)2] / [10.06√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.58, σ = 10.06

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 21.58
S = 96.01
Δ = 22%

Отклонение составляет 22%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=149.58 и стандартным отклонением σ=10.06.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 574

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ