k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

139 140 145 152 153 141 152 154 128 159
157 160 161 163 158 145 154 146 166 146
145 152 140 139 163 154 150 138 141 134
152 157 147 150 142 150 149 155 161 142
158 158 134 156 136 156 143 159 140 134
151 157 162 147 143 143 140 160 149 135
145 138 152 138 168 161 147 135 139 163
156 149 153 155 149 159 143 157 142 156
155 143 157 138 150 148 137 150 147 138
141 147 171 156 146 151 132 143 152 149
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x261316141519941
pi0.020.060.130.160.140.150.190.090.040.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 148.97
σ = 8.92
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=148.97 и σ=8.92:

P(x) = e^[-0.5((x-148.97)/8.92)2] / [8.92√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 148.97, σ = 8.92

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 22.73
S = 80.76
Δ = 28%

Отклонение составляет 28%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=148.97 и стандартным отклонением σ=8.92.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 8 676

Рейтинг: 5 (7 голосов)

Читать следующую
Дисперсионный анализ