k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями -обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

140 156 164 162 144 143 153 146 137 141
158 138 156 159 160 153 144 137 143 153
151 133 147 149 130 148 146 141 141 161
133 150 142 142 148 164 157 165 150 146
150 161 167 148 135 166 147 159 153 158
165 149 161 142 155 150 157 144 139 152
148 157 141 161 148 134 153 145 127 153
169 158 161 138 165 158 159 167 147 142
162 158 163 155 152 145 159 163 164 156
160 142 130 144 144 143 147 159 144 162
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x3451315141115136
pi0.030.040.050.130.150.140.110.150.130.06
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.72
σ = 9.73
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.72 и σ=9.73:

P(x) = e^[-0.5((x-150.72)/9.73)2] / [9.73√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.72, σ = 9.73

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 26.41
S = 80.08
Δ = 33%

Отклонение составляет 33%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности.

Скачать статью в формате PDF.

Вам понравилась статья? /

Seen: 5 455

Рейтинг: 5 (5 голосов)

Читать следующую
Дисперсионный анализ