k-tree
Электронный учебник

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

150 154 150 143 140 155 156 142 141 148
150 162 166 138 145 126 140 137 145 175
160 154 149 166 165 156 145 149 163 160
152 153 155 160 157 152 161 148 158 150
142 159 153 157 148 145 144 141 143 155
141 149 149 145 162 153 166 149 152 136
145 157 156 143 147 131 157 123 138 136
142 167 150 149 140 135 148 150 156 137
156 148 141 154 149 159 157 137 159 155
139 145 149 145 142 174 160 146 139 151
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x21816162418851
pi0.020.010.080.160.160.240.180.080.050.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 149.77
σ = 9.49
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=149.77 и σ=9.49:

P(x) = e^[-0.5((x-149.77)/9.49)2] / [9.49√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 149.77, σ = 9.49

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 15.92
S = 111.55
Δ = 14%

Отклонение составляет 14%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности со средним значением μ=149.77 и стандартным отклонением σ=9.49.

Скачать статью в формате PDF.

Вам понравилась статья? /

Просмотров: 3 712

Рейтинг: 5 (4 голоса)

Читать далее:
Дисперсионный анализ