k-tree

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

129 146 153 142 165 149 154 171 133 156
143 166 157 160 160 160 174 153 146 147
151 149 155 150 145 162 130 157 170 159
150 157 142 142 156 148 157 148 150 154
141 149 148 160 162 171 155 124 159 157
169 170 157 157 158 162 135 147 159 148
166 142 159 163 147 147 159 148 152 155
164 166 161 146 150 133 145 153 149 142
146 162 161 137 151 164 134 145 152 138
157 146 152 130 135 134 155 141 169 171
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x15681716171667
pi0.010.050.060.080.170.160.170.160.060.07
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 152.11
σ = 10.66
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=152.11 и σ=10.66:

P(x) = e^[-0.5((x-152.11)/10.66)2] / [10.66√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 152.11, σ = 10.66

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности выскочки" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 19.91
S = 84.85
Δ = 23%

Отклонение составляет 23%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности выскочки со средним значением μ=152.11 и стандартным отклонением σ=10.66.

Скачать статью в формате PDF.

Вам понравилась статья? Да / Нет

Просмотров: 251


Читать далее:
Дисперсионный анализ



© 2015-2018 - K-Tree.ru • Онлайн учебник
Копия материалов, размещённых на данном сайте, допускается только по письменному разрешению владельцев сайта.
По любым вопросам Вы можете связаться по почте info@k-tree.ru