k-tree

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

157 146 157 144 156 153 144 141 145 142
142 138 144 151 160 129 143 148 143 141
160 155 142 158 137 163 155 147 137 141
142 156 141 150 136 154 143 140 156 142
167 141 158 133 142 155 163 148 150 141
141 137 157 137 167 144 143 134 162 161
161 165 148 162 161 146 129 136 145 155
155 160 159 142 168 151 143 146 154 160
150 143 137 140 158 140 159 152 136 155
134 144 147 140 151 137 155 131 162 154
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x361125107141283
pi0.030.060.110.250.10.070.140.120.080.03
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 148.31
σ = 9.5
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=148.31 и σ=9.5:

P(x) = e^[-0.5((x-148.31)/9.5)2] / [9.5√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 148.31, σ = 9.5

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности выскочки" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 57.32
S = 42.68
Δ = 134%

Отклонение составляет 134%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности выскочки.

Скачать статью в формате PDF.

Следующая статья - Дисперсионный анализ.

Вам понравилась статья? Да / Нет

Просмотров: 196


Поиск по сайту:

Порекомендуйте статью своим друзьям:





© 2015-2018 - K-Tree.ru • Онлайн учебник
Копия материалов, размещённых на данном сайте, допускается только по письменному разрешению владельцев сайта.
По любым вопросам Вы можете связаться по почте info@k-tree.ru