k-tree

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

138 123 144 145 159 158 173 163 144 149
135 158 149 177 149 144 156 149 159 154
167 134 130 148 146 134 160 157 162 145
143 143 131 144 160 150 132 140 142 149
138 137 159 164 141 150 135 166 167 131
134 144 157 137 143 159 149 142 135 137
153 152 141 154 148 158 155 146 153 139
137 151 141 133 143 127 137 158 156 151
158 146 135 149 130 153 143 161 161 164
143 164 160 140 145 153 168 149 139 149
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x261618171216831
pi0.020.060.160.180.170.120.160.080.030.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 148.11
σ = 10.97
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=148.11 и σ=10.97:

P(x) = e^[-0.5((x-148.11)/10.97)2] / [10.97√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 148.11, σ = 10.97

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности выскочки" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 34.05
S = 65.95
Δ = 52%

Отклонение составляет 52%, поэтому я делаю следующий вывод: распределение не является нормальным по критерию нормальности выскочки.

Скачать статью в формате PDF.

Следующая статья - Дисперсионный анализ.

Вам понравилась статья? Да / Нет

Просмотров: 104


Поиск по сайту:

Порекомендуйте статью своим друзьям:





© 2015-2018 - K-Tree.ru • Онлайн учебник
Копия материалов, размещённых на данном сайте, допускается только по письменному разрешению владельцев сайта.
По любым вопросам Вы можете связаться по почте info@k-tree.ru