k-tree

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

148 160 143 144 146 157 155 156 134 172
166 146 141 157 162 150 149 167 134 142
152 144 144 142 154 167 161 155 142 151
152 160 156 158 147 153 167 150 164 166
166 152 141 160 146 174 128 151 146 159
148 145 143 138 145 144 146 163 154 146
169 134 139 162 150 155 154 162 157 139
153 134 149 137 159 149 159 150 153 139
142 146 153 161 150 137 142 164 154 167
145 154 169 153 138 154 143 149 148 163
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x16722131912991
pi0.010.060.070.220.130.190.120.090.090.01
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 151.44
σ = 9.72
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=151.44 и σ=9.72:

P(x) = e^[-0.5((x-151.44)/9.72)2] / [9.72√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 151.44, σ = 9.72

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности выскочки" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 27.24
S = 101.48
Δ = 27%

Отклонение составляет 27%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности выскочки со средним значением μ=151.44 и стандартным отклонением σ=9.72.

Скачать статью в формате PDF.

Следующая статья - Дисперсионный анализ.

Вам понравилась статья? Да / Нет

Просмотров: 57


Поиск по сайту:

Порекомендуйте статью своим друзьям:





© 2015-2018 - K-Tree.ru • Онлайн учебник
Копия материалов, размещённых на данном сайте, допускается только по письменному разрешению владельцев сайта.
По любым вопросам Вы можете связаться по почте info@k-tree.ru