k-tree

Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

161 171 157 163 142 148 147 164 134 144
142 154 148 152 155 158 158 145 155 137
155 153 142 145 142 146 160 152 157 151
145 145 153 156 150 156 152 158 149 157
144 127 153 142 143 164 149 156 154 144
161 169 139 167 146 142 141 164 137 171
151 163 138 149 173 144 170 142 138 165
160 155 135 148 145 155 139 158 156 161
168 144 147 152 125 148 149 155 155 135
149 153 137 153 161 158 153 146 151 136
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x211014141921864
pi0.020.010.10.140.140.190.210.080.060.04
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.92
σ = 9.74
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.92 и σ=9.74:

P(x) = e^[-0.5((x-150.92)/9.74)2] / [9.74√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.92, σ = 9.74

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности выскочки" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 20.6
S = 96.15
Δ = 21%

Отклонение составляет 21%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности выскочки со средним значением μ=150.92 и стандартным отклонением σ=9.74.

Скачать статью в формате PDF.

Следующая статья - Дисперсионный анализ.

Вам понравилась статья? Да / Нет

Просмотров: 166


Поиск по сайту:

Порекомендуйте статью своим друзьям:





© 2015-2018 - K-Tree.ru • Онлайн учебник
Копия материалов, размещённых на данном сайте, допускается только по письменному разрешению владельцев сайта.
По любым вопросам Вы можете связаться по почте info@k-tree.ru