k-tree

Анализ данных

1 . Нормальное распределение

Любой процесс можно описать нормальным распределением

2 . Распределение Пуассона

Второе по популярности распределение

3 . Закон распределения

Как структурировать данные полученные в ходе статистического исследования

4 . Параметры дискретного закона распределения

Критерии для сравнения распределений

5 . Статистическая гипотеза

Статистическая гипотеза. Проверка утверждений. Общие вопросы

6. Нормальность распределения

Проверка нормальности распределения

7 . Дисперсионный анализ

ANOVA

Прогнозирование



Нормальность распределения

В примерах в данной статье данные генерятся при каждой загрузке страницы. Если Вы хотите посмотреть пример с другими значениями - обновите страницу .

Некоторые статистические инструменты исходят из предположения, что распределение является нормальным. Ниже будет приведён алгоритм проверки нормальности распределения, а также пример в excel.

Закон распределения

Проверка на соответствие нормальному распределению - это частный случай решения задачи о нахождении среди известных функций распределения такой, максимально точно описывающей данное распределение.

В первую очередь, необходимо структурировать имеющиеся значения, в статье свойства распределения описано, как строится ряд распределения, поэтому здесь я опущу детали и приведу исходные данные и обработанные значения:

138 169 130 140 128 146 149 172 157 166
151 165 168 163 158 153 135 150 143 154
156 134 140 143 139 162 162 155 161 141
154 157 142 144 166 167 156 164 151 159
153 140 132 154 162 141 156 152 145 151
147 132 146 145 163 136 137 153 135 153
155 161 160 138 138 154 135 145 143 155
157 169 157 151 147 146 130 153 163 155
148 138 134 162 155 130 161 137 153 167
154 159 158 135 149 160 162 145 140 151
Таблица 1. Исходные данные для проверки нормальности распределения
# 12345678910
x67139818141563
pi0.060.070.130.090.080.180.140.150.060.03
Таблица 2. Количество элементов в каждом интервале
График 1. Ряд распределения

Независимо от того, что мы видим на графике, нам необходимо проверить, является ли распределение нормальным.

Характеристики нормального распределения - это среднее значение и стандартное отклонение. Вычислим эти значения для нашего распределения:

μ = 150.31
σ = 10.79
Расчёт среднего значения и стандартного отклонения описан в статье параметры распределения

Нормальное распределение

Кривая нормального распределения для μ=150.31 и σ=10.79:

P(x) = e^[-0.5((x-150.31)/10.79)2] / [10.79√2π] Формула нормального распределения
График 2. Ряд распределения и нормальное распределение, μ = 150.31, σ = 10.79

Первое приближение

Попробуем изобрести критерий нормальности, самое простое, что приходит в голову - это определить процент соответствия нормальной кривой и существующего распределения.

Для этого сложим абсолютные значения разниц по всем точкам графика, найдём площадь под графиком нормального распределения и вычислим интересующее отклонение, я назову такой критерий "критерий нормальности выскочки" и постановлю, что если отклонение больше, допустим 30%, то распределение не является нормальным.

diff = Σ|D(X) - P(X)|
S = ΣP(X)
Δ = diff / S
diff = 28.84
S = 109.42
Δ = 26%

Отклонение составляет 26%, а значит я делаю вывод, что распределение является нормальным по критерию нормальности выскочки со средним значением μ=150.31 и стандартным отклонением σ=10.79.

Скачать статью в формате PDF.

Следующая статья - Дисперсионный анализ.

Вам понравилась статья? Да / Нет

Поиск по сайту:

Порекомендуйте статью своим друзьям:





© 2015-2018 - K-Tree.ru • Онлайн учебник
Копия материалов, размещённых на данном сайте, допускается только по письменному разрешению владельцев сайта.
По любым вопросам Вы можете связаться по почте info@k-tree.ru