k-tree

Анализ данных

1. Нормальное распределение

Любой процесс можно описать нормальным распределением

2. Распределение Пуассона

Второе по популярности распределение

3. Закон распределения

Как структурировать данные полученные в ходе статистического исследования

4. Параметры дискретного закона распределения

Критерии для сравнения распределений

5. Статистическая гипотеза

Статистическая гипотеза. Проверка утверждений. Общие вопросы

6. Дисперсионный анализ

ANOVA

Прогнозирование



Нормальное распределение или распределение Гаусса

 КАЛЬКУЛЯТОР ТАБЛИЦА |

Вероятность

Вероятность, что подброшенная монета упадёт орлом вверх 50%, что при броске шестигранного кубика выпадет 4 - 16,7%, что завтра на кого-нибудь упадёт метеорит - 0.00000000294%. Это простые примеры, достаточно разделить количество желаемых событий на общее количество случаев и мы получаем вероятность события, но когда результаты эксперимента могут быть не только орлом или решкой (что эквивалентно да/нет), а большим набором данных. Например, вес батона хлеба, если мы возьмём в магазине 1000 буханок хлеба и взвесим каждую, то мы узнаем, что на самом деле батон не весит 400 грамм, результаты будут варьироваться в диапазоне 384-416 грамм (допуск разброса веса предусмотрен ГОСТом). Если Вы построите график "Количество буханок - Вес", то график будет иметь форму напоминающую колокол, что-то похожее на следующий график:

Плотность вероятности нормального распределения

Такую форму график получит потому, что большинство значений близко к 400. Это - пример нормального распределения, множество событий имеют закон нормального распределения, например, вес или рост для определённого возраста, или среднее время Вашего похода до магазина и многие другие события также подчиняются закону нормального распределения, вот наглядный пример:
Вот так работают маркетологи: проводят опрос 1000 человек и получают представление о всём населении

В случае таблицы Вы имеете дело с дискретными данными, т.е. для каждого веса есть определённая вероятность, но в случае графика дело немного меняется, теперь мы говорим не о 1000 буханок, которые мы взвесили, а обо всех буханках в мире сразу! Зачем? Что бы не взвешивать все буханки. Имея закон распределения, который мы получили взвесив 1000 буханок (мы могли взвесить 100, 200, 500, сколько угодно), мы можем предположить, что сколько бы мы буханок не взяли, замерив их, мы получим ту же форму колокола. Используя термины статистики, все буханки хлеба - это генеральная совокупность, 1000 замеренных буханок - выборка.

Теперь, возьмём одну буханку хлеба, какова вероятность, что её вес будет между 390г и 400г?

Вероятность события между a и b:

P(a ≤ X ≤ b) = P(X ≤ b) - P(X ≤ a)

Распределение вероятности - это функция, в которой для каждого события Х присваивается вероятность p, что событие произойдёт

Нормальное распределение (распределение Гаусса)

Нормальное распределение получило своё название абсолютно справедливо: по статистике, большинство событий происходят именно с вероятностью нормального распределения, но что это значит? Это означает, например, что когда Вы видите на упаковке хлеба обозначение "Вес: 400±16г" - вес батона имеет нормальное распределение со средним значением 400г и стандартным отклонением 16г.

Затабулированые значения функции распределения (таблица нормального распределения)

Для нахождения вероятности события Z0 можно воспользоваться таблицей нормального распределения ниже. На пересечении строк (n) и столбцов (m) находится значение вероятности n+m.

Z0 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0,50,5040,5080,5120,5160,51990,52390,52790,53190,5359
0.1 0,53980,54380,54780,55170,55570,55960,56360,56750,57140,5753
0.2 0,57930,58320,58710,5910,59480,59870,60260,60640,61030,6141
0.3 0,61790,62170,62550,62930,63310,63680,64060,64430,6480,6517
0.4 0,65540,65910,66280,66640,670,67360,67720,68080,68440,6879
0.5 0,69150,6950,69850,70190,70540,70880,71230,71570,7190,7224
0.6 0,72570,72910,73240,73570,73890,74220,74540,74860,75170,7549
0.7 0,7580,76110,76420,76730,77040,77340,77640,77940,78230,7852
0.8 0,78810,7910,79390,79670,79950,80230,80510,80780,81060,8133
0.9 0,81590,81860,82120,82380,82640,82890,83150,8340,83650,8389
1 0,84130,84380,84610,84850,85080,85310,85540,85770,85990,8621
1.1 0,86430,86650,86860,87080,87290,87490,8770,8790,8810,883
1.2 0,88490,88690,88880,89070,89250,89440,89620,8980,89970,9015
1.3 0,90320,90490,90660,90820,90990,91150,91310,91470,91620,9177
1.4 0,91920,92070,92220,92360,92510,92650,92790,92920,93060,9319
1.5 0,93320,93450,93570,9370,93820,93940,94060,94180,94290,9441
1.6 0,94520,94630,94740,94840,94950,95050,95150,95250,95350,9545
1.7 0,95540,95640,95730,95820,95910,95990,96080,96160,96250,9633
1.8 0,96410,96490,96560,96640,96710,96780,96860,96930,96990,9706
1.9 0,97130,97190,97260,97320,97380,97440,9750,97560,97610,9767
2 0,97720,97780,97830,97880,97930,97980,98030,98080,98120,9817
2.1 0,98210,98260,9830,98340,98380,98420,98460,9850,98540,9857
2.2 0,98610,98640,98680,98710,98750,98780,98810,98840,98870,989
2.3 0,98930,98960,98980,99010,99040,99060,99090,99110,99130,9916
2.4 0,99180,9920,99220,99250,99270,99290,99310,99320,99340,9936
2.5 0,99380,9940,99410,99430,99450,99460,99480,99490,99510,9952
2.6 0,99530,99550,99560,99570,99590,9960,99610,99620,99630,9964
2.7 0,99650,99660,99670,99680,99690,9970,99710,99720,99730,9974
2.8 0,99740,99750,99760,99770,99770,99780,99790,99790,9980,9981
2.9 0,99810,99820,99820,99830,99840,99840,99850,99850,99860,9986
3 0,998650,998690,998740,998780,998820,998860,998890,998930,998960,999
3.1 0,999030,999060,99910,999130,999160,999180,999210,999240,999260,99929
3.2 0,999310,999340,999360,999380,99940,999420,999440,999460,999480,9995
3.3 0,999520,999530,999550,999570,999580,99960,999610,999620,999640,99965
3.4 0,999660,999680,999690,99970,999710,999720,999730,999740,999750,99976
3.5 0,999770,999780,999780,999790,99980,999810,999810,999820,999830,99983
3.6 0,999840,999850,999850,999860,999860,999870,999870,999880,999880,99989
3.7 0,999890,99990,99990,99990,999910,999910,999920,999920,999920,99992
3.8 0,999930,999930,999930,999940,999940,999940,999940,999950,999950,99995
3.9 0,999950,999950,999960,999960,999960,999960,999960,999960,999970,99997
Таблица 1. Таблица значений нормального распределения. Красным выделены часто используемые значения при выборе критической области

Нормальное распределение - среднее 0 и отклонение 1?

Не только. График нормального распределения построен для среднего значения ноль и стандартного отклонения единица, т.е. 0±1. Но если Ваши среднее и отклонение отличаются от нуля и единицы, то к Вашим услугам следующая формула:

Z = (X - μ) / σ

Где μ и σ - среднее значение и стандартное отклонение для Вашего распределения соответственно, а X - величина, для которой Вы хотите узнать вероятность. Возвращаясь к примеру с батоном хлеба - для того, что бы узнать, какова вероятность, что батон будет весить 396 грамм - необходимо подставить в формулу значения X=396, μ = 400, σ = 16:

Z = (396 - 400) / 16 = -0.25

Далее, по таблице необходимо найти значение для Z. Как для Z = -0.25, так и для Z = -0.25 это будет 0,5987 (нормальное распределение симметрично, поэтому значение вероятности определяется для абсолютного значения Z: график симметричен относительно оси Y, поэтому значение вероятности не зависит от знака X)

Свойства функции распределения

  • Симметрична относительно центра (среднее значение - математическое ожидание μ)
  • Мода и медиана равны математическому ожиданию μ

Функция распределения

Функция распределения предназначена для того, что бы определить, какова вероятность, что величина X меньше или равна некоторого числа x.

На примере батона из первого абзаца: если мы хотим узнать, какова вероятность, что батон будет весить меньше 410 грамм, то, воспользовавшись формулой приведения, получим Z=0.63 и значение P(X<0.63) = 0,7357, т.е. вероятность того, что батон будет весить 410 грамм или меньше - 73,57%

Среднее значение нормального распределения (μ)

Математическое ожидание (среднее значение) для стандартного нормального распределения равно нулю: μ = 0


Следующая статья - Распределение Пуассона.

© 2015-2017 - K-Tree.ru
Копия материалов, размещённых на данном сайте, допускается только по письменному разрешению владельцев сайта.
По любым вопросам Вы можете связаться по почте info@k-tree.ru