k-tree
Электронный учебник

Статистика

Статистика - это способ подсчёта, несколько иной, нежели математика. Что бы посчитать, сколько денег у нас в кармане - мы используем математику, мы складываем цифры на наших монетах и получаем сумму. А если мы рукой оценим примерный вес монет, а взглядом прикинем, сколько там может быть десяток и исходя из этого получим вероятную сумму - мы используем статистику. Статистика расскажет вам, как подчинить этот процесс "прикидывания".


I. Анализ данных


I.1. Нормальное распределение +57

Большинство процессов достаточно точно описывается нормальным распределением. Нормальное распределение используется и в химии, и в физике и во многих других областях науки

I.2. Распределение Пуассона +39

Когда мы оперируем величиной количество событий в интервал времени, например, три бутерброда в день, то мы используем распределение Пуассона

I.3. Закон распределения случайной величины +16

Как математически описать, что в среднем мы пьём две чашки чая в день? Что в июне, скорее всего, будет +20? Что расход бензина будет 8л/100км? Закон распределение - это математическая модель событий

I.4. Параметры дискретного закона распределения +24

Основные параметры закона распределения: среднее, квантиль, отклонение, доверительный интервал

I.5. Статистическая гипотеза +5

С вероятностью 30% молоко скиснет до завтра. А завтра нужно продать три чашки молока. Стоит ли мне покупать новую бутылку? А что если я не куплю, а молоко скиснет? Статистическая гипотеза даст ответ в цифрах

I.7. Нормальность распределения +6

Некоторые утверждения строятся исходя из предпосылки, что распределение нормально, а как узнать, насколько нормально реальное распределение?

I.8. Дисперсионный анализ +37

Бывает так, что мы проводим ряд экспериментов, но не можем найти закономерность. Почему чай то вкусный, то нет? ANOVA - метод поиска причины изменения результата. Это качество чая или моё настроение?

I.9. Корелляционный анализ +4

Есть ли связь между изменениями величин? Два числа изменяются, но что бы сделать вывод о линейной зависимости изменения - необходимо прибегнуть к корелляционному анализу

II. Прогнозирование


II.1. Линейная регрессия +11

Из статьи Вы узнаете основы регрессионного анализа: как выбирают регрессионную модель, какие регрессионные модели бывают и для чего вообще нужна эта модель. Также, какие методы определения качества модели используют

II.2. Анализ временных рядов +52

На что можно разбить график роста посетителей? На сезонность, тренд и шум - три основных показателя временного ряда. Выделение компонентов позволяет анализировать влияние различных факторов, например, погоды

II.3. Метод Монте-Карло +7

Первый шаг - выдвинуть гипотезу, второй шаг - симуляция процессов и получение статистического обоснования. Метод Монте-Карло проводит испытания на основе гипотезы и отвечает на вопрос: провалится гипотеза или она верна