-
I. Анализ данных
-
II. Прогнозирование
Статистика
Статистика - это способ подсчёта, несколько иной, нежели математика. Что бы посчитать, сколько денег у нас в кармане - мы используем математику, мы складываем цифры на наших монетах и получаем сумму. А если мы рукой оценим примерный вес монет, а взглядом прикинем, сколько там может быть десяток и исходя из этого получим вероятную сумму -
мы используем статистику. Статистика расскажет вам, как подчинить этот процесс "прикидывания".
Большинство процессов достаточно точно описывается нормальным распределением. Нормальное распределение используется и в химии, и в физике и во многих других областях науки
Когда мы оперируем величиной количество событий в интервал времени, например, три бутерброда в день, то мы используем распределение Пуассона
Как математически описать, что в среднем мы пьём две чашки чая в день? Что в июне, скорее всего, будет +20? Что расход бензина будет 8л/100км? Закон распределение - это математическая модель событий
Основные параметры закона распределения: среднее, квантиль, отклонение, доверительный интервал
С вероятностью 30% молоко скиснет до завтра. А завтра нужно продать три чашки молока. Стоит ли мне покупать новую бутылку? А что если я не куплю, а молоко скиснет? Статистическая гипотеза даст ответ в цифрах
Некоторые утверждения строятся исходя из предпосылки, что распределение нормально, а как узнать, насколько нормально реальное распределение?
Бывает так, что мы проводим ряд экспериментов, но не можем найти закономерность. Почему чай то вкусный, то нет? ANOVA - метод поиска причины изменения результата. Это качество чая или моё настроение?
Есть ли связь между изменениями величин? Два числа изменяются, но что бы сделать вывод о линейной зависимости изменения - необходимо прибегнуть к корелляционному анализу
Из статьи Вы узнаете основы регрессионного анализа: как выбирают регрессионную модель, какие регрессионные модели бывают и для чего вообще нужна эта модель. Также, какие методы определения качества модели используют
На что можно разбить график роста посетителей? На сезонность, тренд и шум - три основных показателя временного ряда. Выделение компонентов позволяет анализировать влияние различных факторов, например, погоды
Первый шаг - выдвинуть гипотезу, второй шаг - симуляция процессов и получение статистического обоснования. Метод Монте-Карло проводит испытания на основе гипотезы и отвечает на вопрос: провалится гипотеза или она верна