Машинное обучение
Машинное обучение - это использование математических алгоритмов, с помощью которых компьютер получает возможность обучаться без непосредственных инструкций и вмешательств.
Касательно машинного обучения написано множество научных статей и ведётся активная работа по его изучению и развитию, оно считается одной из форм искусственного интеллекта. При машинном обучении с использованием математических данных выявляются закономерности, с помощью которых и происходит самообучение.
В данной статье мы попробуем с вами простым языком разобрать, что же из себя в действительности представляет машинное обучение, разберём вопрос без использования научных терминологий, но возьмём примеры реальных задач, и разберём их решение.
Цель машинного обучения
Основной целью машинного обучения является возможность предсказать ряд событий. На основании математических функций, определяется алгоритм с помощью которого делается вывод по тому или иному событию.
В качестве примера возьмём приобретение автомобиля. Мы можем самостоятельно изучить рынок, просмотреть объявления и сделать выводы касательно стоимости. К примеру, новый автомобиль стоит $20`000, автомобиль, которому год - стоит $19`000, которому два года - $18`000 и так далее.
На основании полученной информации мы выводим формулу, которая показывает, что начальная цена автомобиля $20`000, и каждый год уменьшается на $1000.
Такой анализ данных в машинном обучении называется регрессией – предсказывание события по известным данным. Но, как правило, в жизни существует гораздо больше неочевидных факторов, которые необходимо учитывать для того, чтобы составить корректный вывод и не допустить ошибок.
Для решения более сложных задач и были созданы роботы, которые с помощью математических функций и алгоритмов находят закономерности в полученных данных, и учатся предсказывать ответ. На основании проделанной работы были получены данные, которые показали, что существуют такие закономерности, о которых человек и не догадывается.
Таким образом, было создано машинное обучение.
Составляющие машинного обучения
Существуют три составляющие, с помощью которых предсказывается результат. Чем разнообразнее полученные данные, тем будет легче машине найти ряд закономерностей и получить более точный результат.
Разберем каждую составляющую по отдельности.
Сбор данных
Чтобы сделать вывод, в первую очередь нам необходимо собрать данные. Для определения спама нужны примеры спам-писем, для того, чтобы предсказать курс акций, будет нужно отразить историю цен, для того, чтобы проанализировать интересы человека, нужно получить данные о его действиях, к примеру, в социальных сетях. Чем больше данных, тем точнее результат. Тысячи примеров – это тот минимум, с помощью которого возможно сделать приблизительный вывод.
Данные собираются всевозможными вариантами. В некоторых случаях вносятся вручную, так получается дольше, при этом количество ошибок снижается. Либо автоматически, когда загружаются всевозможные данные, которые получилось найти с верой в то, что будет получен верный результат.
Например, компания Google анализирует данные своих пользователей для того, чтобы получать их бесплатно, по которым в дальнейшем и происходит анализ.
Получение достоверных и качественных данных - это задача номер один для крупных корпораций и компаний, которые в свою очередь лишь под редким предлогом раскрывают полученную информацию.
Признаки
Под признаками понимаются свойства и характеристики того или иного явления, предмета или человека. Это могут быть такие признаки как, пол пользователя, цена акций либо счетчик частоты появления слова в тексте. Всё перечисленное является признаком и на основании полученных признаков происходит анализ.
Машине необходимо знать, что нужно анализировать. Идеальный вариант машинного обучения – это когда данные лежат в табличках, есть их название и вся необходимая информация. В противном случае, когда признаков слишком много, модель начинает работать менее эффективно и медленнее. В связи с этим зачастую процесс отбора правильных признаков занимает больше времени, чем всё остальное обучение. Но бывают ситуации обратные, когда подключается человеческий фактор. Человек, основываясь на своих убеждениях и установках, сам начинает отбирать, по его мнению «правильные» признаки, тем самым вносит в модель субъективность, и в таком случае машина начинает врать.
Алгоритм
Зачастую одну и ту же задачу, возможно, решить разными методами. От выбора метода зависит точность, скорость работы и размер готовой модели. При этом есть один нюанс: в случае если данные были полученные некорректным путём, то даже самый лучший алгоритм не сможет справиться с задачей. Важно не зацикливание на процентах, а сбор большего количества данных.
Интеллект и обучение
Важно видеть и понимать разницу между искусственным интеллектом и машинным обучением.
Искусственный интеллект – это название, которое охватывает всю область науки. В которой уже и существуют такие разделы, как нейросети, машинное обучение, и т.д.
Машинное обучение в свою очередь – это раздел искусственного интеллекта. Он является важным элементом, но он не единственный.
Сравнивать искусственный интеллект и машинное обучение невозможно, это вещи, которые находятся на разных уровнях науки. Но мы можем сравнить, чего же на сегодняшний день получилось достичь в данной области, и посмотреть, что умеет машина.
Машина может | Машина не может |
---|---|
|
|
Мир машинного обучения.
Классифицировать алгоритмы возможно десятком разных способов. Не бывает, что ту или иную задачу решает только один метод.
В настоящее время в машинном обучении существует всего четыре основных направления:
Классическое обучение | Простые данные, понятные признаки |
Обучение с подкреплением | Данных нет, но есть среда, с которой можно взаимодействовать |
Ансамблевы методы | Данные есть, но их качество очень низкое |
Нейросети и глубокое обучение | Сложные данные, непонятные признаки |