k-tree
Электронный учебник

Машинное обучение

Машинное обучение - это использование математических алгоритмов, с помощью которых компьютер получает возможность обучаться без непосредственных инструкций и вмешательств.

Касательно машинного обучения написано множество научных статей и ведётся активная работа по его изучению и развитию, оно считается одной из форм искусственного интеллекта. При машинном обучении с использованием математических данных выявляются закономерности, с помощью которых и происходит самообучение.

В данной статье мы попробуем с вами простым языком разобрать, что же из себя в действительности представляет машинное обучение, разберём вопрос без использования научных терминологий, но возьмём примеры реальных задач, и разберём их решение.

Цель машинного обучения

Основной целью машинного обучения является возможность предсказать ряд событий. На основании математических функций, определяется алгоритм с помощью которого делается вывод по тому или иному событию.

В качестве примера возьмём приобретение автомобиля. Мы можем самостоятельно изучить рынок, просмотреть объявления и сделать выводы касательно стоимости. К примеру, новый автомобиль стоит $20`000, автомобиль, которому год - стоит $19`000, которому два года - $18`000 и так далее.

На основании полученной информации мы выводим формулу, которая показывает, что начальная цена автомобиля $20`000, и каждый год уменьшается на $1000.

Такой анализ данных в машинном обучении называется регрессией – предсказывание события по известным данным. Но, как правило, в жизни существует гораздо больше неочевидных факторов, которые необходимо учитывать для того, чтобы составить корректный вывод и не допустить ошибок.

Для решения более сложных задач и были созданы роботы, которые с помощью математических функций и алгоритмов находят закономерности в полученных данных, и учатся предсказывать ответ. На основании проделанной работы были получены данные, которые показали, что существуют такие закономерности, о которых человек и не догадывается.

Таким образом, было создано машинное обучение.

Составляющие машинного обучения

Существуют три составляющие, с помощью которых предсказывается результат. Чем разнообразнее полученные данные, тем будет легче машине найти ряд закономерностей и получить более точный результат.

Разберем каждую составляющую по отдельности.

Сбор данных

Чтобы сделать вывод, в первую очередь нам необходимо собрать данные. Для определения спама нужны примеры спам-писем, для того, чтобы предсказать курс акций, будет нужно отразить историю цен, для того, чтобы проанализировать интересы человека, нужно получить данные о его действиях, к примеру, в социальных сетях. Чем больше данных, тем точнее результат. Тысячи примеров – это тот минимум, с помощью которого возможно сделать приблизительный вывод.

Данные собираются всевозможными вариантами. В некоторых случаях вносятся вручную, так получается дольше, при этом количество ошибок снижается. Либо автоматически, когда загружаются всевозможные данные, которые получилось найти с верой в то, что будет получен верный результат.

Например, компания Google анализирует данные своих пользователей для того, чтобы получать их бесплатно, по которым в дальнейшем и происходит анализ.

Получение достоверных и качественных данных - это задача номер один для крупных корпораций и компаний, которые в свою очередь лишь под редким предлогом раскрывают полученную информацию.

Признаки

Под признаками понимаются свойства и характеристики того или иного явления, предмета или человека. Это могут быть такие признаки как, пол пользователя, цена акций либо счетчик частоты появления слова в тексте. Всё перечисленное является признаком и на основании полученных признаков происходит анализ.

Машине необходимо знать, что нужно анализировать. Идеальный вариант машинного обучения – это когда данные лежат в табличках, есть их название и вся необходимая информация. В противном случае, когда признаков слишком много, модель начинает работать менее эффективно и медленнее. В связи с этим зачастую процесс отбора правильных признаков занимает больше времени, чем всё остальное обучение. Но бывают ситуации обратные, когда подключается человеческий фактор. Человек, основываясь на своих убеждениях и установках, сам начинает отбирать, по его мнению «правильные» признаки, тем самым вносит в модель субъективность, и в таком случае машина начинает врать.

Алгоритм

Зачастую одну и ту же задачу, возможно, решить разными методами. От выбора метода зависит точность, скорость работы и размер готовой модели. При этом есть один нюанс: в случае если данные были полученные некорректным путём, то даже самый лучший алгоритм не сможет справиться с задачей. Важно не зацикливание на процентах, а сбор большего количества данных.

Интеллект и обучение

Важно видеть и понимать разницу между искусственным интеллектом и машинным обучением.

Искусственный интеллект – это название, которое охватывает всю область науки. В которой уже и существуют такие разделы, как нейросети, машинное обучение, и т.д.
Машинное обучение в свою очередь – это раздел искусственного интеллекта. Он является важным элементом, но он не единственный.

Сравнивать искусственный интеллект и машинное обучение невозможно, это вещи, которые находятся на разных уровнях науки. Но мы можем сравнить, чего же на сегодняшний день получилось достичь в данной области, и посмотреть, что умеет машина.

Машина может Машина не может
  • Предсказывать
  • Запоминать
  • Воспроизводить
  • Выбирать лучшее
  • Создавать новое
  • Резко поумнеть
  • Выйти за рамки задачи

Мир машинного обучения.

Классифицировать алгоритмы возможно десятком разных способов. Не бывает, что ту или иную задачу решает только один метод.

В настоящее время в машинном обучении существует всего четыре основных направления:

Классическое обучение Простые данные, понятные признаки
Обучение с подкреплением Данных нет, но есть среда, с которой можно взаимодействовать
Ансамблевы методы Данные есть, но их качество очень низкое
Нейросети и глубокое обучение Сложные данные, непонятные признаки

Вам понравилась статья? /

Просмотров: 104