Машинное обучение

Машинное обучение - это использование математических алгоритмов, с помощью которых компьютер получает возможность обучаться без непосредственных инструкций и вмешательств.

Касательно машинного обучения написано множество научных статей и ведётся активная работа по его изучению и развитию, оно считается одной из форм искусственного интеллекта. При машинном обучении с использованием математических данных выявляются закономерности, с помощью которых и происходит самообучение.

В данной статье мы попробуем с вами простым языком разобрать, что же из себя в действительности представляет машинное обучение, разберём вопрос без использования научных терминологий, но возьмём примеры реальных задач, и разберём их решение.

Цель машинного обучения

Основной целью машинного обучения является возможность предсказать ряд событий. На основании математических функций, определяется алгоритм с помощью которого делается вывод по тому или иному событию.

В качестве примера возьмём приобретение автомобиля. Мы можем самостоятельно изучить рынок, просмотреть объявления и сделать выводы касательно стоимости. К примеру, новый автомобиль стоит $20`000, автомобиль, которому год - стоит $19`000, которому два года - $18`000 и так далее.

На основании полученной информации мы выводим формулу, которая показывает, что начальная цена автомобиля $20`000, и каждый год уменьшается на $1000.

Такой анализ данных в машинном обучении называется регрессией – предсказывание события по известным данным. Но, как правило, в жизни существует гораздо больше неочевидных факторов, которые необходимо учитывать для того, чтобы составить корректный вывод и не допустить ошибок.

Для решения более сложных задач и были созданы роботы, которые с помощью математических функций и алгоритмов находят закономерности в полученных данных, и учатся предсказывать ответ. На основании проделанной работы были получены данные, которые показали, что существуют такие закономерности, о которых человек и не догадывается.

Таким образом, было создано машинное обучение.

Составляющие машинного обучения

Существуют три составляющие, с помощью которых предсказывается результат. Чем разнообразнее полученные данные, тем будет легче машине найти ряд закономерностей и получить более точный результат.

Разберем каждую составляющую по отдельности.

Сбор данных

Чтобы сделать вывод, в первую очередь нам необходимо собрать данные. Для определения спама нужны примеры спам-писем, для того, чтобы предсказать курс акций, будет нужно отразить историю цен, для того, чтобы проанализировать интересы человека, нужно получить данные о его действиях, к примеру, в социальных сетях. Чем больше данных, тем точнее результат. Тысячи примеров – это тот минимум, с помощью которого возможно сделать приблизительный вывод.

Данные собираются всевозможными вариантами. В некоторых случаях вносятся вручную, так получается дольше, при этом количество ошибок снижается. Либо автоматически, когда загружаются всевозможные данные, которые получилось найти с верой в то, что будет получен верный результат.

Например, компания Google анализирует данные своих пользователей для того, чтобы получать их бесплатно, по которым в дальнейшем и происходит анализ.

Получение достоверных и качественных данных - это задача номер один для крупных корпораций и компаний, которые в свою очередь лишь под редким предлогом раскрывают полученную информацию.

Признаки

Под признаками понимаются свойства и характеристики того или иного явления, предмета или человека. Это могут быть такие признаки как, пол пользователя, цена акций либо счетчик частоты появления слова в тексте. Всё перечисленное является признаком и на основании полученных признаков происходит анализ.

Машине необходимо знать, что нужно анализировать. Идеальный вариант машинного обучения – это когда данные лежат в табличках, есть их название и вся необходимая информация. В противном случае, когда признаков слишком много, модель начинает работать менее эффективно и медленнее. В связи с этим зачастую процесс отбора правильных признаков занимает больше времени, чем всё остальное обучение. Но бывают ситуации обратные, когда подключается человеческий фактор. Человек, основываясь на своих убеждениях и установках, сам начинает отбирать, по его мнению «правильные» признаки, тем самым вносит в модель субъективность, и в таком случае машина начинает врать.

Алгоритм

Зачастую одну и ту же задачу, возможно, решить разными методами. От выбора метода зависит точность, скорость работы и размер готовой модели. При этом есть один нюанс: в случае если данные были полученные некорректным путём, то даже самый лучший алгоритм не сможет справиться с задачей. Важно не зацикливание на процентах, а сбор большего количества данных.

Интеллект и обучение

Важно видеть и понимать разницу между искусственным интеллектом и машинным обучением.

Искусственный интеллект – это название, которое охватывает всю область науки. В которой уже и существуют такие разделы, как нейросети, машинное обучение, и т.д.

Машинное обучение в свою очередь – это раздел искусственного интеллекта. Он является важным элементом, но он не единственный.

Сравнивать искусственный интеллект и машинное обучение невозможно, это вещи, которые находятся на разных уровнях науки. Но мы можем сравнить, чего же на сегодняшний день получилось достичь в данной области, и посмотреть, что умеет машина.

Машина может	Машина не может
Предсказывать Запоминать Воспроизводить Выбирать лучшее	Создавать новое Резко поумнеть Выйти за рамки задачи

Мир машинного обучения.

Классифицировать алгоритмы возможно десятком разных способов. Не бывает, что ту или иную задачу решает только один метод.

В настоящее время в машинном обучении существует всего четыре основных направления:

Классическое обучение	Простые данные, понятные признаки
Обучение с подкреплением	Данных нет, но есть среда, с которой можно взаимодействовать
Ансамблевы методы	Данные есть, но их качество очень низкое
Нейросети и глубокое обучение	Сложные данные, непонятные признаки

Вам понравилась статья? /

Seen: 3 434

Рейтинг: 5 (4 голоса)

Читать следующую
Классическое обучение