Что такое машинное обучение простыми словами
- В общем и целом об искусственном интеллекте
- Machine learning ― что нужно, чтобы ИИ начал работать
- Классическое
- С подкреплением
- Глубинное обучение
Думаете, искусственный интеллект ― это что-то из фантастики и прогнозов учёных о будущем? Нет, это реальность. В статье мы поговорим о том, как учится искусственный интеллект и зачем нужно машинное обучение в современном мире.
В общем и целом об искусственном интеллекте
Мозг слишком сложен и во многом неизведан, но человек стремится создать что-то настолько же невероятное своими руками. Искусственный интеллект (ИИ) ― это попытка человечества создать себе помощника в рутинных или слишком сложных задачах.
На данный момент ИИ уже интегрирован в приложения, которые строят маршруты. Компьютер анализирует такие показатели, как расстояние, интенсивность трафика и проведение дорожных работ, чтобы найти самый быстрый маршрут до пункта назначения. Искусственный интеллект способен распознавать речь человека, чтобы запускать устройства. Вы в прямом смысле можете говорить со своим пылесосом или автомобилем, и он будет вас понимать. Кроме того, ИИ может распознавать не только сами слова, но и тон речи. Например, Яндекс.Станция способна различать детский и взрослый голоса и предлагать соответсвующий возрасту контент.
Чтобы ИИ работал корректно, он, как и человек, должен получать знания и нарабатывать навыки. Чтобы оптимизировать этот процесс, были разработаны методики машинного обучения, или machine learning.
Как работает машинное обучение
Задача машинного обучения ― дать достаточно информации, чтобы компьютер смог самостоятельно находить решения различных задач. Компьютер должен научиться анализировать информацию и определять закономерности быстрее людей с помощью алгоритмов.
Алгоритмы зависят от типа задачи, которую выполняет ИИ, и от количества данных. Как правило, чтобы научиться создавать правильные прогнозы, нужен большой объём данных и статистики.
Machine learning ― что нужно, чтобы ИИ начал работать
Как в педагогике есть множество программ для обучения детей, так и при обучении компьютеров используют несколько видов машинного обучения. Теория машинного обучения включает целый комплекс методов, однако мы рассмотрим основные и самые распространённые.
Классическое
Самый распространённый, простой и дешёвый метод обучения искусственного интеллекта. Таким способом, например, обучают алгоритмы для блока «Рекомендованные статьи» на сайте.
Классическое обучение бывает:
- с учителем,
- без учителя,
- с частичным привлечением учителя.
С учителем (supervised learning)
У машины есть учитель — реальный человек, который объясняет, что правильно, а что нет. Например, может рассказать, где на картинке птица, а где бабочка. Учитель заранее готовит для машины наглядное пособие для изучения мира. ИИ остаётся только усвоить материал и отработать его на примерах. Это самый быстрый и точный способ обучения машины.
Без учителя (unsupervised learning)
В этом случае на машину “обрушиваются” данные и она сама должна в них разобраться. Условно, ей показывают сотни тысяч фотографий птиц и бабочек. ИИ должен сам найти закономерности и классифицировать данные. Этот способ обучения долгий и не всегда точный. Однако он подходит в тех случаях, когда человек не может заранее предугадать закономерности.
Такой способ используют банковские системы, чтобы выявить мошенников. Искусственный интеллект замечает отклонение от привычной покупательской деятельности и сигнализирует об этом. Например, он заметит странность, если одну кредитную карту будут использовать в Англии, а уже через пару минут в Швеции.
Обучение с частичным привлечением учителя (semi-supervised learning)
В этом случае машина получает как уже структурированные человеком данные, так и набор неразмеченных данных. Задача ИИ ― опираясь на уже размеченные данные, исследовать остальную неструктурированную информацию. Это применяется в тех случаях, когда данных слишком много и человеку потребуется слишком много времени на работу. Такой метод распространён в медицине. Например, рентгенолог готовит для машины несколько снимков и отмечает на них опухоли. На основе этих данных машина разбирает другие снимки.
С подкреплением
Поместите робота в лабиринт и ждите, когда он из него выберется — так кратко можно описать метод обучения с подкреплением. Он используется там, где задача не анализировать данные, а выжить в реальной среде. Робота помещают в реальные ситуации, штрафуют за ошибки и награждают за правильные поступки. Задача ИИ в этом случае ― обобщить ситуацию и понять, как действовать максимально эффективно в похожих ситуациях или получить выгоду.
Обучение с подкреплением используют для самоуправляемых автомобилей, роботов-пылесосов, программ для управления ресурсами предприятий, а также для обучения персонажей в играх.
Для роботов-пылесосов и самоуправляемых автомобилей создают виртуальный город, населяют виртуальными пешеходами и отправляют учиться соблюдать правила. Как только у машины получается проехать маршрут без аварий, его отправляют в реальную среду.
Глубинное обучение
В основе глубинного обучения (deep Learning) лежат всем известные нейросети. При других методах обучения машина получает определенный набор данных, который нужно изучить и выявить закономерность. При глубинном обучении используется в разы больше данных и они сильно различаются по содержанию.
В заголовке мы обещали, что всё будет простыми словами, поэтому покажем работу нейросети на примере. Для начала вам нужно знать, что для работы с нейросетями используют 3 понятия:
1. Входной слой — данные, которые поступают в систему и которые она затем анализирует;
2. Скрытый слой или слои — здесь происходят математические вычисления. Когда данных очень много, появляется несколько слоёв;
3. Выходной слой — результат анализа и обработки.
Представим, что ИИ предсказывает цену на авиабилет. Для этого он использует 4 типа данных (входной слой):
- аэропорт вылета,
- аэропорт назначения,
- дата вылета,
- авиакомпания.
Они попадают в скрытый слой. Математическое преобразование основано на весе каждой единицы данных. Чем больше вес, тем важнее считается параметр, поэтому каждый из показателей сначала измеряется. В нашем случае самый важный параметр — дата вылета. Этот показатель будет иметь наибольший вес относительно других показателей. Как только все расчёты закончатся, пользователь получит прогноз цены перелёта.
Пример простой. В реальности у машины будет не 4 параметра, а сотни и тысячи. Например, данные о ценах на билеты из всех аэропортов за все предыдущие даты. Причём будут важны комбинации этих показателей.
Нейросети используют во многих системах. Например, при подборе музыки в приложениях. Любите включать плейлист, который предлагает композиции специально для вас, и считаете, что это просто маркетинговый ход? Это не так. Система действительно изучила ваши интересы, музыку, которую вы слушали в приложении до этого и, возможно, музыку ваших друзей. На основе этой информации программа собрала плейлист специально для вас.
Рассказать про машинное обучение за пару минут невозможно. Работа с данными и алгоритмами требует много знаний и практики. Однако, чтобы понять базовые принципы того, как работает машинное обучение, просто нужно начать изучать этот инструмент. Надеемся, что наша статья помогла вам в этом.