Итак, мы, люди, постепенно добиваемся того, чтобы структурно интеллект искусственный все больше походил на человеческий. В вопросах обучения машинного мы, недолго думая, пошли тем же путем. Дети, как правило, учатся у своих родителей и учителей через высоко структурированную информацию. Взрослые же особи человека разумного, как правило, хорошо приспособлены к тому, чтобы искать свои собственные каналы информации. Аналогичным образом, системы ИИ используют контролируемое, неконтролируемое и подкрепляющее обучение, чтобы воспринимать и обрабатывать информацию об окружающем мире.
Контролируемое обучение (или «обучение с учителем») — это такое обучение, которое происходит, когда система искусственного интеллекта напрямую информируется людьми. Например, врач, который оценивает рентгеновские снимки для выявления риска возникновения рака, может аннотировать изображения с помощью своего экспертного мнения, а затем вводить его в систему искусственного интеллекта, чтобы облегчить контролируемое обучение. Другим примером контролируемого обучения является случай, когда система ИИ сортирует рентгеновские изображения, чтобы врач мог их рассмотреть и одобрить. В результате ИИ-система постоянно улучшается.
Обучение без присмотра (неконтролируемое) происходит, когда ИИ-система способна идентифицировать кластеры или измерения в самих данных без дополнительных указаний от человека. Этот метод обучения иногда приводит к совершенно неожиданным результатам. Ярким примером неконтролируемого обучения служит то, как YouTube в 2014 году смог распознать кошачьи мордочки просто по загруженным в него десяти миллионам видео «котиков».
Обучение с подкреплением происходит, когда системе ИИ поручено не только обрабатывать доступные входные данные, но также изучать «правила игры». Человек не влияет на такую систему. Вместо этого она сама воздействует на окружающую среду и черпает обучающие данные из соответствующих откликов. Аналогом обучения с подкреплением является то, как младенцы изначально учатся ходить: сначала они наблюдают за окружающими, пока не обнаружат способность попробовать сделать первый свой шаг. Затем они много раз безуспешно пытаются ходить самостоятельно, но каждый раз улучшают свои способности, пока не научатся перемещаться на двух ножках без посторонней помощи. Ровно таким же образом машина AlphaGo использовала методы обучения с подкреплением, поглощая большое количество завершенных и идущих в момент обучения партий Го, чтобы одновременно выяснить, каковы правила этой игры, как нужно играть и побеждать любого конкурента.
В настоящее время существует множество
фреймворков для различных типов машинного обучения, каждый из которых обладает своими собственными функциональными возможностями глубокого обучения, основанными на нейронных сетях. Исследователи данных и разработчики программного обеспечения вольны выбирать из всего этого многообразия инструментов именно те, которые лучше всего подходят для решения стоящих перед ними задач.