Новый алгоритм учит другой алгоритм, как играть в Pac-Man

Учёный из Вашингтонского университета создал алгоритм, который способен обучать другой алгоритм. Для демонстрации того, как это работает, он продемонстрировал компьютер, который играет в Pac-Man, в то время как другой компьютер обучает его, как играть лучше.

Этот метод разработал доктор Мэтью Тейлор. Грубо говоря, он позволяет компьютеру-«учителю» давать советы компьютеру-«ученику». Основной смысл метода заключается в том, что обучающий алгоритм тонко регулирует выдачу указаний — ведь если давать их слишком часто, то «ученик» ничего не запомнит, а если советов будет мало, то процесс обучения слишком затянется.

Как говорит Тейлор, такой подход позволил обучающейся машине достичь уровня обучающей, но и превзойти его. Зачем это нужно? В будущем машинное обучение, например, поможет старым фабричным роботам передать свой опыт новым, причём быстро. Целью же Тейлора является создание машин, которые смогут обучать человека.

Что будем искать? Например,ChatGPT

Мы в социальных сетях