такая игра, как шахматы, где очки набираются за несколько ходов.
Для лучшего понимания процесса обучения с подкреплением вы можете обратиться к этой статье об обучении с подкреплением .
Контролируемое обучение против обучения что такое gcash с подкреплением - источник изображения - sfl scientific
Контролируемое обучение против обучения с подкреплением
Понимание контролируемого обучения
Контролируемое обучение технически означает обучение функции, которая выдает выходной сигнал для заданного входного сигнала на основе набора определенных пар вход-выход.
Это делается с помощью так называемых «обучающих данных», которые состоят из набора обучающих примеров.
В нашем предыдущем примере изображение обуви и название «обувь» являются входными и выходными данными соответственно.
После изучения сотен или тысяч различных изображений обуви и названия «туфли», а также носков, когда нашей системе даются только входные данные (новое изображение обуви), она выдает выходные данные (название: обувь).
Часто для представления контролируемого МО используется функция y = f(x), где «x» — входные данные, а «y» — выходная переменная, функция «x», которую необходимо предсказать.
В любых обучающих данных пара примеров обычно состоит из входных данных, которые обычно представляют собой вектор (набор признаков, определяющих выборку).
Лучшим примером этого является
-
- Posts: 364
- Joined: Mon Dec 23, 2024 2:46 am