Лучшим примером этого является

hasinam2206 · Post by **hasinam2206** » Sat Feb 01, 2025 7:20 am

такая игра, как шахматы, где очки набираются за несколько ходов.

Для лучшего понимания процесса обучения с подкреплением вы можете обратиться к этой статье об обучении с подкреплением .

Контролируемое обучение против обучения что такое gcash с подкреплением - источник изображения - sfl scientific
Контролируемое обучение против обучения с подкреплением
Понимание контролируемого обучения
Контролируемое обучение технически означает обучение функции, которая выдает выходной сигнал для заданного входного сигнала на основе набора определенных пар вход-выход.

Это делается с помощью так называемых «обучающих данных», которые состоят из набора обучающих примеров.

В нашем предыдущем примере изображение обуви и название «обувь» являются входными и выходными данными соответственно.

После изучения сотен или тысяч различных изображений обуви и названия «туфли», а также носков, когда нашей системе даются только входные данные (новое изображение обуви), она выдает выходные данные (название: обувь).

Часто для представления контролируемого МО используется функция y = f(x), где «x» — входные данные, а «y» — выходная переменная, функция «x», которую необходимо предсказать.

В любых обучающих данных пара примеров обычно состоит из входных данных, которые обычно представляют собой вектор (набор признаков, определяющих выборку).