Глубокое обучение с подкреплением вводит квантовую систему в «состояние кота Шредингера»

Обучением с подкреплением называют один из методов машинного обучения, при котором алгоритм обучается, взаимодействуя со средой и получая обратную связь. Значит, в каждом цикле обучения алгоритм как-то воздействует на состояние квантовой системы, а затем узнает, что из этого вышло.