Обсуждение:Обучение с подкреплением на основе отзывов людей
![]() | Эта статья содержит текст, переведённый из статьи Reinforcement learning from human feedback из раздела Википедии на английском языке. Список авторов находится на странице истории правок оригинальной статьи. Информация о включении текстов из других источников и их авторах может быть размещена на странице обсуждения оригинальной статьи. |