تعریف
در یادگیری تقویتی دنبالهای از چندتاییها(tuples) که نمایانگر توالی انتقال حالت عامل هستند، طوری که هر چندتایی مربوط به حالت، عمل، پاداش و حالت بعدی برای یک انتقال حالت معین است.
آخرین ویرایش: ۵ آذر ۱۳۹۹
در یادگیری تقویتی دنبالهای از چندتاییها(tuples) که نمایانگر توالی انتقال حالت عامل هستند، طوری که هر چندتایی مربوط به حالت، عمل، پاداش و حالت بعدی برای یک انتقال حالت معین است.
آخرین ویرایش: ۵ آذر ۱۳۹۹