تعریف
در یادگیری تقویتی، شرایطی است که زمان پایان یک قسمت را تعیین میکنند بطور مثال زمانی که عامل به حالت خاصی میرسد یا از یک حد انتقال حالت گذر میکند. به عنوان مثال در tic-tac-toe بازی زمانی خاتمه مییابد که یک بازیکن سه فاصله متوالی را علامت گذاری میکند یا وقتی که تمام فاصلهها مشخص میشوند.
آخرین ویرایش: ۲۳ آبان ۱۳۹۹