تعریف
در یادگیری Q ، یک شبکهی عصبی عمیق است که توابع Q را پیشبینی میکند.
میتوان گفت نقاد (Critic) مترادفی برای شبکهی عمیق Q است.
آخرین ویرایش: ۲۶ مرداد ۱۳۹۹
در یادگیری Q ، یک شبکهی عصبی عمیق است که توابع Q را پیشبینی میکند.
میتوان گفت نقاد (Critic) مترادفی برای شبکهی عمیق Q است.
آخرین ویرایش: ۲۶ مرداد ۱۳۹۹