کلمات | توضیح | |
---|---|---|
۱ | Early Stopping |
روشی برای نظمدهی (regularization) که شامل توقف آموزش مدل قبل از به پایان رسیدن کاهش مقدار تابع زیان آموزش است. در این روش، فرآیند آموزش زمانی متوقف میشود که تابع زیان روی دادههای اعتبارسنجی افزایش... |
۲ | Embedding Space |
فضای برداری d بعدی که ویژگیها از فضای برداری با ابعاد بیشتر به آن نگاشت داده میشوند. در حالت ایدهآل، فضای تعبیه شده شامل ساختاری است که به نتایج ریاضی معناداری منجر میشود. به عنوان مثال، در فضای... |
۳ | Embeddings |
یک یک ویژگی طبقهبندی که به شکل یک ویژگی با مقادیر پیوسته ارائه شود. معمولا، هر تعبیه (embedding) نگاشتی از یک بردار در فضای با ابعاد بالا به فضایی با ابعادی کمتر است. به عنوان مثال، کلمه موجود در یک... |
۴ | Empirical Risk Minimization (ERM) |
انتخاب تابعی که مقدار تابع زیان را بر روی دادههای آموزش کمینه کند. متضاد: کمینهسازی ریسک ساختاری |
۵ | Ensemble |
ادغامگر پیشبینیهای چندین مدل. برای ایجاد یک گروه میتوان از یکی یا چند تا از روشهای زیر برای آموزش مدل استفاده کرد: مقداردهیهای اولیه متفاوت هایپرپارامترهای متفاوت ساختار کلی متفاوت مدلهای... |
۶ | Environment |
در یادگیری تقویتی، دنیایی که شامل عامل است و به آن امکان مشاهدهی حالتش را میدهد. به عنوان مثال دنیای عامل میتواند یک بازی مانند شطرنج، یا یک دنیای فیزیکی مانند پیچوخم باشد. با اقدام به عمل عامل،... |
۷ | Episode |
در یادگیری تقویتی، هر یک از تلاش های مکرر عامل برای یادگیری یک محیط. |
۸ | Epoch |
یک گذر کامل بر روی دادهها در فرآیند آموزش به گونهای که هر نمونه یک بار مشاهده شده باشد. در این صورت یک دوره (epoch) شامل [ N / اندازه دسته ] تکرار (iteration) بر روی دادههای آموزش است که N تعداد کل... |
۹ | Epsilon Greedy Policy |
در یادگیری تقویتی (reinforcement learning) به سیاستی (policy) گفته میشود که با احتمال اپسیلون (epsilon) از یک سیاست تصادفی و در غیر این صورت از یک سیاست حریصانه پیروی کند. به عنوان مثال، اگر اپسیلون... |
۱۰ | Equality of Opportunity |
یک معیار تساوی (fairness metric) که بررسی میکند به ازای یک برچسب ترجیحی (چیزی که سود یا امتیازی برای شخص به همراه داشته باشد) و یک صفت (attribute) مشخص، آیا طبقهبند (classifier) آن برچسب را برای... |
۱۱ | Equalized Odds |
یک معیار تساوی (fairness metric) که بررسی میکند به ازای هر برچسب، آیا طبقهبند (classifier) آن را برای مقادیر مختلف یک صفت به صورت برابر پیشبینی میکند یا خیر. به عنوان مثال، تصور کنید دانشگاه... |
۱۲ | Example |
یک سطر از مجموعه داده. یک نمونه شامل یک یا چند خصیصه و احتمالا یک برچسب است. اطلاعات بیشتر: نمونه برچسب خورده، نمونه بدون برچسب |
۱۳ | Experience Replay |
یک تکنیک مربوط به DQN در یادگیری تقویتی که با هدف کاهش همبستگی زمانی در مجموعهدادههای آموزش استفاده میشود. عامل انتقال بین حالتها را در یک بافر تکرار ذخیره میکند، و سپس با نمونهگیری از... |
۱۴ | Experimenter's Bias |
سوگیری تاییدی (confirmation bias) را ببینید. |
۱۵ | Exploding Gradient Problem |
تمایل گرادیانها در یک شبکه عصبی عمیق (بهخصوص شبکههای عصبی بازگشتی) برای پذیرفتن مقادیر بالا. گرادیانهای بالا باعث بهروزرسانی شدید در وزنها در هر گره (node) در شبکه عصبی عمیق میشود. آموزش... |