E

حرف E

Letter E

کلمات توضیح
۱ Early Stopping

روشی برای نظم‌دهی (regularization) که شامل توقف آموزش مدل قبل از به پایان رسیدن کاهش مقدار تابع زیان آموزش است. در این روش، فرآیند آموزش زمانی متوقف می‌شود که تابع زیان روی داده‌های اعتبارسنجی افزایش...

۲ Embedding Space

فضای برداری d بعدی که ویژگی‌ها از فضای برداری با ابعاد بیشتر به آن نگاشت داده می‌شوند. در حالت ایده‌آل، فضای تعبیه شده شامل ساختاری است که به نتایج ریاضی معناداری منجر می‌شود. به عنوان مثال، در فضای...

۳ Embeddings

یک یک ویژگی طبقه‌بندی که به شکل یک ویژگی با مقادیر پیوسته ارائه شود. معمولا، هر تعبیه (‌embedding) نگاشتی از یک بردار در فضای با ابعاد بالا به فضایی با ابعادی کمتر است. به عنوان مثال، کلمه موجود در یک...

۴ Empirical Risk Minimization (ERM)

انتخاب تابعی که مقدار تابع زیان را بر روی داده‌های آموزش کمینه کند. متضاد: کمینه‌سازی ریسک ساختاری

۵ Ensemble

ادغام‌گر پیش‌بینی‌های چندین مدل. برای ایجاد یک گروه می‌توان از یکی یا چند تا از روش‌های زیر برای آموزش مدل استفاده کرد: مقداردهی‌های اولیه متفاوت هایپرپارامترهای متفاوت ساختار کلی متفاوت مدل‌های...

۶ Environment

در یادگیری تقویتی، دنیایی که شامل عامل است و به آن امکان مشاهده‌ی حالتش را می‌دهد. به عنوان مثال دنیای عامل می‌تواند یک بازی مانند شطرنج، یا یک دنیای فیزیکی مانند پیچ‌و‌خم باشد. با اقدام به عمل عامل،...

۷ Episode

در یادگیری تقویتی، هر یک از تلاش های مکرر عامل برای یادگیری یک محیط.

۸ Epoch

یک گذر کامل بر روی داده‌ها در فرآیند آموزش به گونه‌ای که هر نمونه یک بار مشاهده شده باشد. در این صورت یک دوره (epoch) شامل [ N / اندازه دسته ] تکرار (iteration) بر روی داده‌های آموزش است که N تعداد کل...

۹ Epsilon Greedy Policy

در یادگیری تقویتی (reinforcement learning) به سیاستی (policy) گفته می‌شود که با احتمال اپسیلون (epsilon) از یک سیاست تصادفی و در غیر این صورت از یک سیاست حریصانه پیروی کند. به عنوان مثال، اگر اپسیلون...

۱۰ Equality of Opportunity

یک معیار تساوی (fairness metric) که بررسی می‌کند به ازای یک برچسب ترجیحی (چیزی که سود یا امتیازی برای شخص به همراه داشته باشد) و یک صفت (attribute) مشخص، آیا طبقه‌بند (classifier) آن برچسب را برای...

۱۱ Equalized Odds

یک معیار تساوی (fairness metric) که بررسی می‌کند به ازای هر برچسب، آیا طبقه‌بند (classifier) آن را برای مقادیر مختلف یک صفت به صورت برابر پیش‌بینی می‌کند یا خیر. به عنوان مثال، تصور کنید دانشگاه...

۱۲ Example

یک سطر از مجموعه داده. یک نمونه شامل یک یا چند خصیصه و احتمالا یک برچسب است. اطلاعات بیشتر: نمونه برچسب‌ خورده، نمونه بدون برچسب

۱۳ Experience Replay

یک تکنیک مربوط به ‌DQN در یادگیری تقویتی که با هدف کاهش هم‌بستگی زمانی در مجموعه‌داده‌های آموزش استفاده می‌شود. عامل انتقال بین حالت‌ها را در یک بافر تکرار ذخیره می‌کند، و سپس با نمونه‌گیری از...

۱۴ Experimenter's Bias

سوگیری تاییدی (confirmation bias) را ببینید.

۱۵ Exploding Gradient Problem

تمایل گرادیان‌ها در یک شبکه عصبی عمیق (به‌خصوص شبکه‌های عصبی بازگشتی) برای پذیرفتن مقادیر بالا. گرادیان‌های بالا باعث به‌روزرسانی شدید در وزن‌ها در هر گره (node) در شبکه عصبی عمیق می‌شود. آموزش...