تعریف
یک ماتریس n×n که میزان موفقیت یک مدل دستهبندی در پیشبینی را طور مختصر نمایش میدهد. برای این کار همبستگی بین برچسبها و دستهبندیهای مدل بررسی میشود. یک محور ماتریس درهمریختگی برچسبهای پیشبینی شده توسط مدل است و محور دیگر برچسبهای واقعی. n بیانگر تعداد دستههاست. در یک مساله دستهبندی دوتایی n برابر ۲ است. به عنوان مثال، جدول زیر یک ماتریس درهمریختگی برای یک مساله دستهبندی دوتایی است.
غیر تومور (پیشبینی) | تومور (پیشبینی) | |
---|---|---|
۱ | ۱۸ | تومور (مقدار واقعی) |
۴۵۲ | ۶ | غیر تومور (مقدار واقعی) |
این ماتریس درهمریختگی نشان میدهد که مدل از میان ۱۹ نمونه که تومور داشتهاند، ۱۸ عدد را به درستی به عنوان تومور دستهبندی کرده است (۱۸ مثبت حقیقی (true positive)) و ۱ نمونه را به اشتباه در دسته بدون تومور قرار داده است (۱ منفی کاذب (false negative)). همچنین، مدل از ۴۵۸ نمونه که تومور نداشتهاند، ۴۵۲ عدد را به درستی دستهبندی کرده است (۴۵۲ منفی حقیقی (true negative)) و ۶ عدد را در دستههای اشتباه قرار داده است (۶ مثبت کاذب (false positive)).
ماتریس درهمریختگی میتواند به تشخیص الگوهای اشتباه در یک مساله دستهبندی چندتایی کمک کند. به عنوان مثال، ماتریس درهمریختگی میتواند آشکار کند که مدلی که برای تشخیص اعداد دستنویس آموزش دیده است، در تشخیص اعداد ۲ و ۳ اشتباه میکند.
ماتریس درهمریختگی اطلاعات کافی برای محاسبه برخی از معیارهای عملکرد را دارد، مانند دقت (precision) و یادآوری (recall).
آخرین ویرایش: ۱۶ مرداد ۱۳۹۹