تعریف
این واقعیت که فراوانی نوشتن افراد درباره اعمال، نتایج یا ویژگیها بازتابی از فراوانی آنها در دنیای واقعی یا میزانی که یک ویژگی در اعضای یک دسته مشخص است، نیست. سوگیری گزارش میتواند بر ترکیب دادههایی که سیستمهای یادگیری ماشین از آنها میآموزند تاثیر بگذارد.
به عنوان مثال، در کتابها کلمه «خندید» بیشتر از «نفس کشید» تکرار میشود. یک مدل یادگیری ماشین که تعداد نسبی خنده و تنفس را از یک مجموعه کتاب برآورد میکند، احتمالاً تصور میکند که خندیدن بیشتر از نفس کشیدن رایج است.
آخرین ویرایش: ۵ شهریور ۱۴۰۰