الفصل الثالث: كيف يضخم التعلم الآلي التحيز وكيف يمكنه إصلاحه

المؤلفان: Angel Zhang & Charlie Cao

سألتَ: “هل النموذج هو الوسيط؟” الجواب نعم — وهناك أكثر من نموذج واحد. يحتوي نظام المحتوى النموذجي على ما لا يقل عن نموذج تمثيل، ونموذج ترتيب، ونموذج ردود فعل.

3.1 كيف تضخم النماذج التحيز

3.1.1 تحيز التمثيل

بيانات التدريب تحمل تحيزات تاريخية. ما يتعلمه النموذج على أنه “صحيح” هو فقط “ما تم قياسه أكثر تاريخيًا.”

مثلًا: ابحث عن صور “الرئيس التنفيذي” وستجد في الغالب رجالًا غربيين — ليس لأن النموذج متحيز، بل لأن ذلك ما كانت تعكسه بيانات التدريب.

3.1.2 تضخيم حلقة التغذية الراجعة

نقرات المستخدم → النموذج يتعلم → النظام يقدم المزيد من نفس الشيء → المزيد من النقرات → تحيز أقوى

هذا نظام تغذية راجعة إيجابية. بمجرد أن يبدأ، يتسارع التحيز من تلقاء نفسه.

3.2 كيف يمكن للنماذج إصلاح التحيز

3.2.1 التحسين المقيد

أضف قيود العدالة إلى دالة الهدف:
“مع تعظيم رضا المستخدم، تأكد من أن لا مجموعة ديموغرافية أو وجهة نظر تتلقى أقل من X% من إجمالي التعرض.”

3.2.2 آليات الاستكشاف

يمكن لأنظمة التوصية أن تعرض عمدًا محتوى ذا “عدم يقين عالٍ وتعرض سابق منخفض” لكسر حدود الفقاعة.
هذا هو التطبيق الواقعي لاستراتيجيات ε-greedy أو Thompson Sampling.

3.3 النموذج هو الطبقة الوسطى — والهدف هو الروح

$$\text{المصفوفة (فضاء الحالة)} \times \text{دالة الهدف} = \text{سلوك النموذج}$$

غيِّر الهدف، وسيتدرب النموذج على سلوك مختلف تمامًا.
لهذا السبب يجب أن تعمل التنظيمات على مستوى طبقة دالة الهدف، وليس فقط على مستوى طبقة النموذج.

3.4 ملخص الفصل

التعلم الآلي ليس أداة محايدة. إنه مضخم للأهداف البشرية.

أدخل هدفًا، وسيضخم تلك النتيجة على نطاق واسع.

هذه هي محو الأمية المعرفية الأساسية التي نحتاجها جميعًا — الآن.