Chapitre 03 : Comment l’apprentissage automatique amplifie et peut corriger les biais

Auteurs : Angel Zhang & Charlie Cao

Vous avez demandé : “Le modèle est-il l’intermédiaire ?” La réponse est oui — et il y en a plus d’un. Un système de contenu typique contient au minimum un modèle de représentation, un modèle de classement et un modèle de rétroaction.

3.1 Comment les modèles amplifient les biais

3.1.1 Biais de représentation

Les données d’entraînement portent des biais historiques. Ce que le modèle apprend comme “correct” n’est que “ce qui a été le plus mesuré historiquement.”

Par exemple : cherchez des images de “PDG” et vous verrez principalement des hommes occidentaux — non pas parce que le modèle est biaisé, mais parce que c’est ce que les données d’entraînement reflétaient.

3.1.2 Amplification de la boucle de rétroaction

Clics des utilisateurs → Le modèle apprend → Le système sert plus du même → Plus de clics → Biais plus fort

C’est un système de rétroaction positive. Une fois lancé, le biais s’auto-accélère.

3.2 Comment les modèles peuvent corriger les biais

3.2.1 Optimisation sous contraintes

Ajoutez des contraintes d’équité à la fonction objectif :
“Tout en maximisant la satisfaction des utilisateurs, assurez-vous qu’aucun groupe démographique ou point de vue ne reçoive moins de X% de l’exposition totale.”

3.2.2 Mécanismes d’exploration

Les systèmes de recommandation peuvent délibérément proposer du contenu avec “une haute incertitude et une faible exposition antérieure” pour briser les frontières des bulles.
C’est l’application réelle des stratégies ε-greedy ou du Thompson Sampling.

3.3 Le modèle est la couche intermédiaire — l’objectif est l’âme

$$\text{Matrice (espace d’états)} \times \text{Fonction objectif} = \text{Comportement du modèle}$$

Changez l’objectif, et le modèle s’entraîne vers un comportement complètement différent.
C’est pourquoi la régulation doit agir au niveau de la fonction objectif, pas seulement au niveau du modèle.

3.4 Résumé du chapitre

L’apprentissage automatique n’est pas un outil neutre. C’est un amplificateur d’objectifs humains.

Introduisez un objectif, et il amplifie ce résultat à grande échelle.

C’est la culture cognitive de base dont nous avons tous besoin — maintenant.

Chapitre 03 : Comment l'apprentissage automatique amplifie et peut corriger les biais