Capítulo 03: Cómo el aprendizaje automático amplifica y puede corregir el sesgo

Capítulo 03: Cómo el aprendizaje automático amplifica y puede corregir el sesgo

Autores: Angel Zhang & Charlie Cao

Preguntaste: “¿Es el modelo el intermediario?” La respuesta es sí — y hay más de un modelo. Un sistema de contenido típico contiene como mínimo un modelo de representación, un modelo de clasificación y un modelo de retroalimentación.

3.1 Cómo los modelos amplían el sesgo

3.1.1 Sesgo de representación

Los datos de entrenamiento llevan sesgos históricos. Lo que el modelo aprende como “correcto” es solo “lo que fue más medido históricamente.”

Por ejemplo: busca imágenes de “CEO” y predominantemente verás hombres occidentales — no porque el modelo esté sesgado, sino porque eso es lo que los datos de entrenamiento reflejaban.

3.1.2 Amplificación del bucle de retroalimentación

Clics del usuario → Modelo aprende → Sistema sirve más de lo mismo → Más clics → Sesgo más fuerte

Este es un sistema de retroalimentación positiva. Una vez iniciado, el sesgo se auto-acelera.

3.2 Cómo los modelos pueden corregir el sesgo

3.2.1 Optimización restringida

Añade restricciones de equidad a la función objetivo:
“Mientras se maximiza la satisfacción del usuario, asegura que ningún grupo demográfico o punto de vista reciba menos del X% de exposición total.”

3.2.2 Mecanismos de exploración

Los sistemas de recomendación pueden deliberadamente mostrar contenido con “alta incertidumbre y baja exposición previa” para romper los límites de la burbuja.
Esta es la aplicación en el mundo real de estrategias ε-greedy o Thompson Sampling.

3.3 El modelo es la capa intermedia — el objetivo es el alma

$$\text{Matriz (espacio de estados)} \times \text{Función objetivo} = \text{Comportamiento del modelo}$$

Cambia el objetivo, y el modelo se entrena en un comportamiento completamente diferente.
Por eso la regulación debe actuar en la capa de función objetivo, no solo en la capa del modelo.

3.4 Resumen del capítulo

El aprendizaje automático no es una herramienta neutral. Es un amplificador de objetivos humanos.

Introduce un objetivo, y amplifica ese resultado a escala.

Esta es la alfabetización cognitiva básica que todos necesitamos — ahora.