Capítulo 03: Como o aprendizado de máquina amplifica e pode corrigir o viés

Capítulo 03: Como o aprendizado de máquina amplifica e pode corrigir o viés

Autores: Angel Zhang & Charlie Cao

Você perguntou: “O modelo é o intermediário?” A resposta é sim — e há mais de um modelo. Um sistema de conteúdo típico contém no mínimo um modelo de representação, um modelo de classificação e um modelo de retroalimentação.

3.1 Como os modelos ampliam o viés

3.1.1 Viés de representação

Os dados de treinamento carregam vieses históricos. O que o modelo aprende como “correto” é apenas “o que foi mais medido historicamente.”

Por exemplo: pesquise imagens de “CEO” e verá predominantemente homens ocidentais — não porque o modelo está enviesado, mas porque é isso que os dados de treinamento refletiam.

3.1.2 Amplificação do ciclo de retroalimentação

Cliques do usuário → Modelo aprende → Sistema serve mais do mesmo → Mais cliques → Viés mais forte

Este é um sistema de retroalimentação positiva. Uma vez iniciado, o viés se auto-acelera.

3.2 Como os modelos podem corrigir o viés

3.2.1 Otimização restrita

Adicione restrições de equidade à função objetivo:
“Enquanto maximiza a satisfação do usuário, garanta que nenhum grupo demográfico ou ponto de vista receba menos de X% da exposição total.”

3.2.2 Mecanismos de exploração

Os sistemas de recomendação podem deliberadamente surfaçar conteúdo com “alta incerteza e baixa exposição anterior” para quebrar os limites da bolha.
Esta é a aplicação no mundo real de estratégias ε-greedy ou Thompson Sampling.

3.3 O modelo é a camada intermediária — o objetivo é a alma

$$\text{Matriz (espaço de estados)} \times \text{Função objetivo} = \text{Comportamento do modelo}$$

Mude o objetivo, e o modelo treina em um comportamento completamente diferente.
É por isso que a regulação deve atuar na camada da função objetivo, não apenas na camada do modelo.

3.4 Resumo do capítulo

O aprendizado de máquina não é uma ferramenta neutra. É um amplificador de objetivos humanos.

Insira um objetivo, e ele amplifica esse resultado em escala.

Esta é a alfabetização cognitiva básica que todos precisamos — agora.