Capítulo 03: Como o aprendizado de máquina amplifica e pode corrigir o viés
Capítulo 03: Como o aprendizado de máquina amplifica e pode corrigir o viés
Autores: Angel Zhang & Charlie Cao
Você perguntou: “O modelo é o intermediário?” A resposta é sim — e há mais de um modelo. Um sistema de conteúdo típico contém no mínimo um modelo de representação, um modelo de classificação e um modelo de retroalimentação.
3.1 Como os modelos ampliam o viés
3.1.1 Viés de representação
Os dados de treinamento carregam vieses históricos. O que o modelo aprende como “correto” é apenas “o que foi mais medido historicamente.”
Por exemplo: pesquise imagens de “CEO” e verá predominantemente homens ocidentais — não porque o modelo está enviesado, mas porque é isso que os dados de treinamento refletiam.
3.1.2 Amplificação do ciclo de retroalimentação
Cliques do usuário → Modelo aprende → Sistema serve mais do mesmo → Mais cliques → Viés mais forte
Este é um sistema de retroalimentação positiva. Uma vez iniciado, o viés se auto-acelera.
3.2 Como os modelos podem corrigir o viés
3.2.1 Otimização restrita
Adicione restrições de equidade à função objetivo:
“Enquanto maximiza a satisfação do usuário, garanta que nenhum grupo demográfico ou ponto de vista receba menos de X% da exposição total.”
3.2.2 Mecanismos de exploração
Os sistemas de recomendação podem deliberadamente surfaçar conteúdo com “alta incerteza e baixa exposição anterior” para quebrar os limites da bolha.
Esta é a aplicação no mundo real de estratégias ε-greedy ou Thompson Sampling.
3.3 O modelo é a camada intermediária — o objetivo é a alma
$$\text{Matriz (espaço de estados)} \times \text{Função objetivo} = \text{Comportamento do modelo}$$
Mude o objetivo, e o modelo treina em um comportamento completamente diferente.
É por isso que a regulação deve atuar na camada da função objetivo, não apenas na camada do modelo.
3.4 Resumo do capítulo
O aprendizado de máquina não é uma ferramenta neutra. É um amplificador de objetivos humanos.
Insira um objetivo, e ele amplifica esse resultado em escala.
Esta é a alfabetização cognitiva básica que todos precisamos — agora.