Arquivo da categoria: Discurso de ódio

Defesa de Tese — Francimaria

Doze de março, aniversário das cidades-irmãs: Olinda e Recife. Olinda completa 498 anos e é a irmã mais velha; dois anos a mais que Recife.

Nesta data emblemática, depois de quatro anos, Fran defendeu seu doutorado abordando um assunto atual, importante e de alta relevância: mitigação de viés em discurso de ódio. O título de sua tese é: Hate Speech Detection and Gender Bias Mitigation on Online Social Media.

Este é um assunto vasto, complexo e desafiador que pode ser observado por vários ângulos. Dentre as várias opções, a decisão foi focar em mitigação de viés de gênero. Mas, o que é isso e por que é importante desenvolver abordagens automatizadas para tal fim? Vamos lá!

Discurso de ódio nos “empobrece” como sociedade; fere grupos vulneráveis e reforça a discriminação e a marginalização. Desta forma, um primeiro passo para uma possível ação é descobrir se um determinado conteúdo contém discurso de ódio. A questão é que estamos inundados em textos, imagens e vídeos. Assim, não é viável analisarmos (trabalho humano) cada um destes conteúdos em busca de discurso de ódio. A resposta mais direta a essa alta demanda é colocar uma “máquina” para realizar o trabalho, ou seja, automatizar.

Para esse processo de automatização, a tecnologia de ponta vigente é a aprendizagem de máquina que extrai conhecimento de dados. Por usa vez, esse dados, muitas vezes, são produzidos por humanos que não estão isentos de viés. Logo, ao treinar uma máquina com dados que possuem viés, possivelmente, este viés será absorvido pela máquina de aprendizagem.

Daí, surge a pergunta que norteou a tese de Fran: como podemos minimizar/mitigar os efeitos de dados enviesados ao treinar as máquinas de aprendizagem?

Dentre os diferentes tipos de viés, tais como: de cor, de credo, de gênero; decidiu-se investigar o último. Uma máquina de aprendizagem ao ser apresentada, por exemplo, as seguintes sentenças que não possuem discurso de ódio (<You are a great man> e <You are a great woman>), deveria dar como saída scores baixos e similares para a presença de discurso de ódio. Mas, se o score para a sentença que contém a palavra woman é bem maior que o score para a sentença que possui a palavra man, isto pode ser um indicativo de que a máquina está enviesada.

Na tese, são propostos modelos capazes de mitigar o viés de gênero e, também, são indicados caminhos promissores para o avanço da área. Mesmo focando em viés de gênero, os modelos propostos na tese podem ser aplicados a diversos outros tipos de viés com mínimo esforço.

Os seguintes professores compuseram a banca examinadora:

Mais detalhes podem ser acessados nos seguintes artigos: