POR QUE AS GIGANTES DA TECNOLOGIA CONTRATARAM PESSOAS PARA OUVIR NOSSAS CONVERSAS PRIVADAS
ÉPOCA – 18/08/2019
April Glaser, da Slate
Acontece que a Siri, Alexa e seja lá como se chama o Facebook Messenger andaram dando com a língua nos dentes sobre suas conversas. Nas últimas semanas, cada uma dessas empresas (além do Google e da Microsoft) sofreu escrutínio por permitir que funcionários ouvissem conversas privadas para testar a qualidade de seus produtos de inteligência artificial (I.A.). Quando deixamos as empresas mais poderosas do mundo colocarem microfones em nossas casas para podermos pedir pizza com mais comodidade, também as deixamos acessar parte de nossas vidas.
O exemplo mais recente veio do Facebook. A Bloomberg noticiou que a empresa contratou centenas de funcionários para transcrever chamadas de voz anônimas feitas através do Facebook Messenger. Supostamente, os contratados não sabiam que estavam transcrevendo as conversas privadas de outras pessoas ou como o áudio havia sido obtido. O Facebook disse que esses usuários haviam escolhido deixar suas chamadas serem transcritas no aplicativo. Ainda assim, presume-se que eles acreditassem que isso seria feito por um software em seus aparelhos — não por pessoas.
“Assim como Apple e Google, nós paramos nossa inspeção humana de áudio há uma semana”, disse o Facebook disse à Bloomberg, sugerindo que a prática foi interrompida após a reação negativa que Amazon, Apple e Google receberam depois de seus clientes descobrirem que conversas gravadas em seus aparelhos foram enviadas a analistas humanos.
A Amazon empregou milhares de pessoas para ouvir gravações de voz da casa das pessoas, às vezes pegando brigas ou crianças em situação de perigo. A empresa agora permite aos usuários não autorizarem que suas gravações sejam enviadas para inspeção humana. O Google e a Apple, que também analisavam trechos de conversas de seus usuários gravados em alto-falantes smart, disseram no início do ano que acabariam com a prática. Com a Microsoft, o uso de pessoas para ouvir as gravações supostamente aconteceu em chamadas de Skype em que os usuários escolheram a opção de transcrição.
Contudo, não está claro se essas empresas pararam de gravar as conversas das pessoas. Elas dizem que todas as gravações são anônimas, ainda que a Amazon tenha supostamente enviado-as para analistas com o primeiro nome dos donos do Amazon Echo. De qualquer maneira, usuários ainda poderiam ser gravados revelando informações pessoais mesmo que elas fossem indicadas de maneira anônima.
Isso foi necessário? Há outra maneira de melhorar os softwares de inteligência artificial que entendem o que falamos? A razão pela qual essas empresas estavam ouvindo conversas privadas é que a I.A. simplesmente não entende tudo que dizemos. Isso é óbvio para quem já tentou usar uma — não é raro ter de repetir um comando várias vezes até que um alto falante smart o entenda. A inteligência artificial pode entender o que é dito [em inglês] 95% do tempo, mas isso significa que 1/20 do tempo, quando a máquina deveria estar ouvindo e não entende o que está sendo dito, ela precisa de ajuda.
Humanos são a maneira “Mais barata e possível” de realizar essa tarefa, de acordo com Meredith Whittaker, cofundadora e codiretora da ONG Instituto AI Now. Isso porque os sistemas de inteligência artificial são treinados quando alguém os diz se estão certos ou errados, como ao entender se alguém disse algo de maneira correta. “Isso se resume à questão de se há um sistema automático que pode arbitrar uma decisão dessas com a precisão, nuance e contexto cultural de um humano, e até o momento não há”, disse Whittaker. “Então o trabalho precarizado às escondidas faz boa parte do serviço pesado para a I.A.”.
Mas a mão de obra humana não é a única maneira de treinar uma máquina para que ela nos entenda melhor. Há outras formas menos invasivas de nossa privacidade para melhorar a capacidade de I.A. de entenderem a linguagem humana que não envolvem a análise humana. “Em vez de enviar o áudio exato para a transcrição humana, é possível poderia criar um padrão com o mesmo tipo de barulho ou outras ocorrências acústicas e então usar a mão de obra humana para transcrevê-lo. Dessa maneira nenhuma informação privada dos usuários seria divulgada”, disse Micah Breakstone, especialista em processamento natural de linguagem e cofundadora do Chorus, que constrói inteligências artificiais para entender conversas em equipes de venda.
O que Breakstone quer dizer é que uma cópia da gravação poderia ser feita para imitar os mesmos sons, inflexões e palavras da conversa verdadeira, de maneira que o áudio original, potencialmente identificável, não seja analisado por desconhecidos. Também é possível alterar a voz ou o gênero da pessoa falando na gravação a fim de proteger sua identidade. Ainda assim, “no fim das contas, a resposta é que você não precisa mandar esse material para humanos, mas é muito mais fácil se você o fizer”, afirmou Breakstone.
É improvável que no futuro próximo vá existir um assistente de inteligência artificial que entenda tudo que os humanos falam — nem nós entendemos tudo que dizemos. Constantemente pedimos a nosso interlocutor que explique ou repita coisas, e isso é bom. Se entendêssemos todo mundo perfeitamente e falássemos da mesma maneira o mundo seria um lugar muito chato. Isso significa que as máquinas que trazemos cada vez mais para dentro de nossas vidas provavelmente nunca nos entenderão sem a ajuda de outros humanos. Se queremos que os microfones do Google, Amazon, Facebook e outras empresas nos entendam, talvez precisemos lidar com o efeito colateral de que nossa intimidade poderá ser acessada, enviada para trabalhadores mal remuneradas e depois devolvidas para melhorar os produtos de corporações bilionárias. E teremos de pesar se, no fim das contas, esses assistentes por voz realmente melhoraram tanto a nossa vida.
Invasão de privacidade aqui não é tão simples como ter outra pessoa bisbilhotando nossas conversas, ainda que isso realmente seja chocante. “O foco em privacidade precisa passar a ser sobre como esses aparelhos estão enchendo nossas casas e espaços públicos e como estamos contribuindo com dados extremamente privados para corporações cujos objetivos podem ser radicalmente distintos dos nossos”, disse Whittaker. No fim das contas, você não é dono das gravações do que você diz para a Amazon, Google, Facebook, Microsoft ou Apple — ou mesmo uma empresa mais obscura. Quando a reação baixar, elas ainda estarão completamente livres para fazer o que quiserem com elas.