Coluna AbertaColunas

Oh, Não! Puseram IA no meu Gibizinho! – Será?

Se você costuma se inteirar sobre o mundo dos quadrinhos (já que está aqui, a resposta deve ser positiva para essa retórica questão), provavelmente já se deparou com debates relacionados ao uso das novas ferramentas de Inteligência Artificial na criação de conteúdos artísticos. Melhor avisar já que esse texto não se propõe a responder tais dilemas (não seria ambicioso a tal ponto), mas trazer um leve contexto técnico e uma atualização do cenário atual relacionado ao tema.

Vamos lá…

O que são as ferramentas de IA Generativas? Começando pelo básico e respondendo de maneira ainda mais básica: são ferramentas desenvolvidas para gerar “coisas”. Textos, ações, imagens, vídeos, respostas, sons… Se ela está gerando algo novo, é uma IA Generativa. Sei que alegar que esse algo é “novo” pode ser polêmico e voltaremos a isso mais abaixo, por hora nos manteremos nos conceitos básicos.

O que chamamos de Inteligências Artificiais hoje em dia são, nada mais e nada menos, do que modelos estatísticos. Os modelos estatísticos em sistemas de informação costumavam ser (e ainda o são majoritariamente) determinísticos. Não se preocupe, vamos definindo cada possível novo termo ao leitor que aqui caiu de modo tão desavisado. Os nomes podem parecer rebuscados, mas seus significados tendem a ser bem mais simples do que soam. Um modelo determinístico é o que te entrega um resultado “determinado” (tchã-ran!). Se eu digo que A = 2 e B = 3, cada vez que eu perguntar para um modelo determinístico a resposta de A+B, ele irá me responder que é 5. Não há variações ou interpretações. Você pode perguntar de manhã, de tarde, de noite; desde seu computador ou seu celular, a resposta nunca irá variar. Moleza, né? Ok, com isso entendido, qual a opção que varia se um modelo estatístico não for “determinístico”?

Avançamos para os modelos probabilísticos. Esses são os que compõe as IAs atuais. Esse modelo não está determinado a nada, ele avalia uma base de dados e entende que podem ter 5 respostas possíveis a uma pergunta (5 é apenas um exemplo, as quantidades são imensamente superiores) e avalia que a probabilidade de uma resposta é de 80%, outra de 7%, outra de 4% e assim por diante. Isso significa que, na maioria das vezes que você pergunte a ele qual o resultado da mesma soma anterior A+B, a resposta recebida seja 5. Mas pode ser que ele responda 4, ou 6. Que são respostas provavelmente incorretas dentro da sua análise de probabilidades, mas que já foram usadas como respostas em algum momento do universo de dados consultado por esse modelo. Mesmo que sejam respostas erradas. Mostrando que a “inteligência” do nome não atende ao significado que costumamos dar a tal palavra. Ela não faz “críticas”, ela só reage a probabilidades.

Pois bem, terminando com a parte mais técnica e, probabilisticamente, mais chata, vou só contextualizar a razão dessa explosão do uso das IAs, que parece que surgiram do nada e, de repente, estavam tão presentes em nossas vidas. Existem 3 pilares básicos dos quais eu não irei me aprofundar, mas são eles: a) aumento significativo na possibilidade de armazenar imensos volumes de dados, b) capacidades de processamento de dados em velocidades muito altas e c) uma nova arquitetura de “redes neurais” digitais chamada “Transformer” (sim, você leu corretamente) que mudou o jogo. Para fins desse texto, é só entender que antes era muito difícil ter um HD de 64GB e agora qualquer notebook, ou até smartphones possuem capacidades de armazenamento de 1TB ou mais. Essa nova disponibilidade de armazenamento criou o que se chama em tecnologia de “Big Data” (grandes volumes de dados). Também entender que o seu processador antigo suava pra abrir uma planilha de Excel com mais de 4 mil linhas e hoje qualquer telefone de médio padrão pode rodar jogos com altíssimo padrão gráfico. Some-se a esses 2 eventos a tal nova arquitetura de tecnologia, criou-se a “tempestade perfeita” para o crescimento das IAs. Afinal, já entendemos que elas são modelos estatísticos baseados em probabilidades; então sua assertividade depende da quantidade de dados que ela tenha para “aprender” e, com esses super volumes de dados processados em milissegundos, te responder algo coerente.

E os gibis? Esqueceu deles? Jamais. E por aí vamos. 

Os artistas de quadrinhos se somam a diversos outros profissionais, estudiosos, legisladores e cientistas do mundo inteiro no debate sobre os dois principais dilemas morais das transformações sociais provocadas pelas IAs. O primeiro grande dilema e debate público é um pouco menos complexo em suas possíveis resoluções, que é a “Identificação da IA”. Entende-se que não basta que elas possam interagir com você, mas que haja transparência por parte delas para que saibamos quando estamos diante de um produto ou interação produzida por uma IA. Seja quando você entra no Chat do Mercado Livre pra saber o número de rastreamento daquele seu Omnibus que deveria ter chegado ontem ou seja quando você se depara com uma linda música ou um quadro de uma paisagem. Seja até lendo esse texto aqui. Como saber se ele foi produzido por um ser humano ou por uma IA? Para os nerds mais hardcore, existe a referência perfeita na cultura pop, presente em Blade Runner, chamado “Teste Voight-Kampff”, que seria capaz de identificar as sutis diferenças entre um ser humano e um replicante. Estamos em busca do nosso teste equivalente, agora para o mundo real.

Para esse dilema, a solução parece mais encaminhada. Empresas e legisladores de diversos países estão debatendo modos de criar “impressões digitais” das IAs em qualquer produto gerado por elas. Além de padrões éticos obrigatórios onde qualquer interação com uma IA precisa ser previamente avisada ao humano do outro lado. Em teoria, vamos diminuir essa atual “caça às bruxas” quando um grupo suspeita que uma arte atribuída a um artista é originária de uma IA e não passou pelo tradicional processo artesanal para ser criada. Já presenciamos algumas injustiças nos últimos anos e cancelamentos de artistas por conta disso. Porém, no momento, ainda dependemos de confiar ou não no que é dito e percebido por cada um. Essa solução já está a caminho e será um alento até mesmo para as editoras que, cada vez menos, sabem se estão pagando uma página para um artista desenhar ou gera-la através de um prompt.

Agora vamos ao segundo e mais complicado dos dilemas morais em debate atualmente: a propriedade intelectual da base de aprendizado das IAs. Esse é mais complexo, ainda longe de qualquer solução e o grande causador de brigas e processos relacionados a IAs e o universo dos Gibis. Exemplificando: quando eu peço a uma IA para escrever um roteiro simulando a escrita do Chris Claremont, significa que a IA precisou consultar o material protegido por direitos autorais da editora e/ou do autor para poder me gerar tal resposta. Assim como, se eu peço para criar uma ilustração de uma cena de luta baseada no estilo do Jim Aparo. E, ainda que eu não nomeie um artista em particular para que ela se “inspire”, ela precisa claramente de referências textuais e visuais para criar qualquer coisa.

Voltando ao que foi dito lá nas primeiras considerações: o que a IA gera é “Novo”? Arriscando me posicionar e ferir alguns mais radicais em suas contrariedades, irei cravar a definição de que “Sim”, é algo novo. O fato de aquela imagem ou aquele texto nunca haver existido antes de sua geração o torna, obviamente, novo. Isso significa que não houve inspiração em obras de artistas que não deram seu consentimento voluntário para tal “treinamento” daquele modelo estatístico? Claro que não. Sabemos que sim, o modelo “aprendeu” com um amplo universo de produções artísticas, sendo grande parte delas, protegidas por direitos autorais vigentes.

Então os artistas estão certos ao acusarem as IAs de “roubo” ou de “plágio”? Para essa reposta eu não conseguirei me posicionar de maneira tão objetiva, mas posso explicar resumidamente como funcionam e o que alegam as empresas por trás dessas ferramentas.

A primeira coisa é que a IA não obrigatoriamente armazena os materiais que ela usa como aprendizado. Seria impossível guardar todo o conteúdo da internet em uma só base de dados. O que o modelo faz é similar ao que você, indivíduo humano, faz. Ela “consome” aquele Gibi do Chris Claremont, “aprende” com ele, evolui seu modelo de resposta e parte para o seguinte aprendizado. Se algum de vocês for produzir um roteiro hoje, talvez usem influências do Chris Claremont nele também. De maneira consciente ou não, porque ele fez parte do seu aprendizado natural. Em tese, você não receberia um processo da Marvel ou do próprio Chris porque gastou centenas de horas da sua vida lendo X-Men e, quando resolveu criar algo novo, acabou sendo influenciado por isso.

O que acabei de descrever é exatamente o argumento que as grandes corporações de tecnologia chamam de “Fair Use” (Uso justo) para obras protegidas por direitos autorais. Alegando que elas não são “roubadas”, elas são “consumidas” como seriam por qualquer adolescente com acesso à internet e utilizadas para aprendizado e evolução. Em contrapartida a esses argumentos, muitos criadores de conteúdos alegam que não há nada de “justo” em varrer a internet absorvendo informação massiva do que foi criado por eles para que essa IA venha a se tornar, justamente, uma concorrente direta dos artistas.

E a solução? De maneira curta e direta: Não existe. Porém não existe AINDA. Dentre as possibilidades iniciais desse debate, temos algumas tentativas e propostas. Vemos empresas que, como a Adobe, estão treinando seus modelos de IA somente com bases de dados das quais ela possua direitos diretos ou de obras cujos direitos autorais não estejam mais vigentes, como um quadro de Michelangelo. É um pouco limitante, mas pode ser um dos caminhos. Outra proposta é que se criem opções para que qualquer artista ou produtor de conteúdo se manifeste explicitamente em não autorizar que o modelo A ou B utilizem seu conteúdo para a base de aprendizado (processo chamado Opt-Out). Essa opção demandaria uma mudança complexa na relação entre as empresas e os indivíduos, mas é uma saída viável ao debate.

Por hora, as soluções estão dispersas por tribunais de todo o mundo e nas redes sociais. Pessoas sendo “canceladas” virtualmente por artistas porque ousaram utilizar ferramentas de IA para criar uma thumb, um post ou uma melodia segue sendo uma triste rotina em Twitters (ou “X”, ergh!), Instagrams, Tiktoks e afins.

Minha humilde sugestão é que sejamos menos “determinísticos” em nossas ações e mais “probabilísticos” ao analisar e reagir a cada caso. Ter “lados” em uma história ainda tão indefinida gera uma enorme chance de se arrepender do hoje quando chegar o amanhã. Sigamos acompanhando e, se não o fizeram, leiam Chris Claremont.

Rafael Madeira

Esse texto foi, surpreendentemente, produzido sem a ajuda de uma IA Generativa por Rafael Madeira, carioca radicado na Espanha, com mais de 20 anos de atuação no mercado corporativo de softwares, com 2 certificados internacionais em IA e pós graduando em IA pela ENEB espanhola.