Tiago Massoni

Logo

Associate Professor in Computer Science

View My GitHub Profile

A essa altura todos já pelo menos ouviram da inteligência artificial chatGPT, que conversa com você quase como se fosse uma pessoa real do outro lado, fazendo poemas, criando textos completos e até soluções para exercícios complexos. A empresa por trás do ChatGPT lançou a nova versão do modelo de aprendizado, que agora é capaz de aceitar, além de texto, imagens para ajudar na conversa com a inteligência artificial.

OpenAI, a empresa por trás do ChatGPT lançou a nova versão do modelo de aprendizado, que agora é capaz de aceitar, além de texto, imagens para ajudar na conversa com a inteligência artificial.

Bom dia ouvintes da CBN,

Entrei no site do chatGPT recentemente, e pedi para o robô fazer um poema, em português, sobre o viaduto de Campina Grande. Ele foi lá e fez, apesar de pobre em rimas e musicalidade. Ah, me ajudou também a estudar francês, fingindo que era um habitante de Paris conversando com esse humilde aprendiz do idioma no Brasil. E me ajudou a deixar um texto que fiz correto gramaticalmente.

Essas e outras façanhas da inteligência artificial vêm sendo assunto constante nas fileiras da tecnologia, com a empresa OPENAI sendo agora o alvo das grandes empresas, como a Meta e o Google. O mundo agora vai mudar de vez, é o que se diz por aí, com todos os futuros avanços da tecnologia da informação conectados com a aprendizado baseado em linguagem. O motor por trás do chatGPT, além do buscador da Microsoft, o Bing, chama-se GPT, o algoritmo que adivinha a próxima palavra a ser gerada, dependendo do que ele aprendeu com bilhões de textos na internet. Até agora, vínhamos usando a versão 3.

Bom, depois de meses de rumores e especulação, a empresa anunciou na semana passada o GPT-4. A empresa tenta passar a ideia de que o novo motor é mais criativo e colaborativo, resolvendo problemas complexos com maior precisão.

A grande novidade parece ser o fato de ele aceitar agora uma imagem como entrada. Ou seja, enquanto você conversa com o modelo, pode mandar uma figura para ele, para que um pedido seja melhor entendido. Algo como “faça uma planilha no mesmo formato dessa foto aqui”, ou “explique esse meme”. E ele responde sempre na forma de texto.

O novo modelo veio acompanhado do anúncio de novas parcerias da empresa. Por exemplo, foi anunciado que o aplicativo Duolingo, para aprendizado de idiomas, vai usar a tecnologia para gerar exercícios menos repetitivos. Por enquanto, o GPT-4 só pode ser usado pela versão paga do chatGPT, que custa em torno de 100 reais por mês. Mas já podemos dessa evolução no novo buscador da Microsoft, o Bing, gratuitamente. Para isso, você precisa fazer o login com uma conta da Microsoft, e usar o navegador Edge, que vem com o Windows.

Na verdade, o lançamento da nova versão do modelo acabou sendo meio frustrante, dada toda a especulação de como as capacidades do GPT-4 seriam um enorme salto em relação à versão anterior. A melhoria foi bem mais incremental, eu diria. Trata-se do famoso hipe, a badalação que a realidade costuma esmagar.

Afinal, foi uma longa jornada de evolução desde que a pesquisa com esses modelos começou. O GPT foi descrito em um artigo científico pela primeira vez em 2018, com sua segunda versão aparecendo em 2019 e o GPT-3 em 2020. Esses modelos são treinados em enormes conjuntos de dados de texto, muitos minerados na internet, a procura dos chamados padrões estatísticos, que são usados para predizer qual palavra deve vir seguida da anterior. É um mecanismo relativamente simples, mas extremamente poderoso para gerar, resumir e reescrever texto, além da possibilidade de tradução ou até gerar programas prontos. O lançamento da aplicação chatGPT, livre pra uso, foi o que criou o hipe em torno da tecnologia.

Como previsto, a tecnologia estando a um clique de distância do público em geral criou problemas e desafios. Escolas e faculdades começam a se adaptar a um software gratuito que escreve redações e respostas textuais para exercícios. Sites online de perguntas e respostas sofrem para banir respostas geradas automaticamente (e erradas). O jornalismo anda tendo que se explicar com texto automático em portais. E esse é só o começo de todos os questionamentos éticos que vêm por aí.

No seu anúncio, a OPENAI destacou que o sistema novo vêm de seis meses de treinamento de segurança, através do qual ela se mostrou menos suscetível a gerar respostas nocivas, como descrever o modo de cometer um crime, por exemplo.

Ainda assim, a empresa alerta que o sistema continua apresentando as mesmas limitações de qualquer modelo de linguagem, como a tendência de inventar informação falsa, ou o defeito de gerar textos violentos e nocivos, se provocado pelo usuário.

A discussão vai continuar quente, e certamente vai chegar em todos nós, em algum momento, no nosso trabalho, principalmente. O computador não é inteligente, como o termo IA possa supor; no entanto, não podemos dizer que ele não esteja aprendendo.

Um abraço e até a próxima.