ChatGPT: o que é, como funciona e limitações (V.6. N.6. P.2, 2023)

Tempo estimado de leitura: 9 minute(s)

Divulgador da ciência: Prof. Dr. Alexandre Donizeti Alves, professor adjunto da Universidade
Federal do ABC. Tem experiência na área de Ciência da Computação e
atualmente tem interesse em atuar nas seguintes áreas: Processamento de
Linguagem Natural e Ciência das Redes. [Lattes]

 

Nos últimos meses, o ChatGPT tem atraído muita atenção, tornando-se um dos assuntos mais comentados em todo o mundo. O chatbot treinado em inteligência artificial tem impressionado muitas pessoas com sua capacidade de gerar texto com uma qualidade surpreendentemente próxima ao produzido por humanos. Mas afinal, o que realmente é o ChatGPT, como funciona e, sobretudo, quais são suas limitações? Adicionalmente, será apresentado um guia introdutório de como começar a utilizar essa ferramenta.

 

O que é o ChatGPT?

O ChatGPT é um chatbot, ou seja, um programa de computador que utiliza inteligência artificial e processamento de linguagem natural para realizar conversas com usuários em tempo real, de maneira automatizada. Ele é capaz de compreender as perguntas e interações dos usuários e fornecer respostas adequadas, produzindo um diálogo natural e eficaz. O ChatGPT é uma das implementações mais avançadas de chatbot, pois é baseado no modelo GPT (Generative Pre-trained Transformer), que foi treinado em uma enorme quantidade de dados de linguagem natural e pode produzir respostas coerentes e fluentes em uma ampla variedade de tópicos e contextos.

O ChatGPT foi lançado pela primeira vez em junho de 2020 e no final de novembro de 2022 foi liberado para o público em geral. Ele foi criado pela OpenAI, uma organização privada de pesquisa em inteligência artificial fundada em dezembro de 2015. Entre os fundadores estão Sam Altman, presidente da Y Combinator e cofundador da OpenAI; Greg Brockman; diretor executivo da OpenAI e anteriormente presidente e diretor de tecnologia da Cloudera; Ilya Sutskever, renomado pesquisador de inteligência artificial especializado em aprendizado com profundo e redes neurais; e Wojciech Zaremba, cientista pesquisador da OpenAI e um dos principais especialistas em processamento de linguagem natural. Além disso, o fundador da SpaceX e da Tesla, Elon Musk, também é cofundador da OpenAI.

Em setembro de 2020, a OpenAI e a Microsoft anunciaram uma parceria estratégica que envolveu um investimento de US$ 1 bilhão da Microsoft na OpenAI. Como parte dessa parceria, a Microsoft passou a ser a parceira exclusiva de nuvem da OpenAI, responsável por hospedar e oferecer acesso aos serviços de inteligência artificial da OpenAI, por meio da plataforma de computação em nuvem Azure. Através dessa parceria, a Microsoft tem acesso aos recursos e tecnologias da OpenAI, incluindo o ChatGPT, para integrá-los em seus próprios produtos e serviços.

A versão inicial do ChatGPT foi desenvolvida com base no modelo GPT-3.5, uma versão aprimorada do modelo GPT-3 lançada pela OpenAI em 2021. A principal diferença entre o GPT-3 e o GPT-3.5 é que este último utiliza uma técnica chamada “poda” (pruning), que remove uma grande parte dos neurônios menos importantes da rede neural, tornando-a mais enxuta e eficiente. Com essa técnica, a rede neural do GPT-3.5 tem cerca de 86 bilhões de parâmetros, em comparação com os 175 bilhões de parâmetros do GPT-3, mas sem perder qualidade na geração de texto. Isso permite que o GPT-3.5 seja executado em hardware menos poderoso, tornando-o mais acessível para uso em dispositivos móveis e outros dispositivos com recursos limitados. Em março de 2023, foi lançada uma nova versão do ChatGPT baseada no modelo GPT-4, o mais recente modelo de linguagem natural desenvolvido pela OpenAI. Entretanto, essa nova versão, denominada ChatGPT Plus, está disponível apenas para assinantes pagos (20 dólares por mês) e ainda de forma limitada. O GPT-4 é um modelo multimodal (aceitando entradas de imagem e texto, emitindo saídas de texto), mais confiável, criativo e capaz de lidar com instruções muito mais sutis do que o GPT-3.5. Além disso, o modelo GPT-4 é baseado em muito mais dados de treinamento e é capaz de considerar mais de 1 trilhão de parâmetros ao elaborar suas respostas.

 

Como funciona o ChatGPT?

O funcionamento do ChatGPT é baseado em uma técnica chamada de “pré-treinamento”. Isso significa que o modelo é treinado com uma grande quantidade de dados de texto antes de ser utilizado em tarefas específicas, como responder perguntas ou gerar textos. Durante o pré-treinamento, o modelo aprende a prever a próxima palavra em uma frase com base nas palavras anteriores. Essa técnica permite que o modelo adquira uma compreensão geral da linguagem e seja capaz de gerar texto de alta qualidade.

A arquitetura do ChatGPT é composta por vários blocos de codificadores e decodificadores. Os codificadores são responsáveis por processar a entrada de texto e transformá-la em uma representação numérica que pode ser entendida pelo modelo. Os decodificadores, por sua vez, utilizam essa representação numérica para gerar o texto de saída. O ChatGPT utiliza uma arquitetura de rede neural conhecida como Transformer. Em resumo, a arquitetura Transformer é composta por várias camadas de autoatencão (self-attention) que permitem que o modelo leve em consideração as relações entre todas as palavras de uma frase ao mesmo tempo, em vez de analisá-las uma por uma. Esse processo de autoatencão é repetido em várias camadas da rede, permitindo que o modelo capture informações contextuais mais complexas e produza resultados mais precisos e coerentes.

Quando o usuário faz uma pergunta ou envia uma mensagem para o ChatGPT, a entrada de texto é codificada em vetores numéricos e alimentada na rede neural. A partir daí, a rede analisa a entrada e utiliza seu conhecimento prévio para gerar uma resposta apropriada. O funcionamento do ChatGPT depende da qualidade do treinamento prévio do modelo e da quantidade de dados disponíveis para esse treinamento. O modelo será mais preciso e útil quanto mais dados e informações tiver.

Em resumo, o ChatGPT funciona através da utilização de uma arquitetura de rede neural baseada em Transformers e da técnica de pré-treinamento para gerar texto humano de forma autônoma. A arquitetura do ChatGPT é composta por blocos de codificadores e decodificadores, e utiliza várias camadas de atenção para se concentrar nas partes relevantes do texto de entrada.

 

Limitações do ChatGPT

Embora o ChatGPT seja uma tecnologia avançada e impressionante, ainda existem limitações que precisam ser consideradas. Algumas delas incluem:

  • Bias: como o ChatGPT é treinado com base em uma grande quantidade de dados, pode haver a presença de viés nos resultados gerados. Isso pode ser devido a dados de treinamento desatualizados ou enviesados, ou mesmo devido a preconceitos subjacentes na sociedade que são refletidos nos dados.
  • Contexto limitado: embora o ChatGPT possa gerar respostas contextualizadas, ele ainda pode ter dificuldades em compreender e responder a nuances complexas ou informações implícitas que um ser humano possa capturar facilmente.
  • Falta de criatividade: embora o ChatGPT possa gerar respostas inteligentes e relevantes, ele ainda é limitado em termos de criatividade e originalidade, uma vez que só pode produzir saídas com base em dados e padrões existentes.

Além disso, há a limitação dos dados serem atualizados somente até setembro de 2021. Isso pode afetar a capacidade do ChatGPT de lidar com informações mais recentes e precisas. Isso pode levar a respostas menos precisas ou até mesmo incorretas em certas situações. No entanto, a OpenAI continua trabalhando para melhorar e atualizar o modelo GPT, e é provável que novas versões do ChatGPT sejam lançadas no futuro com dados mais recentes e melhorias na precisão das respostas.

 

Como começar a utilizar o ChatGPT?

Aqui está um guia passo a passo para começar a utilizar o ChatGPT:

  1. Acesse o site do ChatGPT: https://chat.openai.com/.
  2. Inicialmente, um cadastro simples deve ser feito. Também é possível vincular com sua conta Microsoft ou Google. Em seguida, faça o login na plataforma.
  3. Na página inicial do ChatGPT, você verá um campo de texto onde poderá digitar a sua pergunta ou mensagem.
  4. Digite sua pergunta ou mensagem na caixa de texto e aguarde alguns segundos para que o ChatGPT processe sua solicitação e forneça uma resposta. É importante destacar que se uma pergunta for feita mais de uma vez, o ChatGPT pode gerar respostas diferentes.
  5. Leia a resposta fornecida pelo ChatGPT e avalie se ela atendeu à sua pergunta ou se precisa de mais informações.
  6. Se necessário, faça mais perguntas ou forneça mais informações para que o ChatGPT possa fornecer uma resposta mais precisa.
  7. Quando terminar de usar o ChatGPT, basta fechar a janela do navegador ou clicar no botão “Log out” que aparece após você clicar no nome do seu usuário na parte inferior esquerda da página.

 

Você pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Twitter
Blog UFABC Divulga Ciência