Atualização será liberada gratuitamente para todos os usuários. Empresa também anunciou aplicativo para computador. Chatbot ChatGPT
Florence Lo/ Reuters
A OpenAI, desenvolvedora do ChatGPT, anunciou nesta segunda-feira (13) o GPT-4o, nova versão do modelo de inteligência artificial (IA) usado pelo ChatGPT, interface em que é possivel "conversar" com o robô. Ele será liberado gradualmente para todos os usuários, inclusive quem está na versão gratuita.
Este é o primeiro modelo da OpenAI criado para combinar textos, imagens e áudios por conta própria. As gerações anteriores precisavam de outros modelos de IA para analisar comandos de voz e fotos, por exemplo. A promessa é de que a mudança deixará o ChatGPT ainda mais rápido.
O GPT-4o leva em média 320 milissegundos para responder comandos de áudio, segundo a OpenAI – o tempo mínimo registrado foi de 232 milissegundos. A empresa diz que ele é muito mais rápido que antecessores: em média, o GPT-3.5 leva 2,8 segundos e o GPT-4, 5,4 segundos.
Até então, o ChatGPT seguia várias etapas para analisar e responder comandos de voz. Primeiro, era preciso usar um modelo para converter o áudio para texto. Depois, o GPT-3.5 ou o GPT-4 interpretava o conteúdo e criava uma resposta. Por fim, outro modelo transformava o material de volta para áudio.
"Com o GPT-4o, treinamos um único modelo de ponta a ponta em texto, visão e áudio, o que significa que todas as entradas e saídas são processadas pela mesma rede neural", disse a OpenAI, em comunicado.
O presidente-executivo da OpenAI, Sam Altman, afirmou que este é o melhor modelo já criado pela empresa. "É inteligente, é rápido, é nativamente multimodal", disse.
Segundo a empresa, o GPT-4o também tem mais capacidade para entender textos, imagens e áudios do que seu antecessor, o GPT-4, lançado em março de 2023.
A empresa também anunciou um aplicativo do ChatGPT para computador, que se junta à versão para navegadores e um aplicativo para Android e iOS.