Atualiza??es no ChatGPT
Ontem tivemos o lan?amento de algumas novidades da OpenAI. Para muitos, uma revolu??o, para outros uma decep??o. Por isso a imagem do copo ? cheio ? vazio. Vamos entender as raz?es e depois passarei minha vis?o a respeito.
Havia uma certa expectativa no ar de que a empresa anunciaria uma nova vers?o do seu cultuado modelo – GPT5 – ou ainda a inser??o de mecanismos de busca (estilo Google ou Perplexity) dentro do ChatGPT. Esses rumores tomaram forma ao longo do 1o trimestre do ano em fun??o de entrevistas do próprio Sam Altman a respeito de expectativas e possibilidades sendo trabalhadas e guardadas a sete chaves pela OpenAI.
Ocorre que nada disso aconteceu. Ao invés disso, foi anunciada a melhor vers?o até agora do ChatGPT 4 denominada ChatGPT 4o (“omni”, que significa todo em latim). Um dia antes do evento Google I/O 2024 que também anunciou novidades interessantes no modelo da Google, eventualmente obscurecidas em fun??o do anúncio feito pela OpenAI. Coincidência?? Penso que n?o.
Em termos comparativos, de fato a velocidade de resposta com essa nova release do ChatGPT 4o é absolutamente fantástica em todos os aspectos. Ficou extremamente mais rápido o tempo de resposta do prompt. Fa?a o teste e você verá o que estou dizendo.
Mais o que impressiona mesmo, pelo menos nos vídeos mostrados pela OpenAI é a melhoria na interface de voz do aplicativo. O omini é verdadeiramente multimodal, o que significa que trabalha diretamente com texto-imagem-áudio de forma nativa. Caso você n?o saiba, até hoje, era preciso o DALL-E para imagens e o Whisper para áudio. Por exemplo, para fala era preciso ir de tokens em texto para áudio com Whisper e vice-versa. Agora n?o mais.
Além disso, aumentaram também a quantidade de línguas que o ChatGPT consegue entender, inclusive com taxas de erros menores também. Essa mudan?a foi crucial e fez com que os diálogos sejam infinitamente mais naturais como se estivéssemos conversando com um ser humano de fato (320 milissegundos de tempo de resposta a partir da entrada de voz), inclusive com possibilidade de interromper e retomar a conversa. Curiosamente, os vídeos apresentados pela OpenAI n?o foram do próprio Sam Altman (que só comentou no Twitter), mas do staff da empresa. Poderia fazer uma análise estratégica desta quest?o, mas prefiro esperar cenas dos próximos capítulos.
Vale comentar sobre uma coisa neste modelo que me incomodava muito nos anteriores, mesmo no ChatGPT 4: a capacidade de mixar textos e imagens de forma coerente e fidedigna. Melhorou absurdamente e isso é ótimo! Veja o exemplo abaixo que gerei quase sem ajustes.
Antigamente era bem mais difícil ajustar o texto a imagem, quem já tentou, entende o que quero dizer. Mas agora, com a característica multimodal, o resultado fica muito melhor!
A empresa também lan?ou uma vers?o para desktop do ChatGPT 4o que pode ser acessada diretamente em computadores Mac através de uma simples combina??o das teclas option + space. ?Funciona extremamente bem e faz a vida ficar mais fácil para quem tem Mac. A data da vers?o Windows ainda n?o foi anunciada (aliás, é a primeira vez que vejo o Mac ser privilegiado!). O aplicativo pode inclusive entender imagens diretamente do desktop, analisá-las, gerar imagens e todo resto da mágica que estamos acostumados, interagindo inclusive através de voz.
Desde que comecei a lidar com computadores, alimento o sonho de poder me relacionar de forma natural com a máquina (sem cart?es perfurados, sem comandos DOS:\\, sem mouse) só com a minha voz. Meu pai sempre me provocava com isso, dizendo: "essa máquina vai ser boa o suficiente quando pudermos pedir coisas diretamente e ela puder executar". Nunca houve tecnologia para isso. Agora existe. Os agentes de IA est?o cada vez mais presentes em nossas vidas e com o GPT-4o acredito que estamos cada vez mais perto de nos tornarmos Tony Starks da vida real.
Uma curiosidade foi que a empresa decidiu liberar a nova vers?o para todos os usuários. Quando digo todos, me refiro a todos mesmo! Ou seja, para quem está acostumado a pagar US$ 20/mês e também para quem só acessa a vers?o free. Eu mesmo já cansei de recomendar a vers?o paga para diversos profissionais em diversas oportunidades, explicitando as antigas diferen?as, que agora n?o existem mais.
Entretanto, ao usar o GPT-4o, os usuários gratuitos ter?o certas restri??es de uso. Haverá um limite no número de mensagens e quando esse limite for atingido, o chatbot voltará automaticamente para GPT-3.5. Já os assinantes do modelo pago, ter?o um limite 5x maior.
Hum... Como usuário pagante desde o princípio, confesso que ainda n?o tenho uma opini?o a respeito dessa estratégia. Entendo que faz parte da miss?o da OpenAI de democratiza??o da IA, mas n?o me surpreenderia se muitos usuários plus deixassem de pagar pelo modelo. ?
Segundo fontes, a OpenAI teria o ChatGPT 4o pronto desde abril de 2023 (!). Ou seja, n?o se trata de um patch para a última vers?o do modelo, mas algo cuidadosamente arquitetado e testado pela empresa. Será que o ChatGPT 5 também está sendo guardado para ser lan?ado no momento certo?
Enfim, ainda n?o testei as novidades da Google a respeito do Gemini. Mas já li a respeito sobre algumas features. A principal é a mudan?a do seu mecanismo de busca (disparado o mais utilizado no mundo) passar a ser integrado com IA generativa. Esta quest?o é potencialmente polêmica porque, se por um lado tem potencial de facilitar a vida do usuário que fará uma pesquisa e passará a receber resultados gerados por IA, por outro, pode ser um revés para produtores de conteúdo que deixar?o de ter espa?o privilegiado, reduzindo o tráfego de alguns sites. Os demais itens mostrados na Google I/O como o Gemini Flash, nova vers?o do Gemini que promete ser mais leve e rápido que a vers?o atual e a integra??o com Gmail, ainda est?o para ser disponibilizados.
Em resumo, sou do grupo que acha que o copo está ? cheio! Vejo com muitos bons olhos esse novo modelo que (quem sabe?) pode ter sido aquela vers?o GPT 2 que foi t?o comentada há 2 semanas atrás. Quem acompanha a empresa sabe a que me refiro. Tudo é possível nessa metamorfose ambulante de IA que representa o mundo em que vivemos hoje.
Como último comentário, só posso ratificar como é bom estar vivo e experimentando coisas que até bem pouco tempo eram exclusivamente do campo da fic??o científica. E desconfio que vem mais por aí. é só aguardar.
Diretor at OPEN Tecnologia
6 个月Interessante.
Empreendedora | Palestrante | Transforma??o Organizacional | Transi??o de Líderes | Gest?o de Programas , Projetos e Portfólio | Gest?o de Mudan?a
6 个月Obrigada por compartilhar conosco suas percep??es. Sou usuaria diária do GPT 4 e ainda n?o utilizei o GPT 4o. Vou testar. Valeu pelas dicas. Abra?os
|Ex-Ministra de Estado dos Transportes | Mestre em Engenharia de infraestrutura de transportes, Gest?o Estratégica Empresarial | Análise da Viabilidade de Projetos | Treinamento e Capacita??o Presencial e EAD
6 个月Suas informa??es s?o muito importantes. N?o dá para agradar todo mundo. Mas me chamou muita aten??o o número 2 ! O que ocorreu só 2 semanas atrás… e essa corrida vale a pena acompanhar principalmente através das suas análises. O curso é maravilhoso!
I turn ideas into results
6 个月Muito obrigado por suas percep??es e ótima análise, Prof. Andre Barcaui .
é verdade: difícil, mas interessantíssimo acompanhar as evolu??es. Vejo as melhorias no 4o como incrementais, embora seja ótima notícia desempenho superior associado a menor gasto de energia. No celular, n?o notei avan?os significativos no entendimento de áudio, que já era ótimo, exceto aumento de velocidade. No Mac, ainda n?o testei. Já Gemini+Google Search - isso sim - tem um potencial disruptivo. Muita gente preocupada. E com raz?o.