Atualiza??es no ChatGPT
ChatGPT 4o

Atualiza??es no ChatGPT

Ontem tivemos o lan?amento de algumas novidades da OpenAI. Para muitos, uma revolu??o, para outros uma decep??o. Por isso a imagem do copo ? cheio ? vazio. Vamos entender as raz?es e depois passarei minha vis?o a respeito.

Havia uma certa expectativa no ar de que a empresa anunciaria uma nova vers?o do seu cultuado modelo – GPT5 – ou ainda a inser??o de mecanismos de busca (estilo Google ou Perplexity) dentro do ChatGPT. Esses rumores tomaram forma ao longo do 1o trimestre do ano em fun??o de entrevistas do próprio Sam Altman a respeito de expectativas e possibilidades sendo trabalhadas e guardadas a sete chaves pela OpenAI.

Ocorre que nada disso aconteceu. Ao invés disso, foi anunciada a melhor vers?o até agora do ChatGPT 4 denominada ChatGPT 4o (“omni”, que significa todo em latim). Um dia antes do evento Google I/O 2024 que também anunciou novidades interessantes no modelo da Google, eventualmente obscurecidas em fun??o do anúncio feito pela OpenAI. Coincidência?? Penso que n?o.

Em termos comparativos, de fato a velocidade de resposta com essa nova release do ChatGPT 4o é absolutamente fantástica em todos os aspectos. Ficou extremamente mais rápido o tempo de resposta do prompt. Fa?a o teste e você verá o que estou dizendo.

Mais o que impressiona mesmo, pelo menos nos vídeos mostrados pela OpenAI é a melhoria na interface de voz do aplicativo. O omini é verdadeiramente multimodal, o que significa que trabalha diretamente com texto-imagem-áudio de forma nativa. Caso você n?o saiba, até hoje, era preciso o DALL-E para imagens e o Whisper para áudio. Por exemplo, para fala era preciso ir de tokens em texto para áudio com Whisper e vice-versa. Agora n?o mais.

Além disso, aumentaram também a quantidade de línguas que o ChatGPT consegue entender, inclusive com taxas de erros menores também. Essa mudan?a foi crucial e fez com que os diálogos sejam infinitamente mais naturais como se estivéssemos conversando com um ser humano de fato (320 milissegundos de tempo de resposta a partir da entrada de voz), inclusive com possibilidade de interromper e retomar a conversa. Curiosamente, os vídeos apresentados pela OpenAI n?o foram do próprio Sam Altman (que só comentou no Twitter), mas do staff da empresa. Poderia fazer uma análise estratégica desta quest?o, mas prefiro esperar cenas dos próximos capítulos.

Vale comentar sobre uma coisa neste modelo que me incomodava muito nos anteriores, mesmo no ChatGPT 4: a capacidade de mixar textos e imagens de forma coerente e fidedigna. Melhorou absurdamente e isso é ótimo! Veja o exemplo abaixo que gerei quase sem ajustes.

Antigamente era bem mais difícil ajustar o texto a imagem, quem já tentou, entende o que quero dizer. Mas agora, com a característica multimodal, o resultado fica muito melhor!

A empresa também lan?ou uma vers?o para desktop do ChatGPT 4o que pode ser acessada diretamente em computadores Mac através de uma simples combina??o das teclas option + space. ?Funciona extremamente bem e faz a vida ficar mais fácil para quem tem Mac. A data da vers?o Windows ainda n?o foi anunciada (aliás, é a primeira vez que vejo o Mac ser privilegiado!). O aplicativo pode inclusive entender imagens diretamente do desktop, analisá-las, gerar imagens e todo resto da mágica que estamos acostumados, interagindo inclusive através de voz.

Desde que comecei a lidar com computadores, alimento o sonho de poder me relacionar de forma natural com a máquina (sem cart?es perfurados, sem comandos DOS:\\, sem mouse) só com a minha voz. Meu pai sempre me provocava com isso, dizendo: "essa máquina vai ser boa o suficiente quando pudermos pedir coisas diretamente e ela puder executar". Nunca houve tecnologia para isso. Agora existe. Os agentes de IA est?o cada vez mais presentes em nossas vidas e com o GPT-4o acredito que estamos cada vez mais perto de nos tornarmos Tony Starks da vida real.

Uma curiosidade foi que a empresa decidiu liberar a nova vers?o para todos os usuários. Quando digo todos, me refiro a todos mesmo! Ou seja, para quem está acostumado a pagar US$ 20/mês e também para quem só acessa a vers?o free. Eu mesmo já cansei de recomendar a vers?o paga para diversos profissionais em diversas oportunidades, explicitando as antigas diferen?as, que agora n?o existem mais.

Entretanto, ao usar o GPT-4o, os usuários gratuitos ter?o certas restri??es de uso. Haverá um limite no número de mensagens e quando esse limite for atingido, o chatbot voltará automaticamente para GPT-3.5. Já os assinantes do modelo pago, ter?o um limite 5x maior.

Hum... Como usuário pagante desde o princípio, confesso que ainda n?o tenho uma opini?o a respeito dessa estratégia. Entendo que faz parte da miss?o da OpenAI de democratiza??o da IA, mas n?o me surpreenderia se muitos usuários plus deixassem de pagar pelo modelo. ?

Segundo fontes, a OpenAI teria o ChatGPT 4o pronto desde abril de 2023 (!). Ou seja, n?o se trata de um patch para a última vers?o do modelo, mas algo cuidadosamente arquitetado e testado pela empresa. Será que o ChatGPT 5 também está sendo guardado para ser lan?ado no momento certo?

Enfim, ainda n?o testei as novidades da Google a respeito do Gemini. Mas já li a respeito sobre algumas features. A principal é a mudan?a do seu mecanismo de busca (disparado o mais utilizado no mundo) passar a ser integrado com IA generativa. Esta quest?o é potencialmente polêmica porque, se por um lado tem potencial de facilitar a vida do usuário que fará uma pesquisa e passará a receber resultados gerados por IA, por outro, pode ser um revés para produtores de conteúdo que deixar?o de ter espa?o privilegiado, reduzindo o tráfego de alguns sites. Os demais itens mostrados na Google I/O como o Gemini Flash, nova vers?o do Gemini que promete ser mais leve e rápido que a vers?o atual e a integra??o com Gmail, ainda est?o para ser disponibilizados.

Em resumo, sou do grupo que acha que o copo está ? cheio! Vejo com muitos bons olhos esse novo modelo que (quem sabe?) pode ter sido aquela vers?o GPT 2 que foi t?o comentada há 2 semanas atrás. Quem acompanha a empresa sabe a que me refiro. Tudo é possível nessa metamorfose ambulante de IA que representa o mundo em que vivemos hoje.

Como último comentário, só posso ratificar como é bom estar vivo e experimentando coisas que até bem pouco tempo eram exclusivamente do campo da fic??o científica. E desconfio que vem mais por aí. é só aguardar.


Walder Rocha

Diretor at OPEN Tecnologia

6 个月

Interessante.

回复
Luciana Dias

Empreendedora | Palestrante | Transforma??o Organizacional | Transi??o de Líderes | Gest?o de Programas , Projetos e Portfólio | Gest?o de Mudan?a

6 个月

Obrigada por compartilhar conosco suas percep??es. Sou usuaria diária do GPT 4 e ainda n?o utilizei o GPT 4o. Vou testar. Valeu pelas dicas. Abra?os

回复
Margarida Coimbra Nascimento

|Ex-Ministra de Estado dos Transportes | Mestre em Engenharia de infraestrutura de transportes, Gest?o Estratégica Empresarial | Análise da Viabilidade de Projetos | Treinamento e Capacita??o Presencial e EAD

6 个月

Suas informa??es s?o muito importantes. N?o dá para agradar todo mundo. Mas me chamou muita aten??o o número 2 ! O que ocorreu só 2 semanas atrás… e essa corrida vale a pena acompanhar principalmente através das suas análises. O curso é maravilhoso!

回复

Muito obrigado por suas percep??es e ótima análise, Prof. Andre Barcaui .

回复

é verdade: difícil, mas interessantíssimo acompanhar as evolu??es. Vejo as melhorias no 4o como incrementais, embora seja ótima notícia desempenho superior associado a menor gasto de energia. No celular, n?o notei avan?os significativos no entendimento de áudio, que já era ótimo, exceto aumento de velocidade. No Mac, ainda n?o testei. Já Gemini+Google Search - isso sim - tem um potencial disruptivo. Muita gente preocupada. E com raz?o.

回复

要查看或添加评论,请登录

Andre Barcaui的更多文章

  • AI Guardrails

    AI Guardrails

    The subject of this article is a bit more technical than my usual style, but its importance in the AI landscape…

    1 条评论
  • IA e Solid?o: Apoio ou Risco para a Saúde Mental?

    IA e Solid?o: Apoio ou Risco para a Saúde Mental?

    Introdu??o Como canso de repetir em artigos, aulas e palestras, me considero um entusiasta da inteligência artificial…

    5 条评论
  • O que é RAG e por que você deveria se importar?

    O que é RAG e por que você deveria se importar?

    Retrieval-Augmented Generation (RAG) é uma técnica que mistura a busca de informa??es com a gera??o de texto para…

    17 条评论
  • AI or SW Development Project?

    AI or SW Development Project?

    A good friend and general manager of an insurance company brought me a very interesting question that, eventually, may…

    6 条评论
  • Os Dilemas do Executivo ao Implementar IA

    Os Dilemas do Executivo ao Implementar IA

    Imagine o seguinte estudo de caso fictício… A VarejoMax é uma das maiores redes de varejo do Brasil, com sede em S?o…

    5 条评论
  • If a Project Manager Can Be Replaced by a Machine, Then It Should Be

    If a Project Manager Can Be Replaced by a Machine, Then It Should Be

    The title of this piece isn't just designed to shock; it serves as a clarion call to scrutinize the very foundations of…

    10 条评论
  • Is Your Organization Ready for AI?

    Is Your Organization Ready for AI?

    The reason I’m asking is because not everyone is. Not everyone needs to be either.

    3 条评论
  • Como um LLM pode ajudar na Análise de Riscos

    Como um LLM pode ajudar na Análise de Riscos

    Como sabemos, a gest?o de riscos é uma parte fundamental de todo e qualquer projeto. Ainda sim, muitas vezes esse…

    15 条评论
  • Por que essa gente se senta do lado de fora de suas casas?

    Por que essa gente se senta do lado de fora de suas casas?

    Nas cidades pequenas e vilarejos espalhados pelo vasto interior de um país que n?o conhecemos, uma cena comum…

    41 条评论
  • A Verdade latente sobre Viés e Preconceito na IA

    A Verdade latente sobre Viés e Preconceito na IA

    Como sabemos, o uso cada vez mais ubíquo e inelutável da inteligência artificial trouxe consigo diversos dilemas que…

    9 条评论