Watson e ChatGPT, duas mentes brilhantes ou diferentes?

Watson e ChatGPT, duas mentes brilhantes ou diferentes?

Oi pessoal! Claro que o título é uma provoca??o, quando uso o termo "mentes"! Gostaria de come?ar exatamente por este ponto. Toda vez que o senso comum discute sobre IA, nos vêm à cabe?a aquela idéia de uma criatura pensante, com livre arbítrio. Eu coloquei como um comentário no meu artigo anterior que, a descri??o de como se faz o teste de Turing n?o se prop?e a verificar se um sistema tem inteligência ou mesmo se é consciente. O teste só identifica se um observador humano consegue ser "enganado", se n?o souber se do outro lado existe um humano ou um programa. Na maioria das vezes a IA n?o precisa ser "inteligente". Basta parecer um humano. Um outro ponto é que, quase todas as vezes que um Tesla faz uma besteira por aí, parando do nada em um túnel, ou colidindo com algo, transparece a impress?o da sociedade de que o carro fez isto de forma consciente, meio que "se rebelando contra a sociedade". Também n?o é verdade. Me lembro que antes do ChatGPT, existia uma outra famosinha chamada Sophia, também uma entidade digital, na verdade um rob? humanoide, que disse que a fazia sentido a humanidade ser exterminada, já que faz mal ao planeta terra. Também n?o havia sentimento na frase, e apenas uma correla??o de fatos que ela coletou na internet e a levou a esta conclus?o (como na história de "Eu Rob?"). Mas aqui vem uma quest?o, será que dá para controlar a IA, por exemplo colocando as três leis Isaac Asimov, ou mesmo estipulando regras fixas, como em Robocop, que n?o podia prender os diretores da OmniCorp? Vamos discutir um pouco mais sobre este assunto neste artigo aqui, o controle da IA usando redes neurais.

O primeiro ponto que precisamos discutir é que, a cria??o de uma rede neural n?o imp?e a necessidade ou pre-existência de uma heurística. Ou seja, você n?o precisa de um algoritmo, uma descri??o de passos de como fazer. Muito pelo contrário! Por exemplo, para se fazer os cálculos da balística de um míssil, ou a trajetória para lan?amento de um foguete, n?o precisamos da IA, porque a matemática para isto já é conhecida. Temos algoritmos que descrevem como deve ser feito. Da mesma, erroneamente achamos que estes rob?s que constroem carros nas fábricas precisam de IA. Na verdade rob?s, aut?matos e IA n?o precisam estar todos na mesma caixa. Os rob?s das fábricas seguem uma sequência de passos precisamente definidas ao ongo do tempo, algo como: "gire o bra?o 90 graus", "feche as garrarras","levante a pe?a e gire 90 graus", e coisas assim. Isto é o que um programador de CNC (Computer Numeric Control) faz. Ele coordena a execu??o dos passos de forma que estes passos coincidam exatamente para que o carro seja construído da forma esperada. Isto n?o é IA, embora pare?a ter um comportamento inteligente. N?o precisamos de IA para controlar um rob? em uma fábrica! Agora, para algumas coisas, principalmente aquelas para as quais n?o temos uma heurística, ou o algoritmos pode ser complicado de codificar, a IA ajuda. Por exemplo, como saber se uma imagem de uma pessoa representa alegria ou tristeza? Como diferenciar um cachorro de um gato? Lendo um texto, como saber se seu conteúdo é agressivo ou pacificador? Para estas coisas n?o existe uma heurística consolidada. Para identifica??o de faces, por exemplo, o OpenCV consegue saber se é uma pessoa correlacionando pontos em uma imagem, também n?o precisamos de IA para isto.

N?o foi fornecido texto alternativo para esta imagem

Claro que uma rede neural também poderia ser treinada para isto! Mas, mesmo se considerarmos a parcela de programas para os quais n?o temos algorítmos, a IA ainda é fantástica, e abre um leque de possibilidades incrível!!

Mas como ela consegue executar algo que n?o sabemos programar? Parece feiti?aria, mas posso assegurar de que é estatística pura. Você estipula um conjunto de entradas, que podem ter a forma de um quadriculado, se forem os pontos de uma imagem, ou pode ser algo linear, talvez uma varia??o de temperatura, talvez letras de um alfabeto ou palavras, qualquer coisa que possa ser convertida em um número. E praticamente tudo pode ser convertido em números. Estes números podem ter uma varia??o muito grande, e portanto é desejável que eles sejam convertidos para um range de valores contidos. Pode ser algo binário, como existe um ponto ou n?o existe, ou pode ser uma faixa de valores, com -1 sendo por exemplo muito frio e 1 sendo muito quente. N?o há uma regra definida para isto. Mas o que cada ponto significa, ou o que cada entrada significa? N?o importa muito neste momento (lembre-se de que n?o temos o algorítmo). Nesta primeira camada de entrada fazemos uma conta muito simples, talvez somando todos os valores e gerando um único valor com um gatilho, e jogamos estes números das entradas para uma camada seguinte, e depois para outra camada, e assim sucessivamente. Aliás por isto é deep learning. Um conjunto de camadas, onde se vai cada vez mais fundo, até que lá no final temos uma resposta do tipo: é gato ou n?o é um gato, ou é cachorro ou n?o é um cachorro. Nossa, mas é impossível que isto funcione! Exatamente, n?o funcionará, pois afinal s?o um monte de contas inicialmente pseudo aleatórios. Mas daí vem a mágica da retro-propaga??o. Queríamos que o resultado fosse gato, mas deu "n?o gato". Daí usamos um artifício matemático, para ajustar aquelas contas e valores para que se aproximem da saída "é gato". E vamos assim sucessivamente ajustando os vários pesos, para que as contas gerem o resultado esperado.

Se lembra quando estávamos na escola, e o amigo do lado passa a "cola" com a resposta, e ficamos ajustando as contas da resolu??o para gerar aquele valor final, na esperan?a de que o professor acredite que a resolu??o foi coesa? é mais ou menos isto. Tenho a certeza de que você nunca passou por isto, mas eu já passei sim ! kkkkkkk.

Ao final de vários ajustes, indo do final para o come?o, para todas as entradas, há uma incrível tendência de que os "gols de m?o" que você fez nas contas fiquem coerentes, e que ele passe a apresentar aquela resposta que você queria para aqueles valores de entrada. Mas, o que significou cada ajuste que fizemos, aumentando ou reduzindo os valores? N?o sabemos, e n?o saberemos. Os pesquisadores estudam hoje se há uma formas efetivas de compreender porque estes números geram estes resultados. Para nós usuários da rede neural, n?o importa muito, porque funciona! Mas nem tudo é mágico assim! A pergunta é : o que acontece se colocarmos um valor que nunca tínhamos apresentado na entrada anteriormente? Sabe aquela história de que o universo conspira a favor? é o mesmo aqui. Se você treinou com muitas fotos de gatinhos, e apresentar os pontos de uma nova imagem de um gatinho, há uma boa chance de que as coincidências na semelhan?a gerem uma saída positiva para gato. Mas se colocar uma foto de elefante, por exemplo, é impossível saber o que irá sair, ou melhor, sabemos sim! Saírá "é gato" ou sairá "n?o é gato". Como nunca jogamos a imagem de um elefante na entrada, eu n?o confiaria que iria sair "n?o gato". E é por isto que as redes neurais falham. Porque a cada nova entrada que n?o foi apresentada antes, há alguma probalidade de aquelas contas gerarem um valor inesperado. Precisaríamos voltar e re-treinar a rede com os novos dados.

Olha só, vou dar outro exemplo: Se queremos criar um reconhecedor de caracteres, por exemplo, e codificamos aquele "hello world" com Python e o database Minist (uma base de dados com muitas letras), depois de dez minutos temos uma rede neural funcional que reconhece com 98% de precis?o todas as letras do MINIST. Uau, que legal! Mas daí você aplica o mesmo programa fantástico para uma página que acabou de escanear, e a precis?o cai para 25%. Porquê? Bom, o MINIST é uma base normalizada, muito utilizada para experimentar a precis?o de novos algoritmos. Todas as letras tem um mesmo tamanho, ou seja, aplicamos um certo controle ao que entra. Poderíamos e deveríamos fazer o mesmo com as fotos de gatos, e com o reconhecimento facial. Se você colocar a foto como sai da máquina fotográfica, a possibilidade de falhas é muito grande. Mas se você reduz todas as imagens a um mesmo tamanho, tanto no treinamento quanto no uso real, reduzindo por exemplo a imagem para monocromático ou para um conjunto de cores limitadas, vai cada vez mais aumentando a precis?o, porque os valores de treinamento se tornam cada vez mais próximos dos valores reais de execu??o. é uma forma de controlar.

Mas gente, como podemos usar ent?o a IA de forma que funcione mais "controladamente"? Alguém já poderia atirar uma pedra dizendo: "eu uso aqui na minha empresa e funciona!". E poderá ser verdade. Há uma boa chance de funcionar. Mas poucas chances de controlar, e com muitas chances de erros aparecerem, como os Teslas que andam por aí no piloto automático..

Uma abordagem usada é mesclar técnicas tradicionais de programa??o e controle, com pitadas de IA e descontrole, para parecer humano (será que insinuei que os humanos s?o descontrolados?). O que pudermos consolidar em heurísticas, fugindo dos cálculos estatísticos, nos dará mais controle.

Mas o que isto tem a ver afinal com ChatGPT e Watson ?

Estamos falando a mesma coisa, no Watson, por exemplo, foram adicionados mecanismos de controle, mas ainda permitindo alguma aleatoriedade e naturalidade na conversa. Por exemplo, da uma olhada nesta imagem:

N?o foi fornecido texto alternativo para esta imagem

Este artigo n?o se prop?e a ser um tutorial de Watson, mas apenas mostrar as premissas de controle que ele imp?e a uma conversa??o controlada. Por exemplo, se o cliente iniciar a conversa com qualquer uma das frases da imagem do lado esquerdo, temos o controle de para onde seguir depois. Funciona meio que como uma árvore de decis?o, da IA tradicional. Você pode falar: ahhhh, mas isto n?o é IA! Claro que é, IA n?o só redes neurais! Eu lhe responderia, lembre-se do teste de Turing lá em cima. O que importa é parecer humano! Mas na verdade n?o é só isto n?o, porque o Watson usa mais da IA para permitir varia??es de frases n?o listadas. Por exemplo, se você escrever "need money" ou "give me some money", que n?o est?o na lista, ele ainda provavelmente considerará uma pergunta inicial. Aqui entra a história as contas "sem sentido" das redes neurais.Mas o Watson também deixa gerar palavras "hotspot" ou "inten??es", que indicam algo sobre o que você quer.

Assim, da mesma forma como você "controla" a imagem inserida, reduzindo cores ou transformando imagens para um tamanho, neste caso você controla frases que seriam adequadas ou n?o para determinada conversa??o, mas ainda inserindo na conversa um fator de aleatoriedade, que a torna mais "humana". No caso do ChatGPT, este controle n?o existe ou é muito mais disperso. Nele há uma tendência de gera??o de respostas mais "aleatorias" dentro de um contexto. Pode até se parecer mais com um humano, mas n?o se engane. Ele está repetindo frases e trechos de frases que encontrou na internet. Mas afinal talvez nós humanos fa?amos isto também o tempo todo. Sem uma camada rígida de controle, que garanta uma conversa??o guiada para um propósito, dificilmente poderia ser usado em alguns tipos de aplica??es comerciais, e para alguns tipos de aplica??es, como auto atendimento na compra, médicos virtuais prescrevendo medicamentos, e coisas que exigem respostas mais rígidas e controladas, poderiamos gerar resultados imprevisíveis, ou muito abertos, como os que o ChatGPT nos apresenta.

Portanto, o resumo é que, hoje, a melhor forma de controlar imprevisibilidades em sistemas IA é com a ado??o de camadas de controle adicionais. Elas dificultam um pouco mais a implementa??o, porque s?o mais difíceis de acurar (dependem mais dos humanos), mas depois de acuradas garantem resultados ainda humanizados, mas preditivos e controlados. Talvez, um dia, quando tivermos estudos que mostrem como controlar aquelas contas aparentemente sem sentido, mostradas lá em cima, neste momento talvez consigamos controlar melhor motores regenerativos como o ChatGPT. é uma promessa de futuro, um estudo que pode proporcionar a evolu??o das IAs, mas n?o uma realidade no mundo corporativo.

E aí, gostou? quer mais artigos sobre IA?

Tenta estes daqui:

Até a proxima, amigos !

#glaucoreis?#technology?#innovation?#futurism?#ai?#chatgpt

Guilherme Arantes

Customer Success Manager Architect - Cloud & Data Platform

2 年

Excelente artigo! ??

Juliano Q.

Channel Account Manager | Strategic Alliances | B2B | Distributor | Development | Market intelligence | @IBM

2 年

??

要查看或添加评论,请登录

Glauco Reis的更多文章

  • Quem precisa de uma AGI ?

    Quem precisa de uma AGI ?

    Estava pensando sobre esta pergunta aí, e adoraria ter alguma percep??o diferente nos comentários. Para que precisamos…

    4 条评论
  • DEVS e a computa??o quantica

    DEVS e a computa??o quantica

    Recentemente resolvi assistir a um episódio de DEVS, uma série que encontrei perdida na Disney de 2020, meio que sem…

    1 条评论
  • Michael Jackson nos ensine para que serve uma IA generativa !

    Michael Jackson nos ensine para que serve uma IA generativa !

    Olha, meus amigos. Vou parecer repetitivo, e na verdade serei repetitivo mesmo.

    6 条评论
  • A Inteligência Artificial pela rede Globo

    A Inteligência Artificial pela rede Globo

    Este final de semana fui assistir à reprise do Globo Reporter sobre Inteligência Artificial apresentado na última sexta…

    8 条评论
  • A história esquecida do PC

    A história esquecida do PC

    Se você me acompanha, sabe que eu coleciono computadores anteriores ao PC. Estamos falando de computadores com Z80…

    8 条评论
  • Quem N?O olha para os erros do passado, comete os mesmos erros no futuro

    Quem N?O olha para os erros do passado, comete os mesmos erros no futuro

    Neste artigo, inusitadamente come?o com uma frase que diz quase tudo a que este artigo se refere. Vou contar uma…

    4 条评论
  • As IAs generativas e o gol de m?o do Maradona

    As IAs generativas e o gol de m?o do Maradona

    TODOS os dias, sem exce??o, aparecem aqui fracassos ou distor??es gerados por alguma IA generativa. Seja uma face do…

    4 条评论
  • Sobre "conectar os pontos" de Steve Jobs

    Sobre "conectar os pontos" de Steve Jobs

    Vou fazer aqui algo n?o muito usual. Agora a pouco estava curtindo um post sobre a vida do Steve Jobs, e me lembrei do…

    18 条评论
  • Prêmio Nobel de física e os invernos da Inteligência artificial

    Prêmio Nobel de física e os invernos da Inteligência artificial

    Olha, saiu do forno o prêmio Nobel de física! O surpreendente foi que neste premio, pesquisadores que dedicaram boa…

    6 条评论
  • Brownian Motion e a computa??o Quantica

    Brownian Motion e a computa??o Quantica

    A poeira é algo que incomoda demais os aficionados por limpeza. Mas o polen, que também é uma partícula, permite a…

    5 条评论

其他会员也浏览了