A OpenAI continua a incutir novos recursos em IA conversacional que levaram a humanidade a uma nova era de verdadeira colaboração homem-máquina. Comunicação web, análise e criação de imagens, análise e síntese de fala já estão disponíveis para o chatbot em sua versão paga.
Bate-papoGPTFoi impulsionado desde o início do ano pelo modelo LLM “GPT-4” que sabemos ser multimídia, mas cujas capacidades visuais e de áudio foram restritas e bloqueadas até agora.
Nos últimos dias, a OpenAI decidiu lançar recursos de IA mais generativos e conversacionais. Mesmo que esses novos recursos estejam atualmente limitados a usuários pagantes das edições ChatGPT Plus e ChatGPT Enterprise. Lembrando que para quem quer ficar de graça, o serviço Bing Chat da Microsoft oferece a maioria desses recursos.
Começou trazendo de volta a funcionalidade que apareceu brevemente neste verão9, mas foi rapidamente removida (depois que pessoas inteligentes descobriram que poderiam usá-la para acessar sites pagos gratuitamente via ChatGPT): Comunicação de IA na Web! O modelo GPT-4 principal do ChatGPT foi treinado usando documentos anteriores ao final de 2021. Sem uma conexão com a Internet, a IA não só seria incapaz de realmente analisar documentos da web, mas também não seria capaz de enriquecer suas respostas com informação atualizada. Agora, ativar a configuração “Navegar com o Bing” em “Configurações e recursos beta/beta” permite que a IA conversacional responda a perguntas sobre tópicos e eventos recentes e se conecte à web para melhorar suas análises.
Outra grande novidade é que a OpenAI finalmente decidiu liberar o potencial multimídia do GPT-4. A partir de agora, o ChatGPT baseia-se na nova iteração GPT-4V do seu modelo básico, formalizando assim o acesso à análise de imagens. Os usuários do ChatGPT Plus em breve poderão (e agora podem nas versões móveis iOS e Android) enviar fotos ou perguntas ilustradas com fotos e fazer com que a IA as analise e comente sobre elas. Assim, a inteligência artificial pode traduzir manuscritos manuscritos, converter contornos desenhados de um algoritmo ou tela em código de computador, analisar e descrever uma imagem ou pintura, analisar captcha e muitas outras coisas.
Além disso, a OpenAI também integrará em breve o incrível gerador de imagens “Dall-E 3” no ChatGPT (que já está disponível no Programa de criação de imagens do Bing E as performances são realmente mais impressionantes que as do Dall-E 2) e competem seriamente com o Midjourney, ao mesmo tempo que oferecem estilos mais diversos.
Um dos grandes pontos fortes da IA generativa é que ela revoluciona as interações homem-máquina ao fazer da linguagem natural a base dessas interações. A partir de agora, a ideia é poder realizar essas interações por voz em vez de digitação. Ainda temos que esperar um pouco para ter uma discussão como acontece com um ser humano, devido à era atual de análise e compreensão da fala humana. Mas estamos chegando perto.
O Bing Chat em sua versão mobile permite que você faça perguntas por voz e a IA também pode respondê-las por voz. A inteligência artificial conta com modelos desenvolvidos pela Microsoft para esse fim.
A OpenAI em breve integrará seu modelo de voz para texto “Whisper” ao ChatGPT Plus. O chatbot também poderá falar graças ao novo modelo “Text to Speech” que oferece 5 vozes diferentes.
Em outras palavras, o ChatGPT agora pode conectar, ver, falar e ouvir. Muitos novos recursos que os jovens usuários inteligentes não deixarão de explorar para fins inesperados, divertindo-se contornando as restrições que a OpenAI tentou implementar para evitar usos prejudiciais ou inadequados de sua IA.
O ex-presidente brasileiro Jair Bolsonaro se encontra em crise mais uma vez. A polícia brasileira…
Quando questionado pela televisão espanhola, um ex-companheiro de prisão de Daniel Alves afirmou que o…
Criar uma conta Habilite o JavaScript no seu navegador para acessar o cadastro em…
Os motores elétricos servem como a espinha dorsal das operações industriais, impulsionando uma infinidade de…
René Nader Misura e João Salaviza retratam incansavelmente a resistência Krahu no Nordeste do Brasil.…
A taxa de excitação de átomos sob diferentes valores de ohm. Fonte: Arksif (2024). doi:…