Uma nova versão da inteligência artificial (IA) que alimenta o ChatGPT poderá transformar texto em vídeo e outras mídias, segundo a Microsoft.
O GPT-4 é uma atualização mais poderosa e versátil do GPT3.5. A antiga versão é o modelo de linguagem que está por trás do ChatGPT. Mais de 100 milhões de pessoas o utilizam regularmente desde que foi lançado, no fim de novembro, tornando-o o aplicativo de crescimento mais rápido na história da tecnologia.
Na sexta-feira 10, Andreas Braun, diretor de tecnologia da Microsoft na Alemanha, disse que a empresa irá apresentar o “GPT-4 na próxima semana”. Segundo o diretor, novos modelos multimodais oferecerão possibilidades completamente diferentes, como a opção de texto em vídeo, por exemplo.
A Microsoft é a maior investidora da OpenAI, empresa que desenvolveu o ChatGPT, e incorporou a tecnologia ao Bing, seu buscador. Sam Altman, executivo-chefe da OpenAI, disse que a capacidade do GPT-4 é “uma coisa ridícula”, que vai “desapontar” muita gente.
No entanto, se o GPT-4 for “multimodal”, ele permitirá que as pessoas gerem imagens, sons e vídeos a partir de demandas de texto simples. Não está claro em qual formato o novo modelo de IA será lançado, mas será como um recurso autônomo ou incorporado a um produto da Microsoft.
A OpenAI já desenvolveu o DALL-E, que é uma IA para gerar imagens a partir de texto, e o Jukebox, que pode criar música a partir de prompts de texto.
Altman disse, em 2022, que não terá um “modelo multimodais por muito mais tempo”. O executivo-chefe promete que outras novidades serão apresentadas. Marianne Janik, executiva-chefe da Microsoft na Alemanha, descreveu o desenvolvimento da IA e o ChatGPT como um ponto de virada no tempo, “um momento do iPhone”.