Se existe uma tecnologia que me deixa impressionado, esta é a Inteligência Artificial. Não digo isto pelas suas capacidades e possibilidades de uso, mas sim com base nos seus princípios de funcionamento: a excessão das demais tecnologias disponíveis no mercado, não tenho a menor idéia de como ela faz a sua “mágica”, por trás dos bastidores! E se não bastassem as inovações que ela vem promovendo de forma independente, a interação entre diferentas aplicações e serviços acabam promovendo novos recursos e funcionalidades…
” A little while ago, OpenAI added an image editor to ChatGPT’s DALL-E 3 AI image generator. Now, after ChatGPT generates an image, you can click on the result and then click on an editor button to start making adjustments. You can then highlight areas of the image and tell ChatGPT what you want to change in that spot. The example OpenAI gave was generating an image of a dog, then highlighting its ears and asking the AI to add bows to it.”
— by XDA Developers.
De um lado, temos o ChatGPT que promove bate-papos com base na tecnologia de largos modelos de linguagem; de outro lado, temos o DALL-E que promove a geração de imagens com base na tecnologia de aprendizagem profunda. Ambas, passaram a interagir entre si há algum tempo, quando a OpenAI decidiu adicionar o editor de imagens com base no motor do DALL-E para o ChatGPT. Mas a partir de agora, não só poderemos criar novas imagens através de uma descrição detalhada pelo ChatGPT, como também será possível editar os detalhes com base na imagem gerada!
Simon Batt (escritor do portal XDA Developers) realizou alguns experimentos para testar os novos recursos e funcionalidades destas ferramentas, bem como explorar as possibilidades de uso. Além de pedir para o ChatGPT criar diferentes tipos de imagens, ele destacou determinadas seções e a partir delas, solicitou a adição, a edição e a remoção de novos elementos, que combinassem com a imagem em questão. No geral, a maioria das solicitações feitas pelo autor do artigo foi atendida, embora nem sempre entregasse os resultados com a precisão desejada.
Dentre as demonstrações feitas, a mais impressionante foi dedicada a geração de uma mão (e seus dedinhos), algo que têm sido uma grande “dor de NPU” para as tecnologias para a geração de imagens com base em IAs generativas. No entanto, as ferramentas não só trabalharam bem na criação da imagem solicitada, como também promoveram os ajustes desejados conforme as descrições feitos por Batt. Como já era esperado, nem todos os pedidos foram atendidos de forma plena, mas ainda assim as ferramentas entregaram resultados bastante satisfatórios.
Vale à pena pagar pela subscrição para o uso destes serviços (e dizer na “cara de pau” que é autor de obras maravilhosas) ou aguardar pelo seu amadurecimento e assim, ter resultados melhores? Seja como for, não é preciso dizer que tanto o ChatGPT quanto o DALL-E, são ferramentas incríveis para realizar as tarefas que se propõem a fazer, mesmo trabalhando de forma independente. Mas agora, tendo os seus recursos e funcionalidades sendo utilizados de forma conjunta, certamente se tornarão uma combinação imbatível, além de complicar (muito) a vida da concorrência!
Inclusive, vou experimentá-las para ver se podem gerar diagramas de redes… &;-D