Explorando o Potencial da IA para Arquitetura

Nos últimos meses, temos ouvido cada vez mais sobre inteligência artificial. Ferramentas como Chat GPT, Midjourney e Stable Diffusion não são mais novidade para quem se interessa pela área de tecnologia. O uso destas ferramentas dentro do campo da arquitetura ainda está sendo construído e explorado pelos profissionais - mas os resultados são entusiasmantes. Por meio deste artigo, buscamos instigar  diálogos e reflexões  sobre como utilizar essa nova tecnologia para a geração de imagens arquitetônicas.

 

Formas de geração de imagem

Existem três principais formas de geração de imagem por Machine Learning: text-to-image (imagem a partir de um texto),  image-to-image (imagem a partir de outra imagem)  e image-to-text (texto a partir de uma imagem). 

 A geração text-to-image é baseada em prompts (um roteiro do que queremos que a IA produza) e, após, podemos interagir com o resultado a fim de aprimorá-lo e de gerar outras versões.

Figura 1 Fonte: Huggin Face (https://huggingface.co/tasks/text-to-image). Acesso em 11/08/2023. 

 

 A geração image-to-image é a criação de uma imagem final por semelhança a uma imagem referenciada. Esse método é útil para colorir imagens e aumentar a sua resolução.

 

Figura 2: Fonte: Huggin Face (https://huggingface.co/tasks/image-to-image). Acesso em 11/08/2023. 

 

A geração image-to-text  é a criação de um prompt a partir de uma imagem referenciada. Consideramos interessante a experiência de gerar prompts a partir de imagens famosas de referência e reaplicá-los para gerar novas imagens semelhantes. 

Figura 3.Fonte: Huggin Face (https://huggingface.co/tasks/image-to-text). Acesso em 11/08/2023.  

 

Quanto a ferramentas, aquelas que identificamos como as mais utilizadas para a geração de imagens são: Midjourney, Stable Diffusion, Dall-E e Leonardo IA. A primeira  foi desenvolvida  pela empresa Midjourney Inc.(laboratório de pesquisa independente) e funciona no ambiente do Discord, um aplicativo para comunidades de jogos. O Stable Diffusion é fruto da Stability.ai e é baseado em um programa aberto, o que permite um trabalho colaborativo entre os usuários, a criação de modelos e muito mais. O Dall-E é o produto de geração de imagens da OpenAI, mesma empresa que desenvolveu o Chat GPT, e é uma das iniciativas pioneiras na geração de imagens via inteligência artificial. Já o Leonardo.ai é um aplicativo que permite o uso de modelos de outras empresas, assim como modelos Leonardo e modelos criados por outros usuários. Inclusive, dentro do aplicativo, é possível criar modelos baseados em bancos de dados personalizados. Além dessas existem outras diversas ferramentas a serem exploradas! 


Evolução das ferramentas de geração de imagem 

A evolução da IA é exponencial em comparação com outras tecnologias arquitetônicas, como o CAD e o BIM. Os resultados obtidos com prompts (comandos escritos) estão cada vez mais próximos de renders e fotografias. Utilizando o Midjourney como exemplo, em questão de um ano, ocorreu a evolução da versão 1 para a versão 5 (Figura 4), e a cada versão podemos perceber o avanço e o potencial do uso de IA na arquitetura.

 

                               Figura 4:  Evolução estudada pela Hype da ferramenta Midjourney da versão 1 a 5.2 . Prompt: library, contemporary, santiago calatrava, white facade, visualhouse render, eye level, backlight.  

IA no Processo Hype

Consideramos o uso de IA na arquitetura, até o momento, limitado em comparação ao que poderemos alcançar em um futuro próximo. Atualmente, conseguimos utilizar essa tecnologia para trazer insights conceituais  aos nossos projetos e criar comparativos interessantes, como o da Figura 6, em que geramos mais de 180 versões de um projeto a partir de uma imagem de um modelo simples extraído direto do software de modelagem (Figura 5).

 

                     Figura 5. Fonte: Hype                   Figura 6: Estudo desenvolvido pela Hype com Stable Diffusion.

 

Do ponto de vista de visualização arquitetônica, consideramos que o ideal seria uma IA capaz de renderizar croquis e imagens simples. No entanto, nos testes que rodamos internamente, percebemos que a IA mudou características projetuais importantes. Sendo assim, até o momento, aplicamos a IA somente para ter ideias de conceito, e não na visualização de projetos já concebidos. No exemplo abaixo, Figura 7, temos um rápido comparativo entre uma imagem do projeto Habitasul + Irani (https://hypestudio.com.br/br/habitasul-irani) retirada diretamente do Revit e os 4 resultados obtidos usando IA. Percebemos que importantes nuances do projeto foram modificadas, sendo assim, a aplicabilidade dentro da Hype, até o momento, tem sido em estágios mais iniciais dos projetos, como no estudo demonstrado na Figura 6.

Figura 7: Comparativo entre imagem crua e imagens geradas por IA a partir da imagem inicial.



O mais interessante de todos estes testes foram as reações e conversas proporcionadas a partir desse tópico entre colegas. As ideias acerca desse tema são muito divergentes e todas as opiniões nos interessam. Esperamos que este artigo tenha instigado a sua curiosidade acerca da inteligência artificial no campo da arquitetura!



Assinatura Hype

Cícero Kroeff

Eduarda Schwalm

 

#InteligenciaArtificial #IA #AI #InteligenciaArtificialNaArquitetura #ArquiteturaInteligente #InovacaoNaArquitetura #AIInArchitecture