Neural Network application for visual content generation is a hot topic with multidisciplinary challenges. The automatic generation of images (text-to-image) and videos (text-to-video) involves multiple application domains and introduces the problem of content reliability. Within this line of research falls the topic of ‘digital hallucinations,’ the process of non-random inclusion of errors or unexpected details in digital images. The consistent presence of these visual artefacts in images automatically generated by Deep Learning algorithms defines a problem of platform usability. They show great potential but many limitations in constructing scientifically reliable content. The research proposes comparative experimentation between different text-to-image platforms for generating images containing architectural elements encoded by the treatise and related to the Doric order. In particular, starting from an initial classification of visual hallucinations, the research shows how these tools cannot propose scientifically correct content in architecture, opening up engaging scenarios in the relationship between text and images.
L’uso delle Reti Neurali per la costruzione di contenuti visuali è oggi un tema che pone sfide di natura multi-disciplinare. La generazione automatica di immagini (text-to-image) e video (text-to-video) coinvolge molteplici ambiti applicativi ed introduce il problema della affidabilità dei contenuti. All’interno di questo filone di ricerca ricade il tema delle ‘allucinazioni digital’, intese come processo di inserimento non casuale di errori o dettagli inaspettati nelle immagini digitali. La presenza consistente di questi artefatti visivi all’interno delle immagini generate automaticamente dagli algoritmi di Deep Learning rappresenta un problema nell’utilizzo di questi strumenti, che mostrano grandi potenzialità ma altrettanti limiti nella costruzione di contenuti scientificamente affidabili. La ricerca, partendo da uno stato dell’arte sul tema, propone la sperimentazione comparativa fra differenti piattaforme text-to-image per la generazione di immagini che contengono elementi architettonici codificati dalla trattatistica e relativi all’ordine dorico. Suggerendo una prima classificazione delle allucinazioni visive, la ricerca mostra come questi strumenti non siano ancora in grado di proporre contenuti scientificamente corretti nell’ambito della architettura, aprendo interessanti scenari nella relazione fra il testo e le immagini.
Allucinazione eidomatica degli ordini architettonici nell’era delle Reti Neurali / Flenghi, Giulia; Russo, Michele; Senatore, Luca J.. - (2025), pp. 2777-2792. (Intervento presentato al convegno ÈKPHRASIS Descrizioni nello spazio della rappresentazione Descriptions in the space of representation tenutosi a Roma).
Allucinazione eidomatica degli ordini architettonici nell’era delle Reti Neurali
Giulia Flenghi;Michele Russo;Luca J. Senatore
2025
Abstract
Neural Network application for visual content generation is a hot topic with multidisciplinary challenges. The automatic generation of images (text-to-image) and videos (text-to-video) involves multiple application domains and introduces the problem of content reliability. Within this line of research falls the topic of ‘digital hallucinations,’ the process of non-random inclusion of errors or unexpected details in digital images. The consistent presence of these visual artefacts in images automatically generated by Deep Learning algorithms defines a problem of platform usability. They show great potential but many limitations in constructing scientifically reliable content. The research proposes comparative experimentation between different text-to-image platforms for generating images containing architectural elements encoded by the treatise and related to the Doric order. In particular, starting from an initial classification of visual hallucinations, the research shows how these tools cannot propose scientifically correct content in architecture, opening up engaging scenarios in the relationship between text and images.| File | Dimensione | Formato | |
|---|---|---|---|
|
Flenghi_Allucinazione eidomatica_2025.pdf
accesso aperto
Tipologia:
Versione editoriale (versione pubblicata con il layout dell'editore)
Licenza:
Creative commons
Dimensione
4.13 MB
Formato
Adobe PDF
|
4.13 MB | Adobe PDF |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


