Marketing

Imagen by Google: il tool che traduce i testi in immagini

Imagen
Contenuto curato da Stefania Spoltore

Il progresso tecnologico avvenuto nell’ultimo decennio è evidente a tutti noi e si è integrato perfettamente sia nella nostra quotidianità che all’interno dei settori industriali e commerciali.

Lentamente, ma con efficienza, le macchine e i programmi digitali iniziano ad emulare le azioni dell’uomo, superando la nostra immaginazione. Alle volte, questi nuovi strumenti riescono anche a comprendere o emulare il nostro stesso pensiero.

Non ci credete? Ci pensa Google a convincervi con la sua ultima creazione, uno strumento basato sull’'intelligenza artificiale, in grado di creare illustrazioni basandosi esclusivamente su un testo dall’utente. 

Google Imagen è un sistema text to image e rappresenta la nuova frontiera dell’illustrazione e della grafica digitale, che mette a confronto l’immaginazione umana con quella digitale. In questo articolo puoi scoprire una panoramica più dettagliata su questo strumento.

Google Imagen: che cos’è e come funziona 

Il nuovo strumento targato Google è in grado di generare un'immagine, di qualsiasi tipologia, basandosi su un testo scritto dall’utente. Si tratta di una funzionalità che rappresenta un grande passo in avanti in ambito tecnologico, un'ulteriore evoluzione dell’ intelligenza artificiale che va ad emulare il pensiero dell’ essere umano.

Ma come funziona questo tool? Il sistema text to image non fa altro che sfruttare la tecnologia di machine learning, il quale abbinato alla tecnologia di intelligenza artificiale, cerca i dati più pertinenti presenti nell’enorme database di Google per generare un'immagine che combacia con il testo scritto dall’utente. 

Il testo deve essere strettamente collegato alla creazione dell’immagine che si vuole ottenere da questo strumento, perché rappresenta il vero input dal quale il tool avvia il suo processo di ricerca e utilizzo dei dati per poter realizzare un risultato preciso.  

Lo strumento è ancora in demo e in questo momento è possibile fare una prova scegliendo alcune delle parole già inserite da Google per ottenere delle immagini in linea con la frase scelta. Ad esempio:  “un panda con indosso una maglia rossa su uno skateboard nel parco” e si ottiene l’immagine sulla sinistra, che appare per alcuni secondi. 

Come funziona Imagen di Google

Ad oggi non è ancora possibile sapere come Imagen gestisca questi testi e li suddivida per generare l’immagine, poiché Google non vuole che queste informazioni siano note. L’unica nota certa è che, almeno per il momento, non vengono mostrate persone nelle immagini.

In linea generale il funzionamento di Imagen può essere descritto in modo molto semplice: si immette un input e attraverso un encoder T5-XXL lo strumento trasforma il testo in immagine.

Tuttavia, numerosi studi rivelano che la demo resa disponibile da Google è affiancata da alcune problematiche in ambito etico. La domanda che tutti gli esperti si pongono è la seguente: “Se attraverso le tecnologie di intelligenza artificiale e machine learning è possibile generare qualsiasi tipologia di immagine basandosi su una stringa di testo, cosa impedisce allo strumento di non generare contenuti ritenuti non imparziali?"

Queste tecnologie, infatti, sono programmate per cercare contenuti e dati scavando nei database web dove, ad oggi, ci sono milioni di contenuti distorti e ritenuti come “non appropriati”. 

Nello specifico, Imagen utilizza il set LAION-400M, una database ben nota ai programmatori specializzati e molti dei contenuti presenti al suo interno includono anche tematiche riguardanti il porno o di discriminazione razziale.

Ovviamente, il team di sviluppo di questo strumento digitale ha già provveduto a filtrare gran parte di questi contenuti. Tuttavia, nonostante questo, è stato deciso di mettere in pausa il progetto così da poter ottimizzare tutti i meccanismi e “addestrare” lo strumento così da poter filtrare potenziali input offensivi e dannosi per la società. 

Google Imagen rappresenta il futuro delle immagini?

Se vi siete già avventurati nella ricerca di Imagen e volete provarlo, vi consigliamo di aspettate, perché il tool non è stato ancora rilasciato in versione ufficiale ed è presente solo la demo che offre la possibilità di settare alcune frasi inventate per ottenere immagini ben selezionate. 

La domanda che tutti si pongono, tuttavia, è la seguente: “Imagen rappresenta il futuro delle immagini? Si preferirà all’immaginazione umana?”. Se fosse così, migliaia di professionisti in grado di realizzare immagini mozzafiato, illustrazioni e grafiche, perderebbero il lavoro in pochi anni e nessuno ha questa intenzione.

Come per ogni nuovo strumento tecnologico-digitale sviluppato nell’ultimo ventennio, anche in questo caso si tratta di un supporto e un aiuto in più che la tecnologia vuole offrire all’uomo, dando la possibilità di ottimizzare le tempistiche e cercare le informazioni in modo sempre più immediato, ottenendo dei risultati più precisi, dettagliati e conformi.

Le vere potenzialità di questo software sono ancora tutte da scoprire, si tratta senza dubbio di uno strumento in grado di rivoluzionare ancora una volta il settore dell’illustrazione digitale e che aprirà le porte ad un terreno fino ad ora inesplorato.

Conclusione

In conclusione, è possibile affermare che Imagen, questo nuovo software sviluppato dal team Google, rappresenta un notevole passo in avanti in ottica di tecnologia digitale e potrebbe diventare uno strumento di uso comune molto interessante, a tratti anche divertente. 

Il futuro dei contenuti in formato immagine è già cambiato con l’avvento di alcuni social network e questo strumento rivoluzionerà ancora una volta il nostro modo di comunicare online, il modo di vedere e cercare le immagini o più in generale il modo di effettuare una ricerca sui motori di ricerca.

Tutti si aspettano ulteriori grandi cambiamenti prima della release ufficiale, soprattutto per risolvere tutte le questioni legate all’etica, al rispetto per la società e per le tematiche più sensibili. Dovranno esserci delle modifiche necessarie per far si che le tecnologie di intelligenza artificiale siano in grado di filtrare perfettamente le potenziali immagini dannose e di eliminare dal database tutte quei potenziali input ripetuti “inadeguati”.

Come ogni strumento digitale, anche in questo caso è l’umano che ha la responsabilità di far apprendere al software solo le informazioni positive, utili per le altre persone e divertenti, senza esagerare e cadere nel degrado più totale. 

Non resta che attendere ulteriori sviluppi e, successivamente, di immergersi in questo nuova grande evoluzione della tecnologia che permetterà a tutti noi di fare un passo avanti in questo mondo sempre più innovativo.