Google presenta Imagen: software di AI che traduce i testi in immagini

Alla base vi è una stretta correlazione tra il contenuto semantico dell’input testuale e la relativa rappresentazione fotografica

1 Agosto 2022

Nuova frontiera di Mountain View: Google presenta Imagen. Il sistema di text-to-image che consente di ottenere output fotografici sorprendenti a partire da testi complessi. Ne siamo consapevoli: anche l’occhio vuole la sua parte e il colosso di Mountain View, questo, l’ha compreso da tempo. È in fase di sviluppo, infatti, un suggestivo progetto a firma Big G il cui nome è Imagen: si tratta di un sistema che interpreta e traduce un testo in immagine.

Google presenta Imagen: tool di text-to-image

Il sistema, noto come text-to-image, sfrutta il machine learning e l’intelligenza artificiale: in pratica il generatore va a pescare da un poderoso database di foto creando una miscellanea sorprendente. Alla base vi è una stretta correlazione tra il contenuto semantico dell’input testuale e la relativa rappresentazione fotografica. Questa pratica definita dai modelli di diffusione da testo a immagine, consente di combinare set di coppie tra contenuti: il sistema, passo a passo, avanza nella comprensione dell’input testuale aggiungendo contenuto ed equilibrando l’output generato. Il Brain Team di Google offre sul sito ufficiale una panoramica mirabolante di cosa questo sistema sia in grado di generare. Il sistema è in fase di sviluppo e verrà migliorato col tempo grazie all’intervento umano che corregge e segnala eventuali imperfezioni.

Google presenta Imagen: déjà vu o nuova frontiera?

Se nel 2015 Google si avvalse di algoritmi e reti neurali per produrre immagini dal forte gusto onirico e psichedelico (Deep Dream) Big G con Imagen, pare, si stia preparando a un decisivo balzo in avanti. Qual era il meccanismo alla base di Deep Dream?

Deep Dream: tra entropia e connettività funzionale

Il software – sempre a marchio Google – utilizza una rete neurale convoluzionale per trovare e potenziare schemi all’interno di immagini tramite una pareidolia algoritmica. Detto in termini più semplici: il tool Deep Dream è in grado di creare effetti allucinogeni che assumono le sembianze di un sogno. Il software concepito dal Brain Team di Mountain View – il cui nome originario era ‘Inception’ tratto dall’omonimo film – venne sviluppato per l’ImageNet Large-Scale Visual Recognition Challenge (ILSVRC) nel 2014 e rilasciato a luglio del 2015. Il tool è stato concepito per riconoscere volti e altri pattern all’interno di immagini e, dopo una serie di reiterazioni, si ottiene una forma di illusione detta pareidolitica che consiste in immagini psichedeliche e surreali. Forte vero? Ancor di più se consideriamo i risultati di uno studio pubblicato nel 2021 sulla rivista scientifica Entropy volto a dimostrare, con prove neuroscientifiche, la similarità tra l’esperienza visiva di Deep Dream e quella derivante dall’assunzione di sostanze psichedeliche tra cui LSD e psilocibina. Il segnale elettroencefalografico registrato durante la visione di un video modificato da Deep Dream mostrava un elevato livello di entropia e connettività funzionale tra le aree del cervello. Entrambi sono biomarkers dell’esperienza psichedelica.

Midjourney e OpenAI: il ritardo di Google

Anche il gigante statunitense arriva in ritardo. Strano ma vero. Prima dello sviluppo proposto dal team di Google Brain due progetti similari furono già concepiti e dati in pasto al popolo del web. Si tratta di Midjourney e di Dall.E e Dall.E2 a marchio, questi ultimi, OperAI – compagnia statunitense fondata nel 2015 da Elon Musk e Sam Altman. Google Imagen a brain riding a rocketship

Google Imagen a brain riding a rocketship

Imagen sotto i riflettori: quale futuro per le immagini?

Se state googlando alla ricerca di Imagen vi possiamo dire che il vostro momento non è ancora arrivato. Per dar sfogo alla vostra fervida fantasia dovrete attendere ancora qualche settimana. Il Brain Team lascia Imagen ancora in pit stop. L’algoritmo deve essere addestrato soprattutto per evitare problemi in fase di generazione delle immagini per evitare che si creino rappresentazioni dannose per gli utenti. a cute corgi lives in a hous made out of sushi Google Imagen

a cute corgi lives in a hous made out of sushi Google Imagen

Se da un lato, infatti, le infinite potenzialità di Imagen possono spalancare porte su territori inesplorati, dall’altro potrebbero determinare effetti tellurici afferenti la sfera etica. Quando parliamo di etica le domande che escono dal vaso di Pandora sono molteplici: la creatività artificiale può superare quella umana? Chi valuterà la qualità dei prodotti artistici o pseudo tali? Chi è l’autore delle creazioni? Difficile rispondere. Nel frattempo una cosa è certa: immagina, puoi.

About Author

Tutta l'Informazione Ninja nella tua mail

Google presenta Imagen: software di AI che traduce i testi in immagini

Alla base vi è una stretta correlazione tra il contenuto semantico dell’input testuale e la relativa rappresentazione fotografica

Google presenta Imagen: tool di text-to-image

Google presenta Imagen: déjà vu o nuova frontiera?

Deep Dream: tra entropia e connettività funzionale

Midjourney e OpenAI: il ritardo di Google

Imagen sotto i riflettori: quale futuro per le immagini?

Potrebbe interessarti anche

Weekly Recap – L’AI generale di Meta, i tagli delle ...

Video perfetti per YouTube

Ninja punta sugli under 25: fino al 70% di sconto sull’...

Costruire Culture Aziendali in Ambienti Virtuali

Cybersecurity e HR

Wrap Up #8: Le notizie del mese per i Ninja del Digital

Wrap Up #4: Le notizie del mese per i Ninja del Digital

Che differenza c’è tra realtà virtuale e real...

Cos’è la Democratizzazione del Content Design ...

Food&Beverage: dai un boost al tuo business con i nano ...

Come creare una campagna sponsorizzata su Instagram