Foto, video, audio: l’intelligenza artificiale sta imparando a replicare la realtà

intelligenza artificiale immagini
Intelligenza Artificiale
Foto, video, audio: l’intelligenza artificiale sta imparando a replicare la realtà


Il periodo a cavallo tra settembre e ottobre è quello delle Fashion Week, in particolare a Milano e Parigi. Quest’anno, subito dopo i due appuntamenti più attesi della stagione, è iniziato un altro genere di settimana della moda, tutta digitale. È l’AI Fashion Week, promossa da un account Instagram che si chiama @dailydall.e e che lavora in collaborazione con Open AI, l’azienda di intelligenza artificiale voluta da Sam Altaman ed Elon Musk. Ogni giorno viene pubblicata una serie di 4 fotografie, con altrettanti outfit degli stilisti più famosi, da Paco Rabanne a Givenchy.

Il punto è che quegli abiti non li ha disegnati nessuno. Li ha creati, a partire da un testo, un’intelligenza artificiale. In questo caso, è stato utilizzato Dall-E 2, il sistema di Open AI in grado di trasformare le parole in immagini, ma ci sono anche Stable Diffusion, Midjourney o Imagen di Google. E le nuove frontiere sono la creazione di video e suoni. Poche parole, una semplice descrizione, per iniziare a vedere animazioni o ascoltare suoni.

Gli investimenti spingono l’evoluzione dell’IA

Per sintetizzare, in poco più di due anni siamo passati dalla generazione di semplici righe di testo a quella di video. E non è finita: il 30 settembre, Felix Krause, ricercatore di Meta, ha annunciato lo sviluppo di un generatore di suoni. Un sistema che, proprio come gli altri, è in grado di creare audio a partire da una richiesta testuale.

Una crescita rapida, forse imprevista, spinta da evoluzioni nell’hardware e dagli investimenti monstre di Big Tech. Secondo un articolo del Wall Street Journal, le divisioni ricerca e sviluppo delle sole Meta e Alphabet hanno speso oltre 60 miliardi di dollari in questo campo nel solo 2021. Investimenti che hanno consolidato un’evoluzione, che permette ora alle macchine di imparare più velocemente, con meno dati a disposizione e, soprattutto, di mettere in relazione con maggiore efficacia parole e immagini o suoni.

Avanzamenti tecnologici che hanno aperto strade nuove. Basti pensare alla diffusione, la tecnica che viene utilizzata per creare immagini, statiche o in movimento. L’intelligenza artificiale riceve in input milioni di immagini da tutta Internet, etichettate con una descrizione. A quel punto, le scompone in migliaia di pixel che, a partire dalle richieste degli utenti, vengono poi rimessi in relazione, per creare una nuova immagine. Non c’è semplice sovrapposizione di foto e illustrazioni esistenti: è un processo generativo. Parte da un insieme di pixel e li rifinisce fino a creare qualcosa di nuovo.

Rischi e benefici: che cosa succederà?

Insieme alle evoluzioni tecniche, ci sono poi le scelte commerciali e politiche. Se Open AI ha scelto per Dall-E 2 un rilascio lento, con una lunghissima lista d’attesa, questa estate Stability AI ha cambiato le carte in tavola con Stable Diffusion. Questo modello di generazione immagini è infatti stato reso disponibile a tutti, codice compreso. È questa una delle ragioni che stanno spingendo la democratizzazione di questi sistemi.

Una democratizzazione che, senza dubbio, creerà una serie di questioni da risolvere. Ci sono, per esempio, le polemiche sul possesso delle immagini che vengono generate. Al momento, tutto dipende dal servizio: quelle generate su Midjourney, per esempio, sono interamente nelle disponibilità dell’utente; quelle con Dall-E 2 restano di proprietà di Open AI.

Un altro punto riguarda il copyright delle immagini che sono state utilizzate per nutrire quei sistemi. In altri termini, qualunque opera d’arte caricata su Internet negli ultimi anni potrebbe essere stata utilizzata come base per l’addestramento di queste IA. E quindi, oggi, questi artisti umani si troverebbero a competere con macchine in grado di replicare il loro stile.

E non è tutto: a fare paura sono anche i pericoli nella generazione di immagini o video che, per esempio, ritraggono persone in situazioni realistiche. Il rischio sono le fake news: la disponibilità di immagini, come evidenziato anche dai ricercatori della Penn State University, influisce molto sulla credibilità delle notizie false. Mentre molti sistemi hanno filtri per le creazioni che ritraggono volti o situazioni considerate sconvenienti, Stable Diffusion di Stability.AI, come sottolineato anche in un articolo su The Verge, permetterebbe agli utenti più esperti di generare qualunque tipo di immagine. Compresa la pornografia.

​  

Fonte Italian.Tech

Foto, video, audio: l’intelligenza artificiale sta imparando a replicare la realtà

Newsletter sull’Innovazione

Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.
Loading

Puoi cancellarti in ogni momento. Leggi la nostra Privacy Policy.

horizon Poland
Comunicati Stampa
Horizon4Poland’ 22 – Varsavia, 22 novembre 2022

Il 22 novembre 2022 si terrà a Varsavia l’evento di matchmaking Horizon4Poland ’22. La conferenza si configura come un’occasione per creare una rete di contatti tra aziende e istituti di R&S alla ricerca di partner e progetti da presentare nell’ambito del programma Horizon Europe. Per partecipare all’evento sarà necessario registrarsi entro il 18 novembre. PERCHÉ È IMPORTANTE ENTRARE A PARTE DELL’EVENTO HORIZON4POLAND? La conferenza …

Half-life, il vero volto dell'Onlife
Cultura
Half-life, il vero volto dell’Onlife

“Joe tornò in cucina, pescò da una delle tasche una moneta da dieci centesimi e con essa mise in moto la macchina del caffè. Quindi provò a girare la maniglia del frigorifero per prendere un brick di latte. «Dieci cent, prego» gli disse il frigorifero. «Dieci cent per aprire il …

google duplex
Cultura
Identificarsi non è un principio etico ma uno sporco trucco!

Da quando ho iniziato a lavorare al progetto Laila, un ecosistema di Intelligenze Artificiali a supporto di un agente conversazionale dedicato alle imprese, ho imparato che le AI offrono opportunità di sviluppo e innovazione immense, ma la maggior parte delle aziende che dichiarano di farne uso purtroppo stanno mettendo in pratica una mera strategia di …