So cosa hai fatto l'estate scorsa.

Blog

CasaCasa / Blog / So cosa hai fatto l'estate scorsa.

Apr 08, 2024

So cosa hai fatto l'estate scorsa.

Matt Barrie Segui - 6 Ascolta Condividi [Questa è una lettura lunga, di recente sono stato anche intervistato su questo saggio sull'eccezionale podcast Macrovoices se desideri ascoltarlo:

Matt Bari

Seguire

--

6

Ascoltare

Condividere

[Questa è una lettura lunga, di recente sono stato anche intervistato su questo saggio sull'eccezionale podcast Macrovoices, se desideri ascoltarlo:

https://www.macrovoices.com/1230-macrovoices-390-matt-barrie-the-awesome-power-and-risk-of-artificial-intelligence

https://podcasts.apple.com/us/podcast/macro-voices/id1079172742?i=1000625553151

Feedback sulla mia intervista: "Uno dei podcast più importanti che abbia mai ascoltato." @SteveBigpond

“(Macrovoices) Questo è stato uno dei tuoi migliori podcast. Un forte contendente per il numero 1 in realtà. Grazie." @kdogni]

Il 22 agosto 2022, Skynet è andato online e ha iniziato ad apprendere a un ritmo geometrico.

Almeno, questo è quello che sono sicuro sia stato per gli illustratori grafici.

Quel giorno è stato rilasciato Stable Diffusion, un modello di deep learning da testo a immagine. Come molti altri, l'ho scaricato e ho iniziato a giocarci.

Dovresti digitare una frase come "un uomo in sella a una moto inseguito da un orso". Ciò che ne è venuto fuori, almeno per me, sembrava più un incubo: immagini artistiche ma spesso orribili di persone con parti del corpo extra e volti deformati in scene oniriche. Ricorda un Picasso se disegnato da Salvador Dalì, la fusione di persone e oggetti era sorprendente, ma allo stesso tempo snervante.

C'era tuttavia qualcosa di veramente sorprendente nella straordinaria capacità del software di manifestare qualsiasi concetto digitato in un'illustrazione.

Starei in giro per ore a modificare i parametri: parole chiave positive e negative, il numero di passaggi da eseguire nella generazione e la forza del prompt. Occasionalmente, rilanciando, otterresti qualcosa che ti sorprenderebbe.

Qualcosa di magico stava chiaramente accadendo sotto il cofano.

Navigando in Internet, alcune persone erano diventate esperte nel comunicare gli incantesimi corretti per produrre immagini coerenti. Tagliavo e incollavo modificatori come rendering ottano, 4k, iperrealistico e giocherellavo con il numero di passaggi di generazione nel tentativo di ottenere qualcosa dal software, senza molto successo.

Era chiaro che il lavoro degli illustratori era sicuro.

Ciò che era particolarmente innovativo in Stable Diffusion era che il codice era open source. Per anni avevo sentito voci su scoperte segrete nelle viscere delle grandi aziende tecnologiche della Silicon Valley, e ogni tanto queste mettevano in mostra qualcosa.

Ora che del codice era disponibile, l’innovazione pubblica è esplosa.

Due mesi e mezzo dopo, Lensa, un'app di fotoritocco AI basata su Stable Diffusion, ha lanciato gli "avatar magici" che hanno preso d'assalto il mondo. Chiunque potrebbe caricare un paio di immagini di se stesso e generare avatar pazzeschi. L'app è diventata virale poiché i download sono aumentati.

Poi Midjourney pubblicò la versione 4 e si scatenò l'inferno.

La Uncanny Valley è un termine usato per descrivere la relazione tra l'aspetto umano di un oggetto robotico in cui le somiglianze imperfette provocano sentimenti inquietanti o stranamente familiari di disagio e repulsione.

Come Lensa, Midjourney è stato addestrato sul set di dati LAION-5B di 5,85 miliardi di immagini con descrizioni di testo recuperate da Internet. LAION-5B era 14 volte più grande di LAION-400M, il precedente set di dati liberamente accessibile.

Qualcosa nell'aumento di scala aveva permesso a Midjourney di attraversare davvero la valle misteriosa.

Non più immagini da incubo, improvvisamente il software produce immagini straordinarie e fotorealistiche di qualsiasi cosa.

Santo cielo.

È iniziata una corsa agli armamenti negli strumenti di illustrazione. La metà del viaggio era avanti, ma il divario si stava riducendo rapidamente. Ciò che ha reso Midjourney lo strumento preferito è stato il fatto che le immagini prodotte avevano un bellissimo elemento fantasy.

Lo stile era molto simile a quello di un illustratore polacco di nome Greg Rutkowski. Questo perché molte delle app di progettazione AI utilizzavano greg rutkowski come parola chiave predefinita. Greg era molto popolare tra i geek per aver disegnato le illustrazioni di Dungeons & Dragons e Magic: The Gathering.