I video sono il tipo di contenuto oggi più diffuso e consumato: è possibile pubblicarli dappertutto, dai social media a piattaforme web come YouTube, financo quelle di distribuzione di prodotti originariamente solo audio, come Spotify e Apple Music. È uno strumento con cui qualsiasi brand può avere più impatto e farsi ricordare da potenziali nuovi clienti e probabilmente lo hanno pensato anche alla Toys’R’Us, rivenditore americano di giocattoli che recentemente ha realizzato un video promozionale con l’IA text-to-video Sora, di proprietà di OpenAI.
Questa decisione ha generato pareri contrastanti ma bisogna dire che questo è solo uno dei tanti esperimenti fatti di recente, con le conseguenti reazioni. Altri esempi degli ultimi tempi provengono dal mondo della musica: gli MV ricoprono una parte fondamentale della promozione di un brano e alcuni artisti hanno già provato a sfruttare l’IA in tal senso, come la band nu metal Limp Bizkit e il musicista Washed Out. Per il singolo di quest’ultimo è sempre stato utilizzato il modello Sora, per poi montare insieme le clip generate, dando vita a un video a tratti onirico e spiazzante.
Nei commenti sotto al video YouTube della canzone, in cui molti esprimevano dubbi e ansie, l’artista ha scritto così:
“My new album isn’t an AI-album and there aren’t any AI-focused themes, but as a big fan of science and technology, I’m very excited about the creative potential of these new tools. As I’ve said before, it feels like a natural extension of some of the other experimental music videos I’ve done in the past”.
Un chiarimento che da solo dimostra come l’IA sia impossibile da ignorare. In passato ha ispirato la fantasia di autori e scrittori dei mondi letterario e cinematografico e oggi sarà sempre più in grado di influenzare la vita umana sotto molteplici aspetti, a cominciare appunto dalla creazione e fruizione dei media.
COSA PUÒ FARE L’IA PER I VIDEO OGGI
La divisione del pubblico su questa tecnologia è evidente e piuttosto netta ma al di là di essa, secondo la ricerca svolta da PwC sui trend dell’evoluzione delle IA, si stima che il mercato raggiungerà un valore di diverse decine di miliardi di dollari da qui entro il 2026, segmentati tra categorie quali imprese, pubblica amministrazione, NLP.
Dunque è più che lecito prevedere una crescita della domanda per la generazione di video ma anche per migliorarne la qualità. Nel frattempo è già possibile individuare le caratteristiche emergenti di queste IA e a che scopo utilizzarle, per esempio:
- Personalizzazione: le possibilità sono praticamente infinite, perciò grazie a IA come Sora non è un problema immaginare qualcosa e darle vita secondo criteri specifici che rispecchino l’azienda committente.
- Facilità di apprendimento: i normali software di video editing offrono grande flessibilità e customizzazione, tuttavia richiedono un lungo investimento di tempo e pratica per raggiungere competenze di alto livello; le IA di generazione video ne rendono più facile la creazione anche ai principianti, senza sacrificare completamente la qualità.
- Coerenza: i video con personaggi ricorrenti, come nel succitato MV di Washed Out, o quelli con un avatar parlante non sono più così impossibile da realizzare, perciò significa che col tempo sarà più facile mantenere una certa uniformità per tutto il video. Vi sono già diversi esempi di influencer virtuali in tal senso, che però sono già ormai surclassati da nuovi modelli capaci di sostenere una conversazione naturale in video, come la neo-Miss AI.
- Cura e ottimizzazione dei dettagli in montaggio, pre e post produzione: con analisi degli script, sottotitoli e trascrizioni, sample, editing rapido, correzione colore, 3D modeling, creazione di ulteriori inquadrature, estensione del minutaggio, interpolazioni, movimenti dinamici della videocamera
Praticamente qualsiasi settore richieda una comunicazione in formato video potrebbe giovare di queste e altre funzioni che velocizzerebbero di molto il processo di produzione e perfezionamento del prodotto finale.
COSA ASPETTARCI PROSSIMAMENTE
Naturalmente tutto ciò ha dei costi e per ora sono piuttosto alti. Per quanto Sora non sia ancora disponibile al pubblico, coloro che hanno la possibilità di sfruttarne il potenziale ancora “acerbo” si stanno confrontando con altri professionisti e appassionati e qualcuno ha provato anche a fare una stima di quanto costerebbe, attualmente, la realizzazione di un singolo frame, partendo dalle misure e qualità più alte possibili di DALL-E (altra IA appartenente a OpenAI ma molto inferiore a Sora): i calcoli fatti da un utente del server Discord dedicato al subreddit ChatGPT (riportati in uno screen di questo video), se fossero anche solo lontanamente attendibili, darebbero un’idea dello stato attuale dei potenziali costi d’uso di Sora e altre IA per la video-generation, ovvero qualche migliaio di dollari per ottenere un singolo frame con una qualità ottimale e solo dopo più tentativi.
I metodi con cui vengono usate e allenate queste tecnologie portano certamente ancora a degli svantaggi, che si stanno analizzando e discutendo. Oltre al costo delle risorse computazionali e alle preoccupazioni etiche, di cui già si sono visti risultati negativi come deepfake e violazione della privacy, le IA vengono pur sempre addestrate con dati creati da esseri umani che scelgono di fornirglieli e possono dunque nascere rappresentazioni distorte o condizionate da bias. Tuttavia è chiaro che ogni mercato sarà destinato a cambiare in base alle specifiche esigenze: piattaforme video come YouTube stanno adottando policy che consentono la richiesta di rimozione di contenuti generati dalle IA che simulano volti e voci di persone reali, ma allo stesso tempo stanno sperimentando a loro volta l’IA generativa.
Continuano inoltre a essere lanciate nuove IA da tutto il mondo e di vario tipo e potenza:
- Video Vibe di Yakkyo, azienda di software per il dropshipping, che supporta i venditori nel video marketing dei prodotti.
- Dream Machine della startup Luma AI, in grado di generare 120 frame in 120 secondi e dotato di più opzioni di abbonamento (dai quali possiamo dedurre che i calcoli dell’utente Discord non sono così lontani dalla realtà).
- Vidu, sviluppata da ShengShu-AI e dalla Tsinghua University e capace di creare videoclip di 16 secondi con una risoluzione di 1080px, è stata presentata nei primi mesi del 2024 e si propone con un approccio in grado di integrare l’identità culturale nei visual dei suoi prodotti.
Secondo Vimeo, poi, le IA dotate di queste capacità rivoluzioneranno anche database come quelli di immagini stock, video B-Roll o cinematograph, andando ad arricchire tali archivi, anche se pure in questo caso sono in corso discussioni su come tali immagini e minivideo siano il risultato di un machine learning che sfrutta altri contenuti protetti da copyright.
Per concludere con un ultimo esempio, pure l’industria del gaming verrà sicuramente influenzata maggiormente dall’IA: è già avvenuto per quanto riguarda animazioni, generazione procedurale, creazione di contenuti riassuntivi personalizzati e interazioni con NPC in diversi grandi titoli quali No Man’s Sky, GTA V, The Last of Us Part II, FIFA 2021 e Red Dead Redemption 2, apprezzati anche grazie alle funzioni e ai dettagli gestiti dall’IA e i suoi algoritmi.
CONCLUSIONE
L’integrazione dell’intelligenza artificiale nella produzione di video rappresenta una frontiera in continua espansione, sta già cambiando radicalmente il modo in cui creiamo e consumiamo contenuti multimediali e ogni giorno lo fa in modo sempre più preciso e realistico. L’adozione di tecnologie come Sora di OpenAI non solo ha il potenziale di democratizzare, almeno in parte, l’accesso a strumenti di produzione di alta qualità, ma offre anche nuove opportunità di personalizzazione e innovazione, impensabili fino a pochi anni fa.
Mentre il cammino verso una piena integrazione è costellato di sfide di cui si sta acquisendo maggior consapevolezza a ogni esperimento, i benefici emergenti sono troppo significativi per essere ignorati. Le aziende che abbracciano queste tecnologie si trovano in una posizione privilegiata per ridefinire i propri processi creativi e migliorare l’efficacia delle proprie campagne di marketing e non solo.
Ma per quanto possa sembrare più approcciabile agli occhi di qualcuno inesperto, l’IA non è da considerare come un semplice strumento facilitatore, quanto semmai ottimizzatore. Chi ha già grandi conoscenze ed expertise vedrà aumentare esponenzialmente le proprie possibilità e l’importanza della collaborazione tra tecnologia e creatività sarà più evidente che mai: solo unendo queste competenze sarà possibile esplorare appieno il potenziale dell’IA, mantenendo al contempo un equilibrio tra innovazione e responsabilità, di cui artisti e creator sono più che consapevoli. In questa prospettiva, sarà la loro voce che andrà maggiormente ascoltata e considerata.
L’impatto nel mondo dei media non potrà che essere profondo: l’IA continuerà a sbloccare nuove modalità di storytelling, permettendo di creare esperienze immersive, personalizzate e accessibili e alzando l’asticella per quanto riguarda competenze e risultati. Non sostituirà i creativi, ma diventerà un alleato prezioso per liberare la loro immaginazione e portare la produzione video a nuovi livelli.