Può generare clip video a partire da immagini fisse, e estendere video esistenti o riempire i fotogrammi mancanti
OpenAI, che ha fatto il suo ingresso nel mainstream l’anno scorso grazie alla popolarità di ChatGPT, sta portando la sua tecnologia di intelligenza artificiale nel campo dei video con il lancio di Sora.
Cos’è Sora
L’azienda ha infatti presentato Sora, il suo nuovo modello AI generativa per i video.
Come funziona Sora
Sora funziona in modo simile allo strumento AI di generazione di immagini di OpenAI, DALL-E.
Un utente digita un prompt con il testo della scena desiderata e Sora restituisce un clip video ad alta definizione.
Sora può anche generare clip video a partire da immagini fisse, e estendere video esistenti o riempire i fotogrammi mancanti.
LEGGI ANCHE: I migliori generatori di immagini basati su AI
Il video: la nuova frontiera per L’AI generativa
Il video potrebbe essere la prossima frontiera per l’AI generativa ora che chatbot e generatori di immagini hanno fatto la loro strada nel mondo dei consumatori e delle aziende.
Mentre le opportunità creative ecciteranno gli appassionati di AI, le nuove tecnologie presentano gravi preoccupazioni di disinformazione in vista delle importanti elezioni politiche in tutto il mondo.
Il numero di deepfake generati dall’AI è aumentato del 900% su base annua, secondo i dati di Clarity, un’azienda di machine learning.
LEGGI ANCHE: Generatori video AI: una rivoluzione per creator e marketer
I competitor di Sora
Con Sora, OpenAI mira a competere con gli strumenti AI di generazione video di aziende come Meta e Google, che ha annunciato Lumiere a gennaio.
Strumenti AI simili sono disponibili anche da altre startup, come Stability AI, che ha un prodotto chiamato Stable Video Diffusion.
Anche Amazon ha rilasciato Create with Alexa, un modello specializzato nella generazione di contenuti animati per bambini brevi e basati su prompt.
I limiti della nuova AI di OpenAI
Sora è attualmente limitato alla generazione di video lunghi un minuto o meno.
OpenAI, supportata da Microsoft, ha fatto della multimodalità — la combinazione di generazione di testo, immagine e video — un obiettivo nel suo sforzo di offrire una suite più ampia di modelli AI.
Il futuro di Sora
Sora è stato finora disponibile solo a un piccolo gruppo di tester di sicurezza, o “red teamers”, che sta testando il modello sulle vulnerabilità in aree come la disinformazione e il bias.
L’azienda non ha rilasciato dimostrazioni pubbliche oltre a 10 clip di esempio disponibili sul suo sito web, e ha dichiarato che i documenti tecnici saranno rilasciati in seguito.
OpenAI ha anche aggiunto che sta costruendo un “classificatore di rilevamento” che può identificare i clip video generati da Sora, e che prevede di includere alcuni metadati nel suo output che dovrebbero aiutare nell’identificazione di contenuti generati dall’AI.
LEGGI ANCHE: Arrivano le etichette per le immagini generate con l’AI su Facebook, Instagram e Threads
È lo stesso tipo di metadati che Meta sta cercando di utilizzare per identificare immagini generate dall’AI.