3 modi per sottotitolare e didascalizzare i video automaticamente utilizzando l'intelligenza artificiale

In questo tutorial imparerai a utilizzare il software di riconoscimento vocale per aggiungere automaticamente sottotitoli o didascalie a un video. Ti mostreremo come utilizzare tre principali tecnologie di intelligenza artificiale, due gratuite e una a pagamento. Aggiungere sottotitoli ai tuoi video è più facile di quanto possa sembrare e offre tutti i tipi di grandi vantaggi. Continua a leggere per scoprire come.

L'accessibilità è buona per tutti

Con l'avvento di più piattaforme di video online e la diffusione di smartphone con funzionalità video, stiamo producendo e consumando sempre più video ogni giorno. Questa ondata di video crea tre nuovi problemi di accesso:

  1. Come troviamo i video che vogliamo in un mondo affollato?
  2. Come vedi tutti questi nuovi video se hai problemi di udito?
  3. Come segui il video che non è nella tua lingua madre, come è ormai una realtà quotidiana per milioni di persone?

Sottotitoli e didascalie risolvono tutti questi problemi.

I motori di ricerca non hanno idea di cosa ci sia nei tuoi video. Questo sta lentamente cambiando con l'aumento di algoritmi in grado di interpretare le immagini ma, fondamentalmente, i motori di ricerca sono costruiti per leggere il testo. Il modo migliore per dire al mondo cosa c'è nel tuo video è ancora descriverlo. Sottotitoli e sottotitoli forniscono esattamente il tipo di informazioni di testo succose che Google e gli altri amano avere.

Circa il 15% degli americani ha problemi di udito. Sottotitoli o testo scritto sovrapposti su un video che riproduce ciò che sta dicendo l'oratore, sono uno strumento chiave per l'accessibilità. L'accessibilità è essenziale in tutti i tipi di video, ma è particolarmente importante quando si insegna con i video, ed è per questo che Envato si sta muovendo per fornire didascalie su quanti più Tuts + video che possiamo.

Non siamo solo noi: negli Stati Uniti, entro il prossimo anno sarà richiesto un numero significativamente maggiore di sottotitoli per legge. Vale anche la pena notare che i video di Facebook vengono riprodotti automaticamente, ma suonano automaticamente in modo predefinito, quindi se vuoi che tutti su Facebook sappiano cosa dicono le persone nei tuoi video hai davvero bisogno di didascalie o sottotitoli.

I sottotitoli sono spesso usati come un modo per tradurre la lingua da un mezzo ad un altro (come l'inglese parlato all'inglese scritto) o una lingua all'altra. Sono un ottimo modo per rendere il video più accessibile a un pubblico di lingue diverse.

Il canale Envato Tuts + YouTube offre video con didascalie chiuse generate automaticamente da YouTube, come si può vedere in questo Illustrator in 60 secondi di video. Continua a leggere per scoprire come generare sottotitoli per le tue produzioni. 

1. Sottotitoli automatici di YouTube (gratuiti)

Creare sottotitoli con YouTube è un gioco da ragazzi. La trascrizione automatica è integrata direttamente nel servizio e può essere modificata in Gestore video. Sebbene il servizio sembra migliorare continuamente, la trascrizione di YouTube è notoriamente (e talvolta esilarante) imperfetta. Per fortuna, hai la possibilità di regolarli manualmente. Seleziona il Sottotitoli & CC opzione per visualizzare le impostazioni dei sottotitoli, quindi fare clic sul file dei sottotitoli che si desidera modificare. Nel mio caso, cioè Inglese (automatico).

Ora premi il modificare pulsante per iniziare a regolarli. Sul lato sinistro, vedrai la trascrizione generata automaticamente da YouTube. È possibile digitare su qualsiasi sottotitolo errato per correggerli. Usa il video player incorporato per aprirti la strada attraverso il video e intervenire se necessario. Clic Pubblica modifiche quando hai finito di salvare i sottotitoli corretti.

Per esportare e scaricare un file di sottotitoli, fare clic su Azioni menu a discesa e selezionare il tipo di file necessario. SRT è un formato ampiamente supportato (incluso il video di Facebook). Google rende difficile salvare i sottotitoli dai video di altre persone, ma c'è una soluzione alternativa.

Ci sono altri problemi con il servizio di YouTube. Per uno, non c'è modo di collaborare ai sottotitoli. O forse i tuoi video sono per un corso che stai producendo e non vuoi mettere i tuoi file su YouTube. O forse sei irlandese e YouTube altera completamente il tuo accento.

Ci sono molte ragioni per cui YouTube non è sempre lo strumento giusto per il lavoro. Diamo un'occhiata a come generare sottotitoli e didascalie per qualunque video.

2. Watson e Amara (gratuito)

Ciao, Watson!

Potresti aver sentito del supercomputer Watson di IBM quando ha sconfitto Jeopardy! campioni nel 2011. IBM ha utilizzato la tecnologia Watson per l'elaborazione di tutti i tipi di dati, incluso il parlato. Basta caricare un file audio nella demo speech-to-text e trascriverà l'audio per te.

Vai avanti e vai all'app. Non farti ingannare: la demo ha un sacco di funzionalità. Ho caricato una clip audio di sei minuti ed è stata trascritta in pochi minuti.

Raccomando la trascrizione come passaggio finale nella modifica di un video. Blocca la modifica, quindi esporta un file audio WAV dall'editor video. Se la tua app non supporta l'esportazione diretta su WAV, ti consiglio di utilizzare Audacity per convertire da altri formati audio in WAV.

Per caricare l'audio, clicca su Seleziona File Audio nella pagina dell'app. Sfoglia il tuo file WAV e sceglilo. Watson supporta anche lo spagnolo, il francese, il portoghese e il giapponese, quindi assicurati di scegliere la lingua dal menu a discesa se è diversa dall'inglese. Nota: se si utilizza un plug-in di blocco degli annunci per il browser Web, accertarsi che sia disabilitato per il sito Web IBM. La demo potrebbe non funzionare correttamente se abilitato adblock.

Una volta selezionato un file audio, la tecnologia Watson andrà a lavorare sulla trascrizione. Tutto il testo che vedi in questa immagine è stato generato automaticamente. La trascrizione non è perfetta, ma è un ottimo inizio!

Pochi minuti dopo, avrai una trascrizione dell'audio. In questa fase, non preoccuparti di correggere tutte le parole errate nella trascrizione. copia il testo dalla casella di trascrizione e salvarlo in un file di testo, utilizzando un'app come Blocco note su Windows o TextEdit su mac.

Se sei un programmatore capace, IBM offre un modo molto più approfondito per utilizzare la tecnologia Watson. Scopri il tutorial di IBM su come utilizzare a pieno le funzionalità di Watson complete.

Usa Amara per creare un file di sottotitoli finito

Ora hai una trascrizione grezza del nostro audio. Quindi lo sincronizzerai con il video.

Per questo passo useremo Amara, un servizio progettato per fare proprio questo. Amara può aiutarci a generare un file di sottotitoli finito che può essere utilizzato su molti servizi diversi. Vai sul sito di Amara e registrati per un account gratuito per iniziare.

Dopo esserti iscritto ad Amara, dovrai collegarti al tuo file video. Amara non supporta il caricamento di video direttamente sul suo sito, quindi è necessario prima ottenere il file online. Ho un server FTP, quindi caricherò spesso il video sul mio server e ci collegherò ad esso. Se non si dispone di un server Web da utilizzare, è possibile caricare su Vimeo, ad esempio, e utilizzarlo come host temporaneo.

Dopo aver effettuato l'accesso al tuo nuovo account Amara, incolla il link al tuo video nella casella dell'indirizzo e premi "Inizia". Puoi sempre pubblicare i tuoi video su Vimeo come host temporaneo per didascalare il tuo video.

Incolla in un link al tuo video, premi Inizio, e Amara caricherà il video nel suo sistema di sottotitolazione. Ora è il momento di caricare la trascrizione che Watson ha generato per noi. Clicca su Caricali direttamente sul lato sinistro dello schermo per caricare il file di testo su Amara.

Una volta che Amara ha afferrato il link al tuo video, ne mostrerà un'anteprima. Clicca su Caricali direttamente dal lato sinistro dell'editor per caricare il file di testo che abbiamo creato usando Watson.

Una volta che fai clic sul caricali direttamente opzione, dovrai indirizzare Amara al file di testo che abbiamo salvato nell'ultimo passaggio. Inoltre, specifica la lingua del testo e la lingua del video. Una volta premuto Caricare, Amara caricherà il testo generato.

Punta Amara al file di testo che abbiamo generato nell'ultimo passaggio e specifica la lingua del video e i sottotitoli per procedere. Quindi, premere Caricare.

Fare clic sulla lingua del sottotitolo sul lato sinistro. Quindi premere Modifica sottotitoli nella schermata successiva per regolare i tempi dei tuoi sottotitoli.

Per avviare l'editor dei sottotitoli, fai clic sulla lingua del sottotitolo sul lato sinistro di Amara (in questa schermata puoi vederlo etichettato come Inglese. Quindi, la schermata successiva mostrerà il testo che abbiamo caricato. stampa Modifica sottotitoli per avviare l'editor dei sottotitoli.

Guarda il video qui sotto per seguire la procedura di sincronizzazione temporale:

È possibile creare i sottotitoli usando solo Amara, ma ciò richiede la digitazione delle didascalie da zero. IBM Watson ci offre un ottimo punto di partenza e si abbina bene ad Amara per ottenere i tempi giusti.

Uno dei vantaggi di usare Amara è che è ottimo per la collaborazione e la traduzione. Se hai un traduttore esperto, possono facilmente collegarsi al tuo video e generare i sottotitoli in una lingua diversa.

3. Archivio popup (per abbonamento)

PopUp Archive è un servizio di trascrizione automatica che, come YouTube, può generare SRT File.

Un servizio a pagamento, come ci si potrebbe aspettare, PopUp Archive presenta alcuni distinti vantaggi rispetto ai flussi di lavoro di YouTube e Watson-plus-Amara. L'archivio PopUp memorizza i file audio, può importare più file contemporaneamente da una varietà di fonti, supporta più utenti su un account, include solidi strumenti di modifica di trascrizione, differenzia gli altoparlanti, aggiunge la punteggiatura, ha timestamp molto precisi e altro ancora. Nel testare le opzioni per i video Tuts +, abbiamo scoperto che le trascrizioni di PopUp Archives sono più accurate dei servizi concorrenti. In breve, ottieni ciò per cui paghi.

Il processo con PopUp Archive è molto simile al processo precedente: esportare un file audio dall'editor video, caricarlo sul servizio, attendere che venga elaborato e scaricare i file SRT.

Per caricare un file su Archivio PopUp, accedi e fai clic il caricamento di un file audio link sul tuo La mia collezione pagina. Nella finestra modale che si apre è possibile trascinare e rilasciare un file audio nella finestra, utilizzare il pulsante Carica un file alla volta pulsante per caricare dal tuo computer, o incollare un indirizzo web nel Aggiungi file per URL campo. Puoi anche fare un Caricamento in serie dal La mia collezione pagina.

Una volta selezionato il file audio, puoi anche aggiungere un Titolo, immagini, Contributori, Le lingue, tag, e molti altri campi di metadati utili.

Una volta completato il caricamento, PopUp Archive ti darà una notifica di successo sullo schermo. Ti invieranno un'e-mail quando la tua trascrizione è pronta.

Colpire Modifica il testo per correggere la trascrizione e regolare i tempi. Per esportare i tuoi sottotitoli, vai alla tua trascrizione e clicca su Esportare. Da lì hai una varietà di formati tra cui scegliere, tra cui SRT, WebVTT, e JSON.

L'accessibilità è importante per il tuo pubblico

Non puoi ignorare il fatto che i tuoi spettatori potrebbero avere delle disabilità che devono essere soddisfatte. Non è solo una questione di ciò che è giusto; presto sarà la legge. Inoltre, la sottotitolazione o la didascalia dei tuoi video è un ottimo modo per far risaltare il tuo lavoro e metterti in contatto con il pubblico. La buona notizia è che i recenti sviluppi dell'IA del linguaggio parlato ci hanno aiutato a farlo senza molto lavoro aggiuntivo, come hai visto in questo tutorial.

Quali altre sfide per l'accessibilità dovremmo considerare quando creiamo contenuti? Inoltre, come stai aggiungendo i sottotitoli alle tue produzioni video? Fatemi sapere nella sezione dedicata ai commenti.

Scopri l'editing video

Abbiamo creato una guida completa per aiutarti a imparare come modificare i video, sia che tu stia appena iniziando con le basi o che tu voglia padroneggiare l'editing video e la post-produzione.