Videoiden tekstitys on varsin rutiininomaista työtä, joten tekoäly soveltuu homman erinomaisesti. Tekoäly pystyy tunnistamaan puhutun kielen, muuttamaan sen tekstiksi ja luomaan SRT-tiedoston automaattisesti.
SRT-tiedosto on kätevä tapa lisätä tekstitys YouTube-videoihin, sillä se mahdollistaa käyttäjille tekstin valinnan päälle tai pois päältä. SRT-tiedoston käyttö on parempi ratkaisu kuin tekstityksen polttaminen suoraan videoon, sillä se antaa katsojalle enemmän valinnanvapautta ja helpottaa videon monikielisyyden hallintaa. Lisäksi SRT-tiedostoa voidaan käyttää monissa eri videonjakopalveluissa, eikä se ole sidoksissa mihinkään tiettyyn videon toistoprosessiin tai -ohjelmistoon. Näin ollen SRT-tiedoston käyttö on erinomainen ratkaisu silloin, kun halutaan tavoittaa mahdollisimman suuri yleisö ja tehdä videosta monikielinen ja saavutettava.
Whisper ja Google Collabory hoitavat homman
Whisper.ai on avoimen lähdekoodin projekti, jonka tarkoituksena on automaattisesti transkriptoida ja tekstittää puhe. Se käyttää koneoppimista ja tekoälyä puheen ymmärtämiseen ja tarkkaan tekstiksi muuntamiseen. Whisper-ohjelmistoa voi käyttää Pythonin kirjastona, joten sen käyttö edellyttää Python-ympäristöä. Tässä vaiheessa astuu kuvaan Google Colaboratory, joka tarjoaa ilmaisen ja helppokäyttöisen pilviympäristön Python-ohjelmointiin.
Vaihe 1. Asenna Google Colaboratory
Kirjaudu Google Driveen’
Napsauta painiketta “+ Uusi”.
Napsauta “Lisää” -> “Yhdistä lisää sovelluksia” -> Etsi “Colaboratory” ja asenna se.
Vaihe 2. Lisää Uusi “Google Colaboratory”.
Vaihe 3. Muuta runtime
Google Colabissa “runtime” viittaa ympäristöön, joka suorittaa koodia ja mahdollistaa sen testaamisen ja suorittamisen. Google Colabissa on mahdollista määritellä suoritinympäristön tyyppi (None, GPU tai TPU), jotta koodin suoritus voidaan optimoida eri tarkoituksiin sopivaksi.
Valitse Runtime – “Change runtime type”.
Muuta runtime siten, että se on GPU ja tallenna muutos.
Vaihe 4. Nimeä luomasi tiedosto
Vaihe 5. Asenna Whisper
Kopioi seuraavat rivit koodia suoritettavaksi.
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
Kun valmista niin napsauta ympyrässä olevaa nuolta.
Vaihe 6 Tekstitettävä video kansioon.
Napsauta kansion kuvaketta (1) ja raahaa tiedosto (2) koneeltasi Driveen. Huom.! Sinua varoitetaan, että tiedosto ei tule olemaan Drivessä pysyvästi.
Vaihe 7 Suorita tekstitys tiedostolle
Napsauta painiketta “+Code”
Kirjoita sinne koodi. Muuta kohta “ENTER FILE NAME HERE“.
!whisper “ENTER FILE NAME HERE” –model medium
Napsauta sitten koodin kohdalla olevaa nuolta ympyrässä ja odottele kuinka puhe littetreoidaan.
Vaihe 8 Valmis
Kun kaikki on valmista, löytyy SRT -tiedosto kansiosta, josta voit tallentaa sen koneellesi.
Nyt sinulla on Drivessä tiedosto, joka tekstittää puheen sekä ääni- että videotiedostoista.
Aikakatkaisu ikävää, myös se, etten saanut srt tiedostoa kokonaan muokattua tai siirrettyä muualle muokattavaksi ja sitten tallennettua videoon liittämistä varten. Kieli on myös aika kehnoa, on paljon korjattavaa…
Aika paljon opeteltavaa…
Yksi parempi ratkaisu on käyttää ohjelmaa SubtitleEdit https://www.jarisarja.fi/subtitle-edit-kateva-tyokalu-videoiden-tekstitykseen/