Subtitle Workshop
Etusivu Tietosivut Huumori Harrastukset Valokuvia Linkit
 

Subtitle Workshop

Subtitle Workshop on näppärä ja monipuolinen ohjelma tekstitysten tekemiseen ja muokkaukseen. Ennen kaikkea se on myös ilmainen ja ladattavissa valmistajansa Urusoftin kotisivuilta. Ohjelmasta on jaossa myös versio, joka on kehitetty suomentamista sekä suomessa totuttua tekstitystapaa silmällä pitäen. Kyseisen version voi ladata alan harrastelijasivustolta www.xvidsubs.com kohdasta Subtitle Workshop XS-Edition.

Ohjelman asennus on helppoa. Lataa ohjelma yllä olevasta linkistä ja pura paketti koneellesi. Tämän jälkeen käynnistä asennusohjelma ja seuraa ohjeita. Ohjelman kielen voi vaihtaa myös asennuksen jälkeen. Tämä ohje on tehty englanninkieliselle versiolle, koska omasta mielestäni suomenkielinen käännös on... Lopuksi on vielä hyvä käydä asetuksista (alt-s) asettamassa oletusformaatiksi MicroDVD (kohdassa formats) sekä ottamassa automaattinen tallennus käyttöön (kohdassa save).

Videotiedosto koostuu peräkkäisistä kuvista (frame), joita toistetaan tietyllä nopeudella (frame-rate, kuvaa/sekunti, frames per second, FPS). Yleisimmät FPS arvot ovat 23,976 ja 25 kuvaa sekunnissa. Tässä ohjeessa käytetty MicroDVD-formaatti käyttää perusyksikkönä framea, joten tiedoston alussa on rivi joka kertoo käytetyn frame-raten.


Perustoiminnot

Ohjelma käynnistyy tekstitystiedostoa (.sub) klikkaamalla ja samalla käynnistyy samanniminen videotiedosto, mikäli sellainen löytyy samasta hakemistosta. Kannattaa tarkistaa, että tummennetulla viivalla olevat tekstityksen alku- ja loppuajat vastaavat ruudun vasemmassa alareunassa olevia (kuvassa show 994 ja hide 1074). Ohjelmaan jää joskus kummittelemaan edellisen tiedoston frame rate, joka saattaa hankaloittaa työskentelyä. Ongelmasta selviää käynnistämällä ohjelman uudelleen.


Ohjelman pääikkuna.

Ohjelman ulkoasun voi muokata haluamakseen, mutta se näyttää likimain yllä olevan kuvan mukaiselta. Vasemmalla määritellään käytetäänkö yksikkönä ruutuja (frames) vai aikaa (time). FPS arvot tulevat automaattisesti tekstitystiedoston ensimmäiseltä riviltä. Mikäli videon esikatseluikkuna ei näy, saa sen näkyviin painamalla ctrl-q. Videokuvan alla on navigointipalkki, jonka alla pikanäppäimet yleisimpiä toimintoja varten. Ruudun alalaidassa näkyy muutama rivi tekstityksiä ja aivan alimpana työskentelyn kohteena oleva rivi. Vasemmalla ovat ajoituksen säätämiseen tarvittavat kolme kenttää: näytä (show), piilota (hide) ja kesto (duration). Oikealla varsinainen tekstitys, jonka yläpuolella merkkimäärä.

Muutama hyödyllinen pikanäppäin:

  • shift-enter - siirtyy seuraavalle riville, ctrl-enter - siirtyy edelliselle riville (koko rivin teksti valittuna)
  • ctrl-space - tauko/toisto (videon ollessa käynnissä)
  • ctrl-d - muuttaa kaikkien tai vain valittujen rivien ajoitusta (eli siirtää näkymishetkeä aikaisemmaksi tai myöhäisemmäksi)
  • ctrl-e - suorittaa älykkään rivinvaihdon (rivi katkeaa sopivasta kohdasta ja ylimääräinen välilyönti poistuu)
  • ctrl-k - yhdistää kyseiset rivit (kaksi tai useampi rivi valittuna)
  • ctrl-s - tallentaa tiedoston (myös automaattinen tallennus kannattaa pitää päällä eikä varmuuskopiostakaan ole haittaa)
  • ctrl-i - suorittaa OCR-tarkastuksen (tästä lisää myöhemmin)
  • ctrl-l - pidentää ja lyhentää kestot määrättyjen rajojen sisälle (ei kuitenkaan pidennä kestoja seuraavan tekstin päälle)
  • alt-z repliikin alussa ja alt-x repliikin lopussa luo uuden rivin, joka saa valitut alkamis- ja päättymisajat (tämä saattaa joskus luoda rivin väärään paikkaan)
  • alt-c määrittää repliikin alkamisajan ja alt-v päättymisajan videon sen hetkiseen kohtaan (ei siis luo uutta riviä)
  • ins - uusi rivi valitun rivin jälkeen (shift-ins valittua riviä ennen)
  • ctrl+shift+h - siirtää tekstityksen pari framea taaksepäin ja ctrl+shift+n eteenepäin (tarkalleen 100 ms)

Pikanäppäimiä voi tarkastella (ja halutessaan myös muokata) shortcuts.key nimisestä tiedostosta. Myös yleisesti tunnetut pikanäppäimet toimivat (ctrl-c kopioi, ctrl-x leikkaa, ctrl-v liittää ja ctrl-z peruuttaa... ja shift-ctrl-z peruuttaa peruutuksen). Pikanäppäimiä voi muokata haluamakseen muokkaamalla shortcuts.key nimistä tiedostoa.

Ohjelmassa on myös erillinen käännöstila (translator mode), johon päästään painamalla ctrl-u. Tällöin tekstitysalue jakautuu kahteen sarakkeeseen, joista vasemmalla on alkuperäinen ja oikealla käännetty tekstitys. Sarakkeet voi vaihtaa keskenään shif-ctrl-w näppäinyhdistelmällä. Käännöstilassa voi hyödyntää ohjelman mukana tulevia pascal-skriptejä Delete subtitle (only from translation) ja Insert subtitle (only from translation) Toimintojen pikanäppäimet (shif-ctrl-[1..5]) riippuvat asennettujen skriptien määrästä ja ne voi katsoa valikosta Tools - Pascal scripts.

Ohjelma osaa käyttää suoraan myös MSWordin oikolukutoimintoa (F7), mutta mikään ei tietenkään korvaa ihmisen tekemää tarkastusta. Mikäli käytössä ei ole oikolukua, jonka ohjelma tunnistaa, voi tekstin "viedä" normaaliin tekstinkäsittelyohjelmaan seuraavasti. Valitaan Save as ja painetaan näppäintä Custom formats, jonka jälkeen eteen tulee alla oleva kuva.


Ajastus- ja rivitysinformaation poistaminen tekstitystiedostosta.

Tämän jälkeen annetaan tiedostomuodolle nimi ja pääte (teksti ja *.txt) sekä poistetaan oikeasta ruudusta kaikki muu paitsi mitä yllä olevaan kuvaan on jätetty. Lisäksi laitetaan välilyönti kohtaan New line char sekä tyhjennetään kohta Structure. Lopuksi painetaan Save! ja ohjelma kysyy tiedoston nimeä sekä tallennuskansiota. Eli toimenpide poistaa tekstitystiedostosta kaikki ajastus- ja rivitystiedot ja tallentaa tiedoston tekstitiedostona (.txt).


Tekstin ulkoasu ja ajoitukset  top

Tekstitys näyttää hyvältä seuraavien ehtojen täyttyessä (lukuarvot on 25 frame ratelle):

  • Tekstiruudun minimikesto 2 sekuntia (2000ms - noin 50 framea). Lyhyissä lausahduksissa tosin riittää pienempikin kesto, esim. reilu 1,5 sekuntia (noin 40 framea)
  • Maksimikesto 8 sekuntia (8000ms - noin 200 framea). Yleensä jo yli 6 sekunnin pituiset tekstiruudut on syytä jakaa kahteen osaan.
  • Kahden ruudun välissä noin 4 framea. Tämä on tarpeen, jotta tekstitys olisi yhteensopiva mahdollisimman monen soittimen kanssa. Tämä onnistuu helposti XS-editionin mukana tulevan 4 frame gap -skriptin avulla.
  • Rivin pituus korkeintaan 50 merkkiä. Tämän yli menevät rivin pituudet saattavat joillain katsojilla karata ruudun reunojen ulkopuolelle.
  • Yli 40 merkin mittaiset rivit jaetaan kahdelle riville. Tämä on lähinnä mukavuuskysymys, mutta tekee tekstityksestä helpommin seurattavaa.
  • Kahden henkilön puhuessa saman ruudun aikana tulee molempien vuorosanojen eteen repliikkiviiva '- '. Tämä myös silloin kun lause jatkuu edellisestä ruudusta. (Televisiossa on käytössä tapa, jossa vain jälkimmäisen puhujan vuorolauseen eteen laitetaan repliikkiviiva)
  • Repliikkejä ei ole pakko sijoittaa omille riveilleen, mikäli toinen repliikeistä on lyhyt lausahdus.
  • Mikäli puhe jatkuu seuraavaan tekstitysruutuun ilman, että välissä on piste, merkitään ensimmäisen ruudun loppuun viiva ja jatketaan seuraavasta ruudusta pienellä kirjaimella.

Tekstiruuduista puhuttaessa käytetään yleisesti myös riviä, jolloin yksi rivi tekstitystä voi siis koostua kahdesta rivistä tekstiä. Tämä aiheuttaa joskus pientä sekaannusta. Esimerkiksi alla olevassa kuvassa on tekstitysrivillä 12 kaksi riviä tekstiä.


Suositukset tekstityksen ulkoasulle ja kestolle.

Muutama esimerkki huonosta ja hyvästä ulkoasusta:

Ei näin Vaan näin
Onko sinulla kelloa?
- Onhan minulla.
- Onko sinulla kelloa?
- Onhan minulla.
- Sinulla on siis kello, mutta olet liian näsäviisas kertoaksesi ajan?
- Aivan.
- Sinulla on siis kello, mutta olet liian näsäviisas
kertoaksesi ajan? - Aivan.
ruutu 1:
Ja koska jatkat viisasteluasi pistän sinulle
betonitennarit jalkaan ja...
ruutu 2:
...tyrkkään Kolera-altaaseen.
- Siitä vain.
ruutu 1:
Ja koska jatkat viisasteluasi pistän sinulle
betonitennarit jalkaan ja - 
ruutu 2:
- tyrkkään Kolera-altaaseen.
- Siitä vain.

Ajoituksia säätäessä on tärkeää, että teksti tulee näkyviin puheen alkaessa ja katoaa näkyvistä hieman suun mentyä suppuun. Tuplaklikkaamalla riviä siirtyy toisto automaattisesti kyseiseen kohtaan ja ajastuksen oikeellisuus on helposti huomattavissa. Tuplaklikkaamalla shift pohjassa päästään sekuntia edeltävään hetkeen (tämä on muutettavissa asetuksista).

Tekstin ulkoasun ja ajoitusten tarkastaminen onnistuu näppärästi ohjelman OCR-tarkastuksen avulla. Erillisessä OCR-tiedostossa (OCR-script) voidaan listata myös yleisimmät kirjoitus- ja muotovirheet, ja alla olevien asetusten avulla voidaan määrittää myös kestojen sekä rivinpituuksien tarkastaminen.

Tarkastaminen aloitetaan painamalla ctrl-i, jonka jälkeen seuraa pieni viive ja eteen tulee seuraavanlainen ikkuna.


Information and errors (ctrl-i). Tarkastuksen tuloksena kolme liian lyhyttä kestoa.

Tarkistamisen jälkeen virheet näkyvät punaisella siihen asti kunnes tarkistus suoritetaan uudelleen. Yksittäisen virheen kohdalle pääsee tuplaklikkaamalla kyseistä virheilmoitusta ja seuraava virhe löytyy näppäimellä F12.


Asetukset  top

Tarkastuksen asetuksia pääsee muokkaamaan yllä olevan kuvan Settings näppäimestä tai painamalla alt-i. Kaksi ensimmäistä välilehteä sisältävät kaikkein tärkeimmät kohdat. 

General - Yleiset asetukset

Ensimmäisellä välilehdellä määritellään lähinnä miten löytyneet OCR-virheet näytetään ja mitä OCR-tiedostoa käytetään. Tärkeintä tässä kohdassa on varmistaa, että käytössä on OCR Script: xvidsubs_OCR_v1.0 (tai mahdollisesti tuoreempi versio).

Advanced - Lisäasetukset

Tällä välilehdellä tehdään kaikkein tärkeimmät säädöt. Keskeisin kohta on liian lyhyt kesto (too short duration), joka on ehkä kaikkein yleisin OCR-virhe.

Tässä yhteydessä määritellään myös suurin sallittu kesto (too long duration) sekä suurin sallittu rivin pituus (too long line)

Välilehdellä määritellään myös merkit, joiden toistuminen useamman kerran peräkkäin aiheuttaa virheen (repeatable characters) sekä kokonaan kielletyt merkit (prohibited characters).

Väli ennen merkkejä (Space after characters) määrittää merkit, joiden jälkeen ei sallita välilyöntiä ja Väli merkkien jälkeen (Space before characters) merkit, joita ennen ei sallita välilyöntiä.

Jos tarkkoja ollaan niin liian lyhyt kesto tulisi asettaa arvoon 1999ms, koska nyt 2000ms kesto aiheuttaa OCR-virheen... mutta yksi frame on noin 4 millisekunta eikä yhden framen kestoa huomaa, joten :)

Check for - Tarkistettavat kohdat

Välilehdellä määritellään ne kohdat, jotka tekstityksestä tarkastetaan. Tämän voi yleensä jättää ennalleen.

Tässä on jätetty rastittamatta kohdat Spaces after custom characters sekä Spaces before custom characters, joten edellisellä välilehdellä olevia merkkejä (- ja !?) ei huomioida. Nämäkin voi rastittaa, mutta tällöin kannattaa ainakin väliviiva poistaa edellisen välilehden asetuksista.

Fix - Korjattavat kohdat

Välilehdellä määritellään ne kohdat, jotka tekstityksestä korjataan. Suositeltavaa on tarkistaa ja korjata mahdolliset OCR-tarkistuksen ilmoittamat virheet käsin.

Unnecessary spaces - Tarpeettomat välilyönnit.

Viimeisellä välilehdellä määritellään, miten ja missä yhteyksissä tarkastellaan ylimääräisiä välilyöntejä. Ylemmässä ruudussa on listattu tarkastuksen yhteydessä mukana olevat kohdat ja alemmassa vastaavasti korjauksen yhteydessä korjattavat.

Suomalainen tapa käyttää numeroissa tuhat-erottimena välilyöntiä aiheuttaa virheilmoituksen, mikäli kohta 'Spaces between numbers' on rastittuna.

Asetukset on yleensä tarpeen laittaa kohdalleen vain kerran, mutta toki joskus tulee eteen tilanteita joissa on syytä hieman "löysätä" esimerkiksi minimiksestoa 40 frameen ja korjata vain ne pahimmat kohdat. Tällöin on hyvä muistaa säätää asetukset ennalleen.


Tekstityksen uudelleen ajoittaminen  top

Monesti tekstitykset eivät ole kohdallaan vaan ne tulevat joko edellä tai jäljessä. Tällöin ctrl-d näppäimellä voidaan siirtää kaikkia tai valittuja rivejä haluttu määrä, kunnes tekstitykset tulevat kohdallaan. Mikäli tekstitys tuntuu elokuvan edetessä valuvan yhä kauemmaksi oikeasta kohdasta, on video- ja tekstitystiedostossa todennäköisesti eri frame rate. Tällöin ajoituksen voi säätää kohdalleen joko yksinkertaisesti vaihtamalla oikeasta laidasta sopiva FPS-arvo ja tallentamalla tiedosto uudella nimellä (ks. myös seuraava luku). Kuitenkin ehkä helpoin tapa on saada tekstit kohdalleen on painaa ctrl-b ja antaa ensimmäisen ja viimeisten puhutun (ja tekstitetyn) repliikin kohta. Kohdat voi määritellä etukäteen myös näppäimillä ctrl-1 ja ctrl-2.


Tekstitysten synkronointi

Useamman tiedoston frame raten muuttaminen kannattaa tehdä eräajona (batch convert), joka selviää seuraavasta.


Eräajo  top

Monet DVD-soittimet ja muut mediasoittimet eivät tue kaikkia tekstitysformaatteja, joten joskus saattaa tulla tarvetta muuntaa esimerkiksi MicroDVD-formaatin (.sub) tekstitykset SubRip-formaattin (.srt). Tällöin toiminto nimeltään eräajo (batch convert) voi osoittautua näppäräksi.

Toiminto käynnistetään tools-valikosta tai painamalla ctrl-m, jonka jälkeen määritellään kansio, mistä tekstitystiedostoja haetaan sekä mihin ne konversion jälkeen tallennetaan. Tämän jälkeen valitaan vielä tallennusmuoto ja oikea FPS. Videotiedostojen ominaisuuksia voi selvitellä mm. ilmaisella G-Spot nimisellä apuohjelmalla.

Tämän jälkeen oikeanpuoleisessa kuvassa voidaan vielä lisätä ja poistaa tiedostoja käännettävien listalta. Lopuksi painetaan Convert ja homma on valmis.


Useammankin tekstitystiedoston muokkaaminen onnistuu käden käänteessä.

Eräajolla onnistuu toki myös yksittäisten tekstitystiedostojen frame raten muuttaminen sen enempää kuvaan tutustumatta.


Vinkkejä ja bugeja  top

Ohjelma saattaa joskus jättää viimeksi auki olleen tiedoston frame raten kummittelemaan uudessa tiedostossa. Tämän voi huomata valitsemalla rivin ja vertailemalla alkamis- ja päättymisaikoja valinnan ja sivun alalaidan arvojen välillä. Mikäli ne poikkeavat toisistaan, voi ongelman ratkaista yksinkertaisesti käynnistämällä ohjelman uudelleen. Mikäli olet jo ehtinyt tekemään muutoksia, ne tallentuvat toki aivan oikein.

Joidenkin vanhempien FFDshow-versioiden kanssa Subtitle Workshop saattoi kaatua esimerkiksi internet-selaita käynnistäessä. Itselläni on  22.12.2005 päivätty versio, jossa bugi ei esiinny. Uusin versio on ladattavissa täältä.

Rivien yhdistämisen (ctrl-k) jälkeen peruuta-toiminto jättää molempiin riveihin saman päättymisajan. Tämä on korjattava käsin, muuten jälkimmäinen rivi jää kokonaan näyttämättä.

Mikäli tiedät ohjelmaan liittyviä vinkkejä tai bugeja, tai haluat vain muuten antaa palautetta, pistä ihmeessä mailia.

top


Tekstityksiä on räpläilty 01.03.2021.