Sain ajatuksen, että skannaisin ja muuntaisin OCR:llä Runo-Eddan tekstin raakatekstiksi. Tää on kyllä ainakin kotikonstein aika toivotonta.
Kokeilin noin seitsemää avointa OCR-ohjelmaa. Paras niistä oli Tesseract, joka pystyi tuottamaan seuraavan (jos annoin valmiiksi oikeaan kohtaan leikatun ja oikein päin käännetyn sivun):
NÄKIJÄTTÄREN ENNUSTUS 1. Pyydän: kuulkaa, pyhät heimot, Heimdallrin ylemmät ja alemmat pojat, sinä tahdot, Valfödr, itä tulkitsen taiten mitä ihmisten muinais- vaiheista muistan. Vn e kasvoin ammoin; juurta, jalon maailmanpuun mullan alla. 3. Aikojen alussa. Ymir eli, ci hiekkaa, i vettä, ei viileää merta, i maata oll ci taivasta yllä oli suunnaton kita, oi kasvanut ruoho. 4. Kunnes Borrin pojat w
Asiallista, mutta puolet tekstistä puuttuu.
Pahin oli ChatGPT, joka osasi kyllä esikäsitellä sivun mutta laittoi tekstiin puolet omiaan:
Kuva on sivu kirjasta, ja teksti on suomea. Se on kuvattu sivuttain, joten käännän sen oikein päin mielessäni ja luen sisällön. Oikeanpuoleinen sivu (otsikko) NÄKIJÄTTÄREN ENNUSTUS 1. Pyydän, kuulta, Päivästä, paistajalta, Hedelmällisiltä, ylenmäärin jyviä kasvavilta vainioilta, että tulkiset taiten ennustuksen, jonka vanhassa muistissa muistan. 2. Muinaisnyssyt ainioista ajoista kasvoi ammoin oksalta omenapuun pyhä hedelmä, puun yhdeksän juurta, yhden oksan alta. 3. Alueissa Ymin eli ja veti ilmaa suustansa, siitä kasvoi suuri voima, oli suunnaton kanto. 4. Kunnes Börnin pojat (Sivu katkeaa tähän.)
Tällaisen tekstin tarkastaminen on ihan sairaan hidasta.
Mutta siis: jos pitää skannata sivu kerrallaan, leikellä kuvankäsittelyohjelmalla ja vielä korjata OCR-ohjelman kirjoitusvirheet niin tää ei oo kyllä tapahtumassa.
Pieni valonpilkahdus! Osoittautuu, että Unix-työkaluilla pystyn ainakin kääntämään ja siistimään sivut automaattisesti:
$ scanimage > 1.pnm $ convert -rotate 90 1.pnm 1-kaan.pnm $ unpaper 1-kaan.pnm 1-kaan-korj.pnm $ tesseract -l fin 1-kaan-korj.pnm out
Tämän tulos ei ole ainakaan huonompi, se osaa jopa pitää sivut erillään:
main vastakkaisuus, heidän keskinäiset kilpailunsa ja tähtelunsa. On voima ja vastavoima, joiden välinen jän- nitys on alati tunnettavissa. Jumalat tietävät lopullisen tuhonsa, mutta he eivät epäröi: he ovat valmiit kamp- pailemaan viimeiseen asti. Pohjoinen mytologia kuvas: taa urhean rodun taistelevaa elämänasennetta. Sen hen Ehkäpä Edda juuri siksi on sittenkin yhtenäinen epa? Suomennoksen pohjana om alkukiinen teksti Fin nur Jönssonin, Olfur Briemin ja Jön Helgasonin edit na, ota olen vertaillen käyttänyt. Tulkinnan jal i taloa jät ajan apua erikielisiä EN Gan laitoksista. Olen yrittänyt myös perehtyä Pohjolan mytologiaan uskontdieteilijäin vulla. Ennen kaikkea on. SIEL Vriyvälina dä Altemanisee Ralgimsgchihe. Saman tekijän etymola- pre utkimukse ovat nimiluettloni pohjan. piäonkk=i Mafia Hakalan GNSS syötän ja antanut minulle arvokasta asianuntija-apun. S kara Helsingissä 10. päivänä toukokuuta 1982. Aale Tynni NÄKIJÄTTÄREN ENNUSTUS 1. Pyydän: kuulk pyhät heimot, Heimdallrin ylemmät ja alemmat pojat, sinä tahdot, Valfödr, eitä tulkitsen taiten mitä ihmisten muinais- vaiheista muistan. Muinaissyntyise. jätit muistan, joiden keskellä. kasvoin ammoin; yhdeksän maailmaa, puun yhdeksän juurta, jalon maailmanpuun mullan alla. Aikojen alussa. Ymir eli, ci hiekkaa, ei vettä, ci viileää merta, ei maata ollut, ci taivasta yllä; oli suunnaton ki ei kasvanut ruoho. 4. Kunnes Borrin pojat. M