Julkaisuperiaatteet
Redigeringsprinciper

PÅ SVENSKA

Lena Huldén

Finlands medeltidsurkunder -lähdejulkaisun siirtäminen Diplomatarium Fennicum –tietokannaksi

Lähtökohtana Diplomatarium Fennicumille (DF) on ollut Finlands medeltidsurkunder (FMU) ja Åbo Domkyrkas Svartbok (Turun tuomiokirkon Musta kirja). Ensin FMU skannattiin ja tekstit siirrettiin tietokantaan. Kaikki tekstit tarkastettiin ja oikoluettiin. Kuitenkaan näin laajasta kokonaisuudesta kopioidusta tekstistä ei luultavasti koskaan tule täysin virheetöntä, vaikka paljon virheitä löydettiinkin. Epävarmoissa tapauksissa tietokantaa täytyy siksi aina verrata FMU:iin ja Mustaan kirjaan.

DF poikkeaa FMU:sta siinä, että tietokantaan on siirretty myös Turun tuomiokirkon Mustan kirjan sisältämät tekstit. FMU:ssa ne esiintyvät vain regestoina.

FMU:n ja Mustan kirjan asiakirjojen numerointi

FMU:n numerointi on lähtökohtana FMU:iin ja DF-tietokantaan tehtäville viittauksille. On kuitenkin muistettava, että FMU-numerot eivät ole täysin kronologisessa järjestyksessä. FMU:n viimeisessä osassa Hausen julkaisi asiakirjoja, jotka tulivat työn kuluessa hänen tietoonsa.

FMU-numerokentässä sijaitsevat ainoastaan nämä numerot. Mustan kirjan oma numerointi on annettu ja haettavissa lähdeviitekentässä. Mustan kirjan numeroiden etsiminen tehdään siis lähdeviitekentässä hakukomennolla ”Svartboken”. Kirjallisuudessa Mustan kirjan numerointiin liitetään usein lyhenne REA.

Leipätekstit

Leipätekstit koostuvat teksteistä, jotka löytyvät sekä FMU:sta että Mustasta kirjasta. Typografinen ulkoasu poikkeaa sitä vastoin jonkin verran painettujen lähteiden ja tietokannan välillä. Vanhassa painetussa typografisessa ulkoasussa esiintyy merkkejä, joita ei ole voitu muodostaa digitaalisesti. Nämä on korvattu # -merkillä ja numerolla. Tästä syystä tietokannassa on siis kaksi leipätekstivarianttia. Lähtökohtaisesti näytetään yksinkertaistettu teksti, jossa lyhenteiden määrää on vähennetty huomattavasti. Koska useimmissa tapauksissa yksinkertaisempi variantti on riittävä, on tarkoituksena ollut saada useimmiten esiintyviin lukutapoihin niin vähän lyhenteitä kuin mahdollista. Näissä varianteissa on Hausenin alkuperäiset kursivoinnit jätetty teknisistä syistä pois. Koska epävarmoissa tapauksissa voi olla tärkeää, että käyttäjä saa tarkemman kuvauksen alkuperäisestä skannatusta leipätekstistä, jossa alkuperäinen typografia, kuten lyhennykset on säilytetty, annetaan mahdollisuus saada klikkaamalla näkyviin tarkempi leipäteksti.

Regestat

Regestoista on kaksi varianttia. Standardina näytetään variantti, jossa oikeinkirjoitus on modernisoitu ja kaikki typografisten merkkien lyhenteet on poistettu. Jonkin verran vanhakantaisempi sanamuoto on säilytetty. Tarkoitus on ollut helpottaa hakuja materiaalista. Epävarmoissa tapauksissa käyttäjä voi klikkaamalla saada Hausenin sanamuodon näkyviin regestoissa.

Lähdeviitteet

Lähdeviitekenttä on myös toimitettu uudelleen ja modernisoitu. Tarkastaminen ja standardointi oli välttämätöntä, koska esimerkiksi useimmat lähdejulkaisujen nimet on kirjoitettu FMU:ssa monella eri tavalla. Mahdollisuuksien mukaan on Hausenin käyttämät lyhenteet poistettu ja korvattu lähdejulkaisun nimellä. Valitettavasti viittaus on joskus epäselvä eikä työtä ole siitä syystä voitu kaikin osin toteuttaa.

Hausenin alkuperäiset tekstit on säilytetty ja ne saa tarvittaessa klikkaamalla näkyviin.

Huomautukset

Huomautuksille on erityinen kenttänsä. Koska FMU ei ole johdonmukaisesti laadittu teos, ja huomautukset sijaitsevat joskus suoraan leipätekstin lopussa, joskus erillisinä, esiintyy tämä epäjohdonmukaisuus myös tietokannassa.

Kentässä oleva teksti on modernisoitu, mutta alkuperäinen teksti on myös säilytetty ja sen saa tarvittaessa klikattua näkyviin.

Päiväys ja hakumahdollisuudet

Tietokannassa on kaksi eri kenttäkokonaisuutta päiväystä varten. Vuosiluku, jonka Hausen antaa regestoissa, sijaitsee erityisessä kentässä. Kentässä on säilytetty sulkumerkit ja muut Hausenin käyttämät välimerkit.

Kronologisen haun helpottamiseksi on Hausenin päiväykset siirretty standardoituun kenttään, jossa vuosi, kuukausi ja päivä on kukin erotettuna toisistaan. Tämän johdosta voi periaatteessa myös hakea esimerkiksi asiakirjoja, jotka on päivätty tietyn päivän tai tietyn kuukauden mukaan, vuodesta riippumatta. Itsestään selvää on, että kaikkein yleisimpiä ovat luultavasti haut tietyn vuoden tai tiettyjen vuosien mukaan päivätyistä asiakirjoista.

Henkilö- ja paikannimihakemistot

Erilaisia nimihakemistoja yritettiin laatia projektille annetuissa puitteissa. Projektin ensimmäisessä vaiheessa pyrittiin tallentamaan kaikki asiakirjoissa esiintyvät henkilö- ja paikannimet. Nimet piti sekä standardoida että tallentaa alkuperäisessä muodossaan. Sen lisäksi yritettiin myös identifioida ne henkilöt, jotka mainittiin asiakirjoissa, mutta joita ei ollut mainittu nimeltä. Tätä kunnianhimoista tapaa tallentaa asiakirjoja ei kuitenkaan voitu rajoitettujen resurssien vuoksi toteuttaa käytännössä. Vain hyvin pieni osa asiakirjoista on tallennettu tällä tavalla, ja tallentaminen tässä muodossa lopetettiin huhtikuussa 2003. Näiden periaatteiden mukaan on tallennettu 7926 henkilönimitietoa ja 7843 paikannimitietoa.

Tallentamisen tehostamiseksi periaatteita yksinkertaistettiin kesästä 2003 lähtien. Kolmessa kuukaudessa voitiin silloin tallentaa vielä lisäksi 4697 henkilönimeä ja 4720 paikannimeä. Tuolloin tallennettiin vain ne henkilö- ja paikannimet, jotka esiintyivät FMU:n regestoissa. Hakemistoissa oli kuitenkin virheellisiä sivuviittauksia, minkä vuoksi ne oli tarkastettava. Vain standardoitu nimimuoto tallennettiin, koska alkuperäinen ortografia selviää alkuperäistekstistä. Paitsi etu- ja sukunimi sekä patronyymi ja aatelissuku tallennettiin identifiointitiedot siten, kuin Hausen oli ne alkuperäisissä hakemistoissa ilmoittanut. Valitettavasti tätäkään yksinkertaistettua tallentamistapaa ei ollut mahdollista toteuttaa loppuun hakemiston laatimiselle annetuissa puitteissa.

FMU:n osat II, III, V, VI ja VII eivät sisälly hakemistoon. Standardoidut henkilö- ja paikannimet ovat kuitenkin haettavissa myös näistä osista sillä rajoituksella, että ne esiintyvät regestoissa.

Paikannimet

FMU:n hakemistoissa ei paikannimien tarkennusta ole standardoitu, vaan se vaihtelee eri osien välillä. Tämä on vaikuttanut myös Diplomatarium Fennicumin hakemiston tallennuksiin. Esimerkkinä tarkennuksista ovat epiteetit: träsk, älv, råpunkt, gård, by, stad, slott, råd, socken, stift, domkapitel, ärkebiskop, biskop, domprosteämbete, gille, novgoroder, kloster, domkyrka, hospital. Tietyillä paikannimillä on useita tarkennuksia. Tallentaminen on tuonut myös mukanaan hankalia rajanvetoja, milloin on todella kysymys paikanilmauksesta tai milloin ilmiötä pitäisi pitää yhtenä Hausenin asiasanoista.

Standardoinnin lähtökohtana on pääasiassa käytetty teosta Svenska ortnamn i Finland. Koska karjalaiset paikannimet eivät enimmäkseen sisälly tähän teokseen, on niitä varten käytetty ruotsalaisia variantteja teoksesta Suomenmaa I-IX, Helsinki 1919-1931.

Henkilönimet

Henkilönimille luotiin omat standardimuodot (Katso erillinen luettelo). Latinalaiset muodot on säilytetty kirkollisilla virkamiehillä, munkeilla ja papeilla. Patronyymit on kirjoitettu samaan kenttään kuin etunimet, mutta niissä on säilytetty Hausenin ortografia.

Etunimikenttään on sisällytetty myös tietoa aatelissuvuista ja sukuvaakunoista. Nämä on ilmaistu sulkumerkkien sisällä. Pääperiaate on ollut erottaa identifiointitiedot nimitiedoista. Monissa tapauksissa ei sukunimeä ole voinut erottaa ammattinimikkeestä tai kotipaikan nimestä.