TTA-hanke tuottaa monenlaisia tuloksia. Yksi olennaisimpia tuloksia on suositus siitä, miten tutkimusaineistoja kuvaillaan, eli minkälaisia metatietoja tutkimusaineistoille tuotetaan, jotta tieto olisi paremmin löydettävissä, ymmärrettävissä ja käytettävissä uuteen tutkimukseen. Tällä saralla ensimmäisiä tuotoksia on TTA-hankkeen minimimetatietomalli, jossa on määritelty kaikille tutkimusaineistoille yhteiset vähimmäismetatiedot riippumatta aineistotyypistä, tieteenalasta tai tuotantotavasta.
-- kirjoitettu: tiistai 12. maaliskuuta 2013, 14.21 -- viimeisin muutos: perjantai 12. huhtikuuta 2013, 11.05
TTA-minimimetatietomalli on suositus kaikille aineistoille kartoitettavista vähimmäismetatiedoista. Tällaisten suositusten täytyy tasapainotella kahden äärimmäisyyden välillä: liian laaja suositus tekee aineistojen kuvailusta raskasta ja vaativaa, mutta liian suppea suositus rajaa eri aineistojen yhteismitallisen tiedon niin pieneksi, ettei kerättyä metatietoa pysty enää kunnolla hyödyntämään. Uusien metatietojen hyödynnettävyyden lisäksi on otettava huomioon valmiiksi tarjolla olevat tietovarannot. On paljon parempi tuottaa minimimetatietomallissa vaaditut tiedot automaattisesti jo olemassa olevista metatietovarannoista kuin tuottaa kaikki käsin. Jos metatiedot pystytään tuottamaan automaattisesti muuntamalla olennaiselle osalle olemassa olevia tutkimusaineistoja, saadaan paljon nopeammin kerätyksi kansallinen, koko tutkimuskentän kattava kuva käytettävissä olevista aineistoista.
Minimimetatietomallin kehittämisen lähtökohtina ovat toimineet toisaalta laajasti käytetyt kuvailustandardit, kuten Dublin Core ja sen yleisimmin käytetyt kentät, toisaalta nyt syntymässä olevat avoimet aineistokatalogit, kuten kansainvälinen The Data Hub ja paikallisella tasolla esim. pääkaupunkiseudun Helsinki Region Infoshare. Minimimetatietomalli ei pyri määrittelemään kaikkia hyödyllisiä tutkimusaineiston kuvailuun soveltuvia metatietoja, vaan sellaisen välttämättömän minimin, jota ilman aineiston uudelleenkäyttö on vaikeaa.
Näin saavutettu pakollisten metatietojen joukko on seuraava:
metatietomallin kentät
Metatietoelementti mihin tarvitaan
* aineiston sisällön
tunnistamiseen yleisellä
Aineiston nimi (ja tasolla
nimen kieli) * aineistoviittauksiin
tieteellisissä
artikkeleissa
* aineistoviittauksiin
tieteellisissä
Toimija: tekijä(t) artikkeleissa
* toisiinsa liittyvien
aineistojen löytämiseen
* aineiston saatavuuden
Käyttöehdot ja uudelleenkäytön
arviointiin
* aineiston
Aineiston kieli ymmärrettävyyden
arviointiin
* aineiston sisällön
tunnistamiseen yleisellä
Aiheet (eli asiasanat) tasolla
* toisiinsa liittyvien
aineistojen löytämiseen
* samaan aineistoon
kohdistuvien metatietojen
Aineiston (versioon tunnistamiseen
liittyvä) tunniste * aineistoviittauksiin
tieteellisissä
artikkeleissa
* aineiston version
yksiselitteiseen
Muokkaamisaika tunnistamiseen
* aineiston etsimiseen
tuoreuden perusteella
Jakelijan yhteystieto:
nimi (ja nimen kieli)
Jakelijan yhteystieto: * aineistoon liittyvien
sähköpostiosoite kysymyksien ja
Jakelijan yhteystieto: ongelmatilanteiden
puhelinnumero selvittämiseen
Jakelijan yhteystieto:
kotisivu
* metatiedon eri
Metatiedon tunniste versioiden ja
duplikaattien
tunnistamiseen
Metatiedon * ajantasaisimman
muokkaamisaika metatiedon löytämiseen
* edellytetään vain
"uusille" aineistoille
Toimija: aineiston * projektin tuotosten
tuottanut projekti ja seuraamiseen
projektin rahoittaja(t)* tutkimuksen
läpinäkyvyyden
takaamiseen
* edellytetään vain
"uusille" aineistoille
Toimija: omistaja * aineiston
uudelleenkäyttöehtojen
selkeyttämiseen
Tässä listassa on eräs näkymätön asia, joka saattaa yllättää "perinteisiin" metatietoihin tottuneita: melkein mitkään näistä metatiedoista eivät ole vapaamuotoista tekstiä. Itse asiassa vain aineiston nimi ja jakelijan nimi ovat vapaamuotoista tekstiä; lisäksi toimijoihin saa viitata nimillä, mikäli mitään muuta keinoa (yksiselitteistä tunnistetta tai viitettä) ei ole käytettävissä.
Mitä nämä metatiedot sitten ovat, jos eivät vapaamuotoista tekstiä? Toimijat, aiheet ja kielet ovat tunnisteita, jotka viittaavat auktoriteetti- ja yhteisötietokantoihin sekä käsiteontologioihin. Ajankohdat, käyttöehdot, tunnisteet ja yhteystiedot ilmaistaan määrätyssä muodossa. Minimimetatietomalli sisältää näistä kaikista tarkemmat suositukset.
TTA-metatietotyöryhmän työ jatkuu sanastosuositusten ja aineistotyyppikohtaisten suositusten parissa. Seuraavissa kirjoituksissani pyrin kuitenkin esittelemään tarkemmin minimimetatietomallin eri elementtejä.