TTA-hanke tuottaa monenlaisia tuloksia. Yksi olennaisimpia tuloksia on suositus siitä, miten tutkimusaineistoja kuvaillaan, eli minkälaisia metatietoja tutkimusaineistoille tuotetaan, jotta tieto olisi paremmin löydettävissä, ymmärrettävissä ja käytettävissä uuteen tutkimukseen. Tällä saralla ensimmäisiä tuotoksia on TTA-hankkeen minimimetatietomalli, jossa on määritelty kaikille tutkimusaineistoille yhteiset vähimmäismetatiedot riippumatta aineistotyypistä, tieteenalasta tai tuotantotavasta.
* ([Tiedot käyttöön -blogi])
-- kirjoitettu: tiistai 12. maaliskuuta 2013, 14.21 -- viimeisin muutos: perjantai 12. huhtikuuta 2013, 11.05
TTA-minimimetatietomalli on suositus kaikille aineistoille kartoitettavista vähimmäismetatiedoista. Tällaisten suositusten täytyy tasapainotella kahden äärimmäisyyden välillä: liian laaja suositus tekee aineistojen kuvailusta raskasta ja vaativaa, mutta liian suppea suositus rajaa eri aineistojen yhteismitallisen tiedon niin pieneksi, ettei kerättyä metatietoa pysty enää kunnolla hyödyntämään. Uusien metatietojen hyödynnettävyyden lisäksi on otettava huomioon valmiiksi tarjolla olevat tietovarannot. On paljon parempi tuottaa minimimetatietomallissa vaaditut tiedot automaattisesti jo olemassa olevista metatietovarannoista kuin tuottaa kaikki käsin. Jos metatiedot pystytään tuottamaan automaattisesti muuntamalla olennaiselle osalle olemassa olevia tutkimusaineistoja, saadaan paljon nopeammin kerätyksi kansallinen, koko tutkimuskentän kattava kuva käytettävissä olevista aineistoista.
Minimimetatietomallin kehittämisen lähtökohtina ovat toimineet toisaalta laajasti käytetyt kuvailustandardit, kuten Dublin Core ja sen yleisimmin käytetyt kentät, toisaalta nyt syntymässä olevat avoimet aineistokatalogit, kuten kansainvälinen The Data Hub ja paikallisella tasolla esim. pääkaupunkiseudun Helsinki Region Infoshare. Minimimetatietomalli ei pyri määrittelemään kaikkia hyödyllisiä tutkimusaineiston kuvailuun soveltuvia metatietoja, vaan sellaisen välttämättömän minimin, jota ilman aineiston uudelleenkäyttö on vaikeaa.
Näin saavutettu pakollisten metatietojen joukko on seuraava:
{{{ metatietomallin kentät
Metatietoelementti mihin tarvitaan
* aineiston sisällön tunnistamiseen yleisellä Aineiston nimi (ja tasolla nimen kieli) * aineistoviittauksiin tieteellisissä artikkeleissa
* aineistoviittauksiin tieteellisissä Toimija: tekijä(t) artikkeleissa * toisiinsa liittyvien aineistojen löytämiseen
* aineiston saatavuuden Käyttöehdot ja uudelleenkäytön arviointiin
* aineiston Aineiston kieli ymmärrettävyyden arviointiin
* aineiston sisällön tunnistamiseen yleisellä Aiheet (eli asiasanat) tasolla * toisiinsa liittyvien aineistojen löytämiseen
* samaan aineistoon kohdistuvien metatietojen Aineiston (versioon tunnistamiseen liittyvä) tunniste * aineistoviittauksiin tieteellisissä artikkeleissa
* aineiston version yksiselitteiseen Muokkaamisaika tunnistamiseen * aineiston etsimiseen tuoreuden perusteella
Jakelijan yhteystieto: nimi (ja nimen kieli) Jakelijan yhteystieto: * aineistoon liittyvien sähköpostiosoite kysymyksien ja Jakelijan yhteystieto: ongelmatilanteiden puhelinnumero selvittämiseen Jakelijan yhteystieto: kotisivu
* metatiedon eri Metatiedon tunniste versioiden ja duplikaattien tunnistamiseen
Metatiedon * ajantasaisimman muokkaamisaika metatiedon löytämiseen
* edellytetään vain "uusille" aineistoille Toimija: aineiston * projektin tuotosten tuottanut projekti ja seuraamiseen projektin rahoittaja(t)* tutkimuksen läpinäkyvyyden takaamiseen
* edellytetään vain "uusille" aineistoille Toimija: omistaja * aineiston uudelleenkäyttöehtojen selkeyttämiseen
}}}
Tässä listassa on eräs näkymätön asia, joka saattaa yllättää "perinteisiin" metatietoihin tottuneita: melkein mitkään näistä metatiedoista eivät ole vapaamuotoista tekstiä. Itse asiassa vain aineiston nimi ja jakelijan nimi ovat vapaamuotoista tekstiä; lisäksi toimijoihin saa viitata nimillä, mikäli mitään muuta keinoa (yksiselitteistä tunnistetta tai viitettä) ei ole käytettävissä.
Mitä nämä metatiedot sitten ovat, jos eivät vapaamuotoista tekstiä? Toimijat, aiheet ja kielet ovat tunnisteita, jotka viittaavat auktoriteetti- ja yhteisötietokantoihin sekä käsiteontologioihin. Ajankohdat, käyttöehdot, tunnisteet ja yhteystiedot ilmaistaan määrätyssä muodossa. Minimimetatietomalli sisältää näistä kaikista tarkemmat suositukset.
TTA-metatietotyöryhmän työ jatkuu sanastosuositusten ja aineistotyyppikohtaisten suositusten parissa. Seuraavissa kirjoituksissani pyrin kuitenkin esittelemään tarkemmin minimimetatietomallin eri elementtejä.