(toiminnot)

hwechtla-tl: Metatiedot, osa 2: tta-minimimetatietomalli

Kierre.png

Mikä on WikiWiki?
nettipäiväkirja
koko wiki (etsi)
viime muutokset


TTA-hanke tuottaa monenlaisia tuloksia. Yksi olennaisimpia tuloksia on suositus siitä, miten tutkimusaineistoja kuvaillaan, eli minkälaisia metatietoja tutkimusaineistoille tuotetaan, jotta tieto olisi paremmin löydettävissä, ymmärrettävissä ja käytettävissä uuteen tutkimukseen. Tällä saralla ensimmäisiä tuotoksia on TTA-hankkeen minimimetatietomalli, jossa on määritelty kaikille tutkimusaineistoille yhteiset vähimmäismetatiedot riippumatta aineistotyypistä, tieteenalasta tai tuotantotavasta.

-- kirjoitettu: tiistai 12. maaliskuuta 2013, 14.21 -- viimeisin muutos: perjantai 12. huhtikuuta 2013, 11.05

TTA-minimimetatietomalli on suositus kaikille aineistoille kartoitettavista vähimmäismetatiedoista.  Tällaisten suositusten täytyy tasapainotella kahden äärimmäisyyden välillä: liian laaja suositus tekee aineistojen kuvailusta raskasta ja vaativaa, mutta liian suppea suositus rajaa eri aineistojen yhteismitallisen tiedon niin pieneksi, ettei kerättyä metatietoa pysty enää kunnolla hyödyntämään.  Uusien metatietojen hyödynnettävyyden lisäksi on otettava huomioon valmiiksi tarjolla olevat tietovarannot.  On paljon parempi tuottaa minimimetatietomallissa vaaditut tiedot automaattisesti jo olemassa olevista metatietovarannoista kuin tuottaa kaikki käsin.  Jos metatiedot pystytään tuottamaan automaattisesti muuntamalla olennaiselle osalle olemassa olevia tutkimusaineistoja, saadaan paljon nopeammin kerätyksi kansallinen, koko tutkimuskentän kattava kuva käytettävissä olevista aineistoista.

Minimimetatietomallin kehittämisen lähtökohtina ovat toimineet toisaalta laajasti käytetyt kuvailustandardit, kuten Dublin Core ja sen yleisimmin käytetyt kentät, toisaalta nyt syntymässä olevat avoimet aineistokatalogit, kuten kansainvälinen The Data Hub ja paikallisella tasolla esim. pääkaupunkiseudun Helsinki Region Infoshare.  Minimimetatietomalli ei pyri määrittelemään kaikkia hyödyllisiä tutkimusaineiston kuvailuun soveltuvia metatietoja, vaan sellaisen välttämättömän minimin, jota ilman aineiston uudelleenkäyttö on vaikeaa.

Näin saavutettu pakollisten metatietojen joukko on seuraava:

              metatietomallin kentät

  Metatietoelementti        mihin tarvitaan     

                       * aineiston sisällön     
                       tunnistamiseen yleisellä 
Aineiston nimi (ja     tasolla                  
nimen kieli)           * aineistoviittauksiin   
                       tieteellisissä           
                       artikkeleissa            

                       * aineistoviittauksiin   
                       tieteellisissä           
Toimija: tekijä(t)     artikkeleissa            
                       * toisiinsa liittyvien   
                       aineistojen löytämiseen  

                       * aineiston saatavuuden  
Käyttöehdot            ja uudelleenkäytön       
                       arviointiin              

                       * aineiston              
Aineiston kieli        ymmärrettävyyden         
                       arviointiin              

                       * aineiston sisällön     
                       tunnistamiseen yleisellä 
Aiheet (eli asiasanat) tasolla                  
                       * toisiinsa liittyvien   
                       aineistojen löytämiseen  

                       * samaan aineistoon      
                       kohdistuvien metatietojen
Aineiston (versioon    tunnistamiseen           
liittyvä) tunniste     * aineistoviittauksiin   
                       tieteellisissä             
                       artikkeleissa            

                       * aineiston version      
                       yksiselitteiseen         
Muokkaamisaika         tunnistamiseen           
                       * aineiston etsimiseen   
                       tuoreuden perusteella    

Jakelijan yhteystieto:                          
nimi (ja nimen kieli)                           
Jakelijan yhteystieto: * aineistoon liittyvien  
sähköpostiosoite       kysymyksien ja           
Jakelijan yhteystieto: ongelmatilanteiden       
puhelinnumero          selvittämiseen           
Jakelijan yhteystieto:                          
kotisivu                                        

                       * metatiedon eri         
Metatiedon tunniste    versioiden ja            
                       duplikaattien            
                       tunnistamiseen           

Metatiedon             * ajantasaisimman        
muokkaamisaika         metatiedon löytämiseen   

                       * edellytetään vain      
                       "uusille" aineistoille   
Toimija: aineiston     * projektin tuotosten    
tuottanut projekti ja  seuraamiseen             
projektin rahoittaja(t)* tutkimuksen            
                       läpinäkyvyyden           
                       takaamiseen              

                       * edellytetään vain      
                       "uusille" aineistoille   
Toimija: omistaja      * aineiston              
                       uudelleenkäyttöehtojen   
                       selkeyttämiseen          

 

Tässä listassa on eräs näkymätön asia, joka saattaa yllättää "perinteisiin" metatietoihin tottuneita: melkein mitkään näistä metatiedoista eivät ole vapaamuotoista tekstiä.  Itse asiassa vain aineiston nimi ja jakelijan nimi ovat vapaamuotoista tekstiä; lisäksi toimijoihin saa viitata nimillä, mikäli mitään muuta keinoa (yksiselitteistä tunnistetta tai viitettä) ei ole käytettävissä.

Mitä nämä metatiedot sitten ovat, jos eivät vapaamuotoista tekstiä?  Toimijat, aiheet ja kielet ovat tunnisteita, jotka viittaavat auktoriteetti- ja yhteisötietokantoihin sekä käsiteontologioihin.  Ajankohdat, käyttöehdot, tunnisteet ja yhteystiedot ilmaistaan määrätyssä muodossa.  Minimimetatietomalli sisältää näistä kaikista tarkemmat suositukset.

TTA-metatietotyöryhmän työ jatkuu sanastosuositusten ja aineistotyyppikohtaisten suositusten parissa.  Seuraavissa kirjoituksissani pyrin kuitenkin esittelemään tarkemmin minimimetatietomallin eri elementtejä.  


kommentoi (viimeksi muutettu 11.11.2014 15:29)