(toiminnot)

hwechtla-tl: Metatiedot, osa 4: käyttöehdot, lisenssit ja suostumukset

Kierre.png

Mikä on WikiWiki?
nettipäiväkirja
koko wiki (etsi)
viime muutokset


Kun tietoa halutaan käyttää johonkin uuteen tarkoitukseen, on tietenkin tärkeää, että se on luvallista. Erityisesti on tärkeää pystyä jälkikäteen selvittämään, onko tietojen käyttö sallittua ja käyttämään luvallisuutta hakuehtona. Tässä kirjoituksessa tutustutaan joihinkin asioihin, jotka on syytä ottaa huomioon, jotta tietoja pystyisi jatkokäyttämään mahdollisimman helposti. Keskitymme jälleen kerran erityisesti tutkimusaineistoihin.

-- kirjoitettu: perjantai 24. toukokuuta 2013, 10.12 -- viimeisin muutos: perjantai 24. toukokuuta 2013, 10.12

Tutkimusaineistojen (kuten muidenkin aineistojen) käyttöehtojen dokumentoinnissa on kaksi erillistä kysymystä, jotka molemmat ovat riittävän laajoja saadakseen omat artikkelinsa:

  1. Minkälaiset käyttöehdot tutkimusaineistolla tulisi olla?
  2. Miten nämä käyttöehdot kannattaa merkitä muistiin?

Ensimmäinen kysymys on kulttuurillinen ja poliittinen ja siksi vaikeampi, joten annan siihen vain yhden näkökulman.  Jälkemmäinen on hyvin monimutkainen ja vaikea teknisluonteinen kysymys, johon esittelen muutamia vastauksia.

Minkälaiset käyttöehdot tutkimusaineistolla tulisi olla?

Tieteellistä tutkimusta tehdään koko yhteiskunnan ja ihmiskunnan hyödyksi, ja tutkimusaineistot ovat se peruspääoma, jolle tutkimuksen johtopäätökset perustuvat.  Joissain tilanteissa hyvin dokumentoitu, laadultaan varmennettu tutkimusaineisto on tutkimuksen pääasiallinen lopputulos, ja tieteellinen artikkeli tai monografia seuraa suhteellisen luontevasti aineiston perusteella havaituista seikoista.  Siksi ei ole mielestäni kohtuutonta, että tutkimusaineistojen pitäisi olla vähintään yhtä avoimesti saatavilla kuin niiden julkaisujen, joita aineistojen perusteella tuotetaan.  Useassa tapauksessa tutkimusaineistojen avaaminen on välttämätöntä, jotta tutkimustulokset olisivat toistettavissa ja vertaisten arvioitavissa.  Optimitilanne on se, jossa aineistoa pystyy sekä helposti ja esteittä jatkokäsittelemään että lähettämään alkuperäiseen aineistoon korjaus- ja täydennysehdotuksia: paras avoimuus on kaksisuuntaista, yhteistyötä.

Aineistojen avoimuus ei ole kuitenkaan ainoastaan moraalinen tai tutkimuseettinen kysymys, vaan usein myös hyvin käytännöllinen valinta.  Hyvin dokumentoitu, helposti uudelleenkäytettävä aineisto saa viittauksia, tulee säilytetyksi pidempään ja varmemmin, lisää tutkijan mainetta tieteenalallaan ja innostaa muita jakamaan muita aineistojaan, joita myös alkuperäisen aineiston tuottaja pystyy mahdollisesti hyödyntämään.  Tutkimusaineistojen kohdalla ei useinkaan pitäisi miettiä, miksi niitä pitäisi avata, vaan miksi ei pitäisi.  Hyvät tieteelliset käytännöt edellyttävät lähteiden paljastamista, joten aineiston käyttöä ei pitäisi hankaloittaa käyttöehtojen kaltaisilla teknisillä asioilla.  Tieteellsessä työssä keskustelu ja kommentointi on aina ollut se keino, jolla virheet löydetään, ei ennakkosensuuri tai pääsyn estäminen.

Laki vaikuttaa tutkimusaineistojen käyttöehtoihin useilla tavoilla: henkilötietolaki sanelee yksityisyyden rajat, julkisuuslaki koskee lähtökohtaisesti viranomaisaineistoja, patenttilaki kaupallisesti hyödynnettäviä keksintöjä, ja ennen kaikkea tekijänoikeuslaki liittyy kaikkeen luovaan toimintaan.  Tutkimusaineiston sisältämät faktat eivät sinänsä ole kerääjänsä teos eivätkä siten välttämättä tekijänoikeuksien alaisia ollenkaan, mutta luettelot ja tietokannat nauttivat omaa sui generis -suojaansa.  Tärkeintä lakien suhteen on ymmärtää, miten huolehditaan, etteivät ne_rajoita_ aineiston uudelleenkäyttöä.

Tekijänoikeusasioissa varmimman vakuuden uudelleenkäytön kannalta saa, kun lisensoi tutkimusaineistonsa mahdollisimman avoimella lisenssillä riippumatta siitä, kuinka suuri osa aineistosta on tekijänoikeuslain alaista.  Tällaisia avoimia lisenssejä ovat esim. (http://creativecommons.org/licenses/by/3.0/) CC nimeä -lisenssi ja (http://creativecommons.org/publicdomain/zero/1.0/) CC0-lisenssi.  Lisenssi tai linkki siihen kannattaa lisätä aineiston yhteyteen, jotta kaikki mahdolliset käyttäjät näkevät välittömästi, mitkä käyttöehdot heillä on aineistoon.

Riippumatta valitusta lisenssistä on tärkeää, että on tiedossa, kuka on aineiston _omistaja_ eli kuka hallinnoi tekijänoikeutta aineiston niihin tuotoksiin, jotka voidaan katsoa tekijänoikeuden tarkoittamaksi teokseksi.  Tekijänoikeuden haltija ja aineiston lisensointi kannattaa määrittää jo tutkimushankkeesta sovittaessa ja yleensä kannattaa huolentia, että oikeudet päätyvät jollekin pysyvälle oikeushenkilölle (esim. kotiorganisaatiolle tai tutkijoiden yhdistykselle) varsinkin tapauksissa, jossa tietoa tuotetaan hajautetusti monen toimijan kesken.

Tietosuoja- ja arkaluonteisuusasiat ovat monimutkaisempi kysymys.  Lähtökohtaisesti ihmisen henkilötietoja ei saa käsitellä ilman syytä, eikä arkaluonteisia henkilötietoja ollenkaan.  Kun suunnitellaan tutkimusta, jossa tarvitaan henkilöihin liittyviä tietoja, paras keino varautua tietosuojan vaatimuksiin on pyytää tutkittavilta erillinen lupa tietojen käyttöön ja jatkokäyttöön. Usein laajakaan käyttösuostumus ("hyväksyn tietojeni käytön ja yhdistelyn muihin tietolähteisiin tieteellisessä tutkimustarkoituksessa") ei karista montakaan prosenttia tutkittavista, joten laajaa käyttöoikeutta tietoihin kannattaa pyytää jo alusta alkaen.

Miten nämä käyttöehdot tulisi merkitä muistiin?

Laajoista käyttöoikeuksista on vähän iloa, jos ei pysty varmistumaan siitä, että aineistoa tosiaan saa käyttää.  TTA-minimimetatietomallissa (Metatiedot, osa 2: TTA-minimimetatietomalli) edellytetään käyttöehtojen dokumentoimista.  Käyttöehdot ovat niin keskeinen asia uudelleenkäytön kannalta, että myös aineistossa itsessään kannattaa dokumentoida lisenssi, sallitut käyttötarkoitukset ja muut rajoitukset.

Käyttöehdoissa pääsee ilman muuta helpoimmalla, jos valitsee aineistolleen tunnetun, laajassa käytössä olevan lisenssin.  Oman lisenssitekstin kirjoittaminen on työlästä ja virhealtista ja kuluttaa myös mahdollisen jatkokäyttäjän resursseja, sillä omien oikeuksien selvittäminen pitkistä lakiteksteistä vie hyvin paljon aikaa, varsinkin jos evaluoitavia aineistoja on paljon.  Paras tilanne on sellainen, jossa hyödynnettäviä tutkimusaineistoja etsivä tutkija pystyy helposti löytämään ne aineistot, jotka ovat hänelle käytettävissä.

Jos haluaa antaa aineiston jatkokäytölle ohjeita, niitä ei välttämättä kannata sekoittaa lakitekniseen lisenssiin vaan liittää ne ei-normatiivisena käyttöohjeistuksena tutkimusaineiston kuvaileviin metatietoihin.

Jotta tutkija pystyisi tehokkaasti etsimään käyttöehdoiltaan sopivia aineistoja, tiettyjä käyttöehtojen _piirteitä_ kannattaa liittää aineiston metatietoihin koneluettavassa muodossa.  Näistä piirteistä epäilemättä tärkein on lisenssin avoimuus, sillä avoin lisenssi on paras tae monipuolisesta uudelleenkäytettävyydestä.  Mutta suljetummillekin aineistoille esim. vakiintunut lupakäytäntö on hyvä indikaattori, että aineiston tosiaan pystyy saamaan käyttöönsä.  Niin ikään on hyvä tietää, jos aineiston uudelleenkäyttöön liittyy esim. lakiteknisiä rajoitteita.

Lisenssien ja käyttöoikeuksien kuvaamiseen on useita standardeja ja määrityksiä, kuten ORDL, METS Rights, CC REL ja XrML.  TTA-minimimetatiedoissa taas jaetaan aineistot seuraaviin luokkiin:

  1. Aineistot, joiden kaikista erityisoikeuksista on luovuttu (public domain -aineistot).
  2. Aineistot, jotka ovat muuten avoimen lisenssin alaisia.
  3. Aineistot, jotka ovat yhteisen, ei-avoimen lisenssin alaisia.  Tähän luokkaan kuuluvat esim. aineistot, joiden kaupallinen jatkokäyttö on kielletty.
  4. Aineistot, joiden käyttöoikeus muodostetaan käyttölupasopimuksella vakiintuneen käytännön mukaisesti.  Tähän luokkaan kuuluvilla aineistoilla on tyypillisesti sellaisia käyttörajoituksia, jotka liittyvät tietojen käyttötarkoitukseen, ja käyttöluvan saaminen riippuu tutkimusasetelmasta tai muusta vastaavasta.  Tähän luokkaan kuuluvat myös sellaiset aineistot, joiden käyttöön liittyy tietosuojarajoituksia.
  5. Aineistot, joiden käyttöä säätelee vain laki tai muu peruste.
  6. Aineistot, joilla ei ole vakiintunutta jakelukäytäntöä.  Tällaisia ovat lähtökohtaisesti kaikki aineistot, joiden käyttöehtoja ei ole tarkemmin määritetty.

Näiden metatietojen esittämiseksi TTA-minimimetatietomalli määrittää METS Rights -profiilin, jossa RightsDeclarationMD-elementin category-attribuuttia käytetään ilmaisemaan tätä yleistä luokitusta.

Käyttöehdoista olisi toki hyödyllistä merkitä koneluettavassa muodossa paljon muitakin tietoja.  Monilla aineistoilla on esimerkiksi niin kutsuttu embargo-jakso, jonka jälkeen vasta aineisto on yleisessä käytössä.  Dublin Core -metatiedoissa tämän pystyy ilmaisemaan Date.available-elementillä, mutta TTA-minimimetatietomalliin se ei sisälly.

Kun tutkitaan tutkimusaineistojen pitkäaikaissäilytysta (PAS), tulee yhä tärkeämmäksi merkitä kattavasti muistiin myös käyttöehdoissa tapahtuvat muutokset.  Tekijänoikeus vanhenee ja lakimuutokset saattavat vaikuttaa eri aineistojen käyttöehtoihin.  TTA-minimimetatietomallissa on kuitenkin pyritty vain saamaan aikaan luokittelu, joka vastaa kaikkein tyypillisimpiin aineistojen hakukäyttötapauksiin.

Yhteenveto

Mahdollisimman salliva ja avoin käyttöpolitiikka suo upeita mahdollisuuksia tietojen uudelleenkäytölle, tutkimuksen kumuloitumiselle ja tietovarantojen kehittämiselle yhteistyössä.  Valmiita toimintamalleja on jo olemassa ja myös lisensointikäytännöt ovat kehittyneet tarpeita vastaaviksi.  Käyttöehdot kannattaa määrittää selkeästi alusta alkaen ja dokumentoida huolellisesti.


Pikalinkit:


kommentoi (viimeksi muutettu 11.11.2014 15:39)