Kielenkäsittelyn kaksi puolta

hwechtla-tl: Kielenkäsittelyn kaksi puolta

Mikä on WikiWiki?
nettipäiväkirja
koko wiki (etsi)
viime muutokset

Luonnollisen kielen käsittelyä on perinteisesti hallinnut kaksi koulukuntaa, "söpöläiset" (neats) ja "röpöläiset" (scruffies). Samat puolueet on löydettävissä muiltakin asiaan liittyviltä tieteenaloilta, kuten tekoälystä ylipäänsä, kognitiotieteestä ja niin edelleen.

Ei ole täysin selvää, mitä kantoja eri puolet ajavat. Pikemminkin kyse on jonkinlaisesta asenne-erosta. Söpöläiset hyödyntävät ajattelun teorian, kielentutkimuksen (erityisesti kieliopin), logiikan ja semantiikan tutkimusperinnettä mallintaessaan ja käsitellessään kieltä, ja perustavat mallinsa tällaisiin pitkän tutkimuksen tuloksena oleviin teorioihin. Röpöläiset pyrkivät purkamaan kaikenlaiset ennakkokäsitykset ja pohjaoletukset kielen ja ajattelun rakenteista, ja rakentamaan mallinsa tilastollisten menetelmien ja itseoppivien järjestelmien päälle. Kielitieteelliset teoriat muodostetaan näiden mallien pohjalta, jos ne osoittautuvat toimiviksi.

Näiden kahden puolueen historia on pitkä taistelu, jossa söpöläismenetelmät ovat hiljalleen väistyneet röpöläismenetelmien tieltä. GOFAI-tutkimus oli jossain mielessä söpöläisyyden huipentuma, vaihe, jossa tietokoneet pantiin käsittelemään kieltä söpöläismenetelmin. Tämä toi nopeasti esiin söpöläismenetelmien ongelmat, ja 80-luvun puolivälistä 90-luvun puoliväliin kestänyt "AI winter" aiheutti sen, että nykyään söpöläismenetelmien mainitseminenkaan nostattaa skeptisten murinoiden myrskyn.

On totta, että söpöläisteoriat olivat varmasti väärässä kielen ja ajattelun perusrakenteesta. On helppoa osoittaa esimerkiksi, ettei todennäköisesti ole sellaista kielen "merkityssyvämuotoa", johon kaikki maailman erilaiset kielet olisi palautettavissa. Ylipäänsä söpöläisyyden kritiikki yleensä kohdistuu siihen, että söpöläismenetelmien pohjaoletuksina käyttämät rakenteet ja järjestelmät (kuten ensimmäisen asteen predikaattilogiikka) ovat aina jonkin verran mielivaltaisia ja rajaavat jossain mielessä kielenkäsittelyn paradigmaattista maailmaa.

Jotain mätää silti röpöläismenetelmissäkin on. Niiden perustavanlaatuinen työ on tehty yli 15 vuotta sitten, ja alkuperäisten menetelmien (kuten Markovin mallien, itseorganisoituvien karttojen, tilastollisten kontekstimallien, bayesiläisen luokittelun ja niin edelleen) jälkeen tutkimuksessa ei ole edetty juuri mihinkään. Itse asiassa röpöläismenetelmät ovat tuottaneet jopa vähemmän käyttökelpoisia (ja eritoten uudelleenkäytettäviä) tuloksia, ohjelmia ja formalismeja kuin parjatut söpöläistekniikat, vaikka valta-aikaa alkaa pikku hiljaa olla molemmilla saman verran luonnollisen kielen käsittelyn historiassa.

Vaikuttaa siltä, että röpöläispuoluetta vaivaa jonkinlainen peräänantamaton perfektionismi. Yritetään löytää oikeaa kielen ja ajattelun mallia, ja niin päädytään rakentamaan yhä yleisluontoisempia välineitä, joilla tietoa pystytään käsittelemään -- saamatta koskaan aikaan mitään erityisen hienoa tiedon käsittelyä. On havaittavissa eräänlainen "emergenssin paradoksi": tutkijat tekevät yhä vähemmän pohjaoletuksia sisältäviä järjestelmiä löytääkseen yhä edelleen juuri sellaisia asioita, joita aikoivatkin löytää ja saadakseen ohjelman oppimaan jotain, mitä aikoivatkin opettaa.

Tässä oikean kielen ja ajattelun mallin etsimisessä tuntuu unohdetun kokonaan, että söpöläisratkaisut, vaikkakin perustavanlaatuisesti vääriä, olivat toimivia ja käytännöllisiä. Sallikaa minun muistuttaa, että 70-luvun lopulla oli kehitettynä ohjelmia, jotka osasivat lukea tiettyjen aihepiirien englanninkielisiä lehtiartikkeleita ja tehdä niistä tiivistelmiä sekä parafraaseja useammilla kielillä. Lisäksi edelleen esikäsittelemme tietomme morfologisilla jäsentimillä, jotka perustuvat ennalta-asetettuihin kielen malleihin, ja puheentunnistuksemme käyttää tyypillisesti kohdemuotonaan jotain kirjoitettua kieltä muistuttavaa järjestelmää, joka on ennalta-asetettu malli puheen "rakenteesta".

Söpöläismallien muodittomuus on tärkeä syy siihen, miksi semantiikkaa ei tällä hetkellä vakavasti ottaen tutkita ollenkaan. Röpöläismenetelmissä ilmausten merkitys on ripoteltu nimettömien solmujen aktivaatiotasoihin, joiden toiminnan ymmärtäminen edellyttää erillistä työtä. Jos neuroverkko on niin iso, että siltä voisi edes periaatteessa odottaa jossain mielessä älykästä toimintaa, sen toiminnan ymmärtäminen on jo ihmiselle ylivoimainen tehtävä. Joskus ihmettelen, mihin näillä malleilla pyritään. Jos onnistumme tuottamaan älykkäitä vastineita tuottavan emergentin järjestelmän, mitä sillä teemme? Kysymmekö siltä, minkälainen käsitys sillä on omasta käsitejärjestelmästään? Onko näin saatu tieto jotenkin parempaa kuin ihmisten itsereflektiolla muodostamat teoriat kielen rakenteesta?

Itse asiassa ainoa 80-luvun puolivälin tutkimusongelma, joka on jonkin verran vielä hengissä, on arkitiedon kerääminen ja erityisesti ontologioiden rakentaminen. Epäilen, että ontologiat eivät ole kuolleet yksinkertaisesti siitä syystä, että niiden hyödyttömyyttä on vaikea osoittaa: suppeasta ontologiasta ei voi päätellä lavean ontologian hyödyllisyyttä eikä laveasta ole helppoa sanoa, mihin sitä sitten olisi tarkoitus käyttää. Jossain laajassa mielessä ontologioiden keräämisen kaltaiset megalomaaniset projektit olivat juuri se, mihin GOFAI-tutkimus kilpistyi. On olemassa vaara, että juuri ne tekniikat, joissa söpöläisyys tuotti hyviä tuloksia, vaipuvat historian unohduksiin asiantuntemuksen kadotessa maapallolta: luonnolliseen kieleen perustuva tietokoneen ja käyttäjän vuorovaikutus, päättely- ja oletusjärjestelmät, luonnolliseen kieleen perustuva tietohaku.

Toivon, että kielitieteilijät, loogikot ja kognitiotieteilijät alkaisivat pikku hiljaa tasapainottaa näitä kahta lähestymistapaa, tukeutua molempiin ja valita työtapansa tarpeen mukaan. Ehkä jossain vaiheessa saamme aikaan kauniin synteesin, jossa röpöläisanalyysin yleispätevyys yhdistyy söpöläisanalyysin jatkokäsiteltävyyteen.

kategoria: filosofia kategoria: kieli

kommentoi (viimeksi muutettu 05.09.2007 08:58)