Tämä on mielenkiintoinen ilmiö. Wikien häiriköintiin ei olisi kaupallista intressiä, jos sivulla olevat linkit olisivat vain sivulla olevia linkkejä. Nykyään linkit kuitenkin vaikuttavat siihen, mikä on niiden kohdesivujen PageRank Googlessa. Mitä suositumpi ja tärkeämpi sivusto on, sitä enemmän on hyötyä linkeistä, jotka osoittavat sieltä jollekin sivulle: kohdesivun PageRank lisääntyy sitä enemmän, mitä korkeampi-rank:inen sivu sinne linkittää.
Jotta wikien spämmäyksen linkeillä voisi saada kaupallisesti kannattavaksi, se on automatisoitava. Minun on vaikea kuvitella, miten kukaan voisi hyötyä sivustojen pagerankin nostamisesta niin paljon, että se olisi kannattavaa tehdä etsimällä ja muuttelemalla käsin erilaisia WikiWiki-sivustoja ympäri maailmaa. (Vastatieto: hakukoneoptimointifirmat ovat todistettavasti palkanneet halpatyövoimaa mm. Intiassa spämmäämään blogeja käsin. Tämä tosin ei edustane kovin suurta osaa spämmäyksestä ja kohdistunee ensisijaisesti arvostetuille sivustoille.)
Päivitys 24.11.2009: nykyinen spämmäystapa näyttää siltä, että lähinnä spämmääjillä on robotteja, jotka etsivät lomakkeita www:stä ja lähettävät niitä mainossisällöllä siinä toivossa, että niiden sisältö päätyy johonkin. En siis usko, että nykyään on kovin paljon wikeihin erikoistunutta spämmäystä, vaan yleistä lomakespämmäystä. Oman mielenkiintonsa asiaan tuo se, että spämmääjät yrittävät saada linkit toimimaan ja siksi käyttävät postituksissaan eri foorumien, wikien ja sähköpostiohjelmien linkkisyntakseja... (Jos lomakkeen lähettää sokkona, ei voi tietää, mihin sisältö päätyy.)
Päivitys 15.3.2010: Totesin, että melkein kaikki tämän wikin spämmäysyritykset kohdistuvat nykyään sen englanninkielisiin sivuihin. Jo aiemmin olin todennut, että spämmäystä ei tule nykyään enää muokkaustoiminnon kautta ollenkaan vaan kaikki spämmit tulevat kommentoinnin kautta. Lisäksi työtoverini oli todennut, että hänen blogiinsa tulee "karkeasti aiheeseen liittyvää" spämmiä, joka kuitenkin linkittää johonkin aiheeseen liittymättömään sivustoon. Näistä kaikista indikaattoreista teen seuraavan johtopäätöksen:
Monet spämmerit toimivat puoliautomaattisesti: he tekevät tietyn aihepiirin spämmäysyrityksen, jossa valitaan hakusana (esim. "Helsinki"), muodostetaan kyseiseen hakusanaan aihepiiriltään sopiva "kommentti", ja lähetetään se jokaisella www-lomakkeella, joka löytyy kyseisellä hakusanalla. Muokkaustoiminnon käytön loppuminen puoltaa tätä teoriaa, koska nykyään Google ei enää näytä muokkausnäyttöjä tähän wikiin osuvissa hakutuloksissa, vaan tarjolla on käytännössä aina artikkeli itse ja joko kommentointi- tai toiminnesivu.
Vanhat, asiaan liittyvät pohdinnat ja nettipäiväkirjaentryt:
Wikien automaattinen spämmäys on vaikeaa kahdesta syystä. Toinen on se, että wikit täytyy löytää; tämä vaikeus on sama kuin sähköpostispämmääjien vaikeus löytää toimivia sähköpostiosoitteita. Toinen vaikeus on taas muuntelu: eri wikit toimivat eri tavalla, joten sivujen sisällön muuttaminen vaihtelee wikeittäin. Tätä vastaavaa vaikeutta ei sähköpostispämmäyksessä ole.
Molempiin vaikeuksiin auttaa se, että wikit muistuttavat toisiaan kovasti. Melkein kaikissa wikeissä on tiettyjä sivuja, joilla on tunnettu nimi, kuten FrontPage, RecentChanges jne. Lisäksi suurin osa maailman wikeistä on muutamalla softalla toteutettu, kuten twikillä, Moinmoinilla ja muilla suosituilla wikitoteutuksilla.
Minulla on yksi wiki, joka on säästynyt spämmäykseltä kokonaan, koska se on täysin suomenkielinen eikä puhu wikeistä. Sitä ei siis yksinkertaisesti ole löydetty. Tässä wikissä on taas se etu, että sivujen päivitysparametrit ovat aivan poikkeukselliset. Olen myös pyrkinyt siihen, että vaikka joku kirjoittaisikin skriptin juuri tämän wikiversion automaattiseen spämmäykseen, kyseisen skriptin täytyisi kuitenkin kysellä vanhaa sisältöä jne., ts. nähdä ylimääräistä vaivaa.
Näyttää siltä, että joku käsin spämmää edelleen tätä wikiä. Ilmeisesti siis todellakin vaivalloinen käsin spämmääminenkin voi olla kannattavaa (tai joku luulee, että se on kannattavaa), vaikka minulle on kymmenen kertaa helpompaa poistaa spämmit kuin spämmääjille lisätä ne.
Se, että spämmäys kohdistuu nimenomaan tälle sivulle, antaa viitteitä siitä, että spämmääjä on suomalainen. Spämmäykset tehtiin viimeksi italialaisen palveluntarjoajan verkossa olevalta yksityiskoneelta.
Viime aikoina on tullut aika paljon wiki-väärinkäytöksiä, joita epäilen automatisoiduiksi: mahdollisesti joitain skriptejä, jotka säännöllisin väliajoin tallettavat jonkin wiki-sivun toteutuksen tunnetuilla parametreilla.
Tässä wikissä on epätavalliset talletusparametrit, joten lisäsin parametrien sanity checkejä; nyt jännätään, lopettaako tämä automatisoidut väärinkäytökset kokonaan. Minulla ei tavallaan ole niin kauheasti mitään niitä väärinkäytöksiä vastaan, jotka väärinkäyttäjät joutuvat tekemään käsin... Tietenkin poistan ne silti...
Ja tappelu jatkuu. Tällä kertaa tein rajoituksen, että sivun sisällöstä ei saa kerralla vaihtaa kaikkia (epätyhjiä) linjoja. Tästä on haittaa legitiimeille käyttäjille lähinnä uutta sivua perustettaessa.
Tulin myös siihen tulokseen, että hyökkäykset ovat enintään puoliautomaattisia.
Tulin näkemäni muokkauksen perusteella siihen tulokseen, että suuri osa wikispämmäyksestä on erityistapaus automaattisesta lomakespämmäyksestä.
Pikalinkit: