(toiminnot)

hwechtla-tl: Hakukoneratkaisun toteutus

Kierre.png

Mikä on WikiWiki?
nettipäiväkirja
koko wiki (etsi)
viime muutokset


Tavallinen hakukone, kaksi ylimääräistä ominaisuutta:

  1. indeksoi vain URL:a (ei sivujen sisältöjä), joten ei kuluta niin paljon levytilaa
  2. julkaisee indeksinsä yhtenä (tai useampana) valtavana linkkilistana, joista muut hakukoneet voivat saada URL:a seurattavikseen.

Kaihdan hiukan tietokannan käyttöä tähän - tämän pitäisi olla asennettavissa mahdollisimman helpolla. Ehkä raakatekstitietokanta + jonkinlainen db-indeksi sivujen samuuden tarkastamiseksi (ajattelin muuten, että sivujen samuus tarkastettaisiin sisällön, ei osoitteen perusteella).

Pari cronjobia indeksoimaan tai sitten jonkinlainen daemon. Tällä hakukoneella on se etu, ettei sen koskaan tarvitse käydä sivulistaansa läpi etsiäkseen jotain. Riittää, että se lukee sitä säännöllisesti päivittääkseen tiedot sivuista.

kategoria: projektit

atehwa: Helppo ratkaisu ensiksi: wiki solution to the search engine challenge


kommentoi (viimeksi muutettu 20.04.2012 09:31)