Hvordan bygge en søkemotor

Søkemotorer er ryggraden i moderne internett. De har flere deler, selvfølgelig, og er langt mer enn bare boksen du ser på et søk stedets forside.

Bruksanvisning

1 Før søkeresultatene kan presenteres for brukeren, må du først opprette en database over alle sidene på internett. Felles database språk inkluderer MySQL eller MS SQL. Siden nye nettsteder blir stadig opprettet, vil dette trinnet i prosessen alltid være ufullstendig. Programmet som finner alle nettsteder og indeksene deres innhold kalles en crawler. Flere av disse robotene vil kjøre samtidig, plukke tilfeldige nettadresser og følge alle linker på disse sidene. Med hver kobling, bør crawler første søke i databasen for å se om koblingen er allerede til stede, og hvis ikke, legge den til i listen.

2 Tildele ord for hvert område når et tilstrekkelig antall nettsteder er indeksert. Nøkkelord er ord som forekommer ofte på en nettside og foreslår en sides sannsynlig tema eller hovedideen. Lag en ranking system for å bestemme hvilke sider som vises først til brukere som søker etter bestemte søkeord. Vanlige rangeringsalgoritmer bruker ulike faktorer, inkludert søkeordet tetthet, søkeord posisjon, eller antall lenker på en side for å avgjøre relevans.

3 Bestem hvilke faktorer vil påvirke vektingen av søkeresultatene. Google, for eksempel, legger mer vekt på ord som dukker opp i løpet av koblinger eller HTML overskriften koder. Vurdere å inkludere faktorer som sidelengden, hyppigheten av oppdateringer og unikt innhold.

Hint

  • For å sikre at ondsinnede brukere ikke prøver å spillet søkemotoren, holde rangering algoritme en nøye bevoktet hemmelighet.
  • Bruk flere crawlere å indeksere Internett raskere.