Web-Suchmaschinen

Suchmaschinen erfassen verteilte Inhalte aus dem World Wide Web mittels Crawling und speichern diese Informationen in einer lokalen Datenbasis. Die Suchmaschine stellt eine Benutzerschnittstelle zur Suche zur Verfügung. Die Ergebnisse einer Suche werden nach der Relevanz in eine Reihenfolge gebracht, wobei es verschiedene Modelle zur Ermittlung der Relevanz gibt und auch benutzerabhängig sein kann.

Wie Suchmaschinen funktionieren

Als kurze Einführung bietet sich dieses Video an:

Aufbau einer Suchmaschine (aus Risvik und Michelsen 2002, S. 290)
In der Abbildung ist der Aufbau von einer Suchmaschine abgebildet. 
Eine Suchmaschine besteht aus den Komponenten Crawler, der Datenbasis der Suchmaschine (local store), dem Indexer und dem Searcher. Die Suchmaschine hat die Aufgabe zwischen den Inhalten des WWW und dem Nutzer zu vermitteln. Im Folgenden werden die einzelnen Bestandteile näher erläutert.
Im WWW sind die Grenzen nicht klar definiert und es verändert sich kontinuierlich, deshalb kann die Suchmaschine die Inhalte des Web auch nicht vollständig darstellen.
Um die Inhalte des Webs zu erfassen wird ein Web Crawler eingesetzt, der sich von Seite zu Seite hangelt und dort die Links verfolgt, um weiter im Web vor zu dringen. Die Seiten werden im Local Store gespeichert und die Informationen sind das Rohmaterial für den Index. Der Index wird vom Indexer erstellt, um die Dokumente effizient durchsuchen zu können. Das bedeutet, dass eine Repräsentation für jedes Dokument angelegt wird mit den nötigen Daten, um das Dokument wiederzufinden und ranken zu können. Der Seacher sortiert die Suchergebnisse nach Relevanz für den Nutzer und gibt diese aus.

Weiteres über Suchmaschinen ist im Buch "Suchmaschinen verstehen" von Dirk Lewandowski nachzulesen. Dort werden die einzelnen Komponenten einer Suchmaschine und ihre Aufgaben näher beschrieben. Außerdem wie Suchmaschinen genutzt werden und wie die Suchergebnisse gerankt werden und vieles mehr. 

Quellen

Risvik, K. M., & Michelsen, R. (2002). Search engines and web dynamics. Computer Networks, 39(3), 289–302.
Dirk Lewandowski (2015). Suchmaschinen verstehen

Kommentare

Beliebte Posts aus diesem Blog

Projektergebnis

TTI Vorlesung

Cloud Computing Patterns