Bewertung der Inhalte
Crawler und Suchmaschine haben gute Arbeit geleistet. Aus den bearbeiteten Texten wurden Keywords extrahiert und Texte, die den Inhalt der Webseite repräsentieren. Aber es gibt ja nicht nur eine Seite (das wäre eine tolle, lohnenswerte Sache) zum Thema im Internet. Meist gibt es hunderte oder zigtausende Seiten zu einem Thema. Die Suchmaschine hat die Aufgabe zu entscheiden, in welcher Reihenfolge die Seiten nach einer Suchanfrage angezeigt werden.
Bewertung der Seite
Nachdem eine Suchanfrage gestartet wurde, durchlaufen die im Index befindlichen Seiten sehr viele Stationen. Jede Station ist ein Filter der versucht, die wichtigsten Inhalte festzustellen und die zugehörigen Seiten weiter oben in den Suchergebnissen auszuliefer. Es gibt eine Fülle von Algorithmen, die diese Aufgaben wahrnehmen können. Die Grundlagen dazu sind die sogenannten Information-Retrieval Systeme.
Es gibt verschiedene Modelle von Retrieval Systemen die auch bei den Suchmaschinen Verwendung finden. Alle Modelle haben eine Aufgabe: Ein oder mehrere Dokumente zu finden, welche die höchstmögliche Relevanz besitzen und diese absteigend sortiert auszugeben.
Artikel die auch interessant sein könnten:





