Was ist eine Suchmaschine?
Bevor man sich Gedanken über die Optimierung von Webseiten machen kann, sollte man wissen, für wen man das macht. Google empfiehlt in seinen Webmasterrichtlinien, daß Seiten für Benutzer gemacht werden sollen und nicht speziell für Suchmaschinen. An diese Weisung sollte man sich halten, wenn man Erfolg haben möchte. “Content ist King” ist der Wahlspruch für gute Webseiten und gute Platzierungen in den Suchmaschinen.
Suchmaschinendefinition
Grundsätzlich sind Suchmaschinen nichts anderes als komplexe Programme welche einerseits Möglichkeiten zur Suche anbieten und andererseits nahezu selbsttätig das Internet nach Webseiten absuchen um die Ergebnisse für die Suche bereitzustellen. Durch dieses “alleinige” Suchen unterscheidet sich die Suchmaschinen von den Webkatalogen, die einen manuellen Eintrag benötigen.
Aufbau und Struktur von Suchmaschinen
Damit Suchmaschinen Ihre Aufgabe wahrnehmen können, gibt es verschiedene Komponenten, die hier vorgestellt werden:
Der Webcrawler
Der Webcrawler, oftmals auch Spider genannt, ist der Bestandteil der Suchmaschine, der für den Suchmaschinenindex neue Webseiten auffindet und zur Indexierung herunterlädt. Dabei erkennt der Crawler Links in den Dokumenten und verfolgt diese um weitere Informationen zu gewinnen. Die Ergebnisse die der Crawler generiert gelangen in den
Dokumentenindex
Der Dokumentenindex ist die zentrale Informationsstelle der Suchmaschine. In dem Index sind alle Informationen zu den vom Crawler gefundenen Dokumenten enthalten. Neben verschiedenen Inhalten zur Sicherung der Dokumentenintegrität beinhaltet der Index Informationen über beispielsweise:
- Name des Dokumentes
- Dokumenttyp
- Hostname und IP Adresse des Servers auf dem das Dokument liegt
- Zeitstempel der Dokumenterstellung, der letzten Änderung und einer vermutlichen Änderungshäufigkeit
- Weitere Informationen die nicht alle dokumentiert sind
Bereits diese Struktur liefert Hinweise, wie eine Suchmaschinenoptimierung aussehen kann. Der Dokumentname ist ein wesentlicher Bestandteil für den Index und damit für die Suchmaschinenoptimierung.
Der Zeitplaner (Scheduler)
Der Crawler geht nicht auf die Suche wann er will, sondern er wird auf die Reise geschickt vom Scheduler. Jeder Scheduler verfügt über viele Crawler, die für ihn arbeiten. Der Scheduler weiß jederzeit, was der ihn zugeordnete Crawler gerade macht. Je nach Aufgabenstellung schickt der Scheduler seine Crawler auf die Suche nach Informationen. Entweder sollen vorhandene Daten aktualisiert werden, oder neue Daten sollen gewonnen werden. So werden Scheduler Crawler öfters zu Seiten schicken die sich stetig ändern weil neue Inhalte dazukommen und Webseiten deren Inhalte sehr lange unverändert bleiben, eher spärlich besuchen lassen.
Auch daraus erfolgt bereits eine Information, die zur Webseitenoptimierung wichtig ist: Regelmässig neue Inhalte einpflegen. Dann schickt der Scheduler den Crawler öfters vorbei und die Informationen im Index sind aktueller.
- Fortsetzung folgt -
Artikel die auch interessant sein könnten:







