29. Februar 2008 1 Kommentar

Was ist eine Suchmaschine?

Bevor man sich Gedanken über die Optimierung von Webseiten machen kann, sollte man wissen, für wen man das macht. Google empfiehlt in seinen Webmasterrichtlinien, daß Seiten für Benutzer gemacht werden sollen und nicht speziell für Suchmaschinen. An diese Weisung sollte man sich halten, wenn man Erfolg haben möchte. “Content ist King” ist der Wahlspruch für gute Webseiten und gute Platzierungen in den Suchmaschinen.

Suchmaschinendefinition

Grundsätzlich sind Suchmaschinen nichts anderes als komplexe Programme welche einerseits Möglichkeiten zur Suche anbieten und andererseits nahezu selbsttätig das Internet nach Webseiten absuchen um die Ergebnisse für die Suche bereitzustellen. Durch dieses “alleinige” Suchen unterscheidet sich die Suchmaschinen von den Webkatalogen, die einen manuellen Eintrag benötigen.

Aufbau und Struktur von Suchmaschinen

Damit Suchmaschinen Ihre Aufgabe wahrnehmen können, gibt es verschiedene Komponenten, die hier vorgestellt werden:

Der Webcrawler

Der Webcrawler, oftmals auch Spider genannt, ist der Bestandteil der Suchmaschine, der für den Suchmaschinenindex neue Webseiten auffindet und zur Indexierung herunterlädt. Dabei erkennt der Crawler Links in den Dokumenten und verfolgt diese um weitere Informationen zu gewinnen. Die Ergebnisse die der Crawler generiert gelangen in den

Dokumentenindex

Der Dokumentenindex ist die zentrale Informationsstelle der Suchmaschine. In dem Index sind alle Informationen zu den vom Crawler gefundenen Dokumenten enthalten. Neben verschiedenen Inhalten zur Sicherung der Dokumentenintegrität beinhaltet der Index Informationen über beispielsweise:

  • Name des Dokumentes
  • Dokumenttyp
  • Hostname und IP Adresse des Servers auf dem das Dokument liegt
  • Zeitstempel der Dokumenterstellung, der letzten Änderung und einer vermutlichen Änderungshäufigkeit
  • Weitere Informationen die nicht alle dokumentiert sind

Bereits diese Struktur liefert Hinweise, wie eine Suchmaschinenoptimierung aussehen kann. Der Dokumentname ist ein wesentlicher Bestandteil für den Index und damit für die Suchmaschinenoptimierung.

Der Zeitplaner (Scheduler)

Der Crawler geht nicht auf die Suche wann er will, sondern er wird auf die Reise geschickt vom Scheduler. Jeder Scheduler verfügt über viele Crawler, die für ihn arbeiten. Der Scheduler weiß jederzeit, was der ihn zugeordnete Crawler gerade macht. Je nach Aufgabenstellung schickt der Scheduler seine Crawler auf die Suche nach Informationen. Entweder sollen vorhandene Daten aktualisiert werden, oder neue Daten sollen gewonnen werden. So werden Scheduler Crawler öfters zu Seiten schicken die sich stetig ändern weil neue Inhalte dazukommen und Webseiten deren Inhalte sehr lange unverändert bleiben, eher spärlich besuchen lassen.

Auch daraus erfolgt bereits eine Information, die zur Webseitenoptimierung wichtig ist: Regelmässig neue Inhalte einpflegen. Dann schickt der Scheduler den Crawler öfters vorbei und die Informationen im Index sind aktueller.

- Fortsetzung folgt -

Artikel die auch interessant sein könnten:

  1. Vor der Suchmaschinenoptimierung – oder: was kennt die Suchmaschine von mir?
  2. Gefunden, und dann?

Tags:

Leave a Reply

Kommentarregeln, bitte beachten:

"Namen" welche Keywörtern oder Firmennamen entsprechen sind hier nicht erwünscht, weil ich mit Menschen diskutieren möchte. Ebenso unerwünscht ist die Verlinkung auf reine Affiliateseiten. Derartige Verlinkungen erhalten ein freundliches Nofollow oder die Kommentare werden vor bereit Veröffentlichung entfernt. Immer Nofollow gibt es für andere Blogger, welche bei sich selbst nur Nofollow-Links verteilen ;-)