HOME

So funktioniert Google: Wie die Spinne im Netz

Zu fast jedem Suchwort liefert Google eine passende Seite über das riesige Schlagwortverzeichnis der Firma. Doch Google kennt nicht das ganze Web.

Dass Google sich im Internet so gut auskennt, liegt an Googlebot. So heißt die automatische Surfsoftware, mit der Google das Internet permanent durchforstet. Alle Suchmaschinen nutzen solche Surf-Programme, die auch Spider, Webrobots oder kurz Bots genannt werden.

Wahllos steuern sie alle Webseiten an, deren sie habhaft werden können, vom kleinsten Forumseintrag bis zum Leitartikel. Stoßen sie beim Surfen auf einen Link zu einer neuen Webseite, besuchen sie auch diese und hangeln sich so wie eine Spinne von Seite zu Seite.

Schritt für Schritt das Netz bereisen

Auf diese Weise lernt die Suchmaschine das Internet Schritt für Schritt kennen. Und das immer wieder von Neuem: Denn Internetseiten werden verändert oder verschwinden, und dies darf einer guten Suchmaschine nicht verborgen bleiben. Umgekehrt bedeutet das auch: Seiten, die Googlebot noch nie besucht hat, findet man mit Google auch nicht. Dieser unentdeckte Teil des Webs ist womöglich viel größer als der, den Google kennt.

Mit den von Googlebot angesteuerten Seiten geschieht dreierlei: Erstens speichert Google eine Kopie der Seite im hauseigenen Rechenzentrum. Zweitens gibt Google jeder katalogisierten Seite eine Nummer. Drittens analysiert Google den auf der Web-Seite enthaltenen Text, aber auch andere Informationen wie Dateinamen von Bildern, den Seitentitel und die vom Autor der Seite festgelegten Suchbegriffe. Daraus erstellt Google Schlagwörter, die in das Google-Verzeichnis, Index genannt, eingearbeitet werden.

Nummern und Wörter

Der Index ist wie das Schlagwortregister am Ende eines Buches - eine lange Liste von Wörtern und dazu die Nummern der Seiten, auf denen diese vorkommen. Auch falsch Geschriebenes oder Fremdwörter werden aufgenommen - einzig häufige Wörter wie "und" oder "das" bleiben unberücksichtigt. Startet ein Internetsurfer eine Suchabfrage, schaut Google im Index, ob der Begriff vorhanden ist. Das ergibt meistens viele tausend Treffer - die nun nach Relevanz sortiert werden müssen, denn das Wichtigste soll in der Trefferliste ganz oben stehen.

Dazu nutzt Google ein Verfahren, das "Pagerank" heißt: Jede Internetseite wird vor allem danach bewertet, wie viele andere Seiten auf sie verweisen. Wie relevant die verweisenden Seiten sind, wird ebenfalls berücksichtigt. Insgesamt über 100 Faktoren spielen eine Rolle. Doch was genau wie viel zählt bei der Seitenbewertung, bleibt Googles Geschäfts- und letztlich auch Erfolgsgeheimnis

Von Dirk Liedtke, Michael Streck und Eros Hoagland / print
Themen in diesem Artikel
Kann ich mich auf Geschwindigkeitsanzeige FritzBox verlassen?
Hallo zusammen, erstmal herzlichen Dank für die Leute, die sich Zeit nehmen Fragen zu beantworten oder ihre Erfahrungen mit anderen teilen. Das ist oft hlifreich, wenn man sich nicht so auskennt. Ich hoffe, dass mir jemand weiterhelfen kann. Die Telekom hat hier nach langer und ersehnter Zeit schnelle Leitungen verlegt. Mitarbeiter waren auch zu Besuch da und auch nett:-) Sie wollten ja auch, dass ich von 1und1 wieder zurück wechsel. Das ist für mich in Ordnung und gehört zum Wettbewerb. Da jedoch die Mitarbeiter mir sagten, dass die Telekom für paar Jahre das Vorrecht hätte, könnte ich schnelles Internet nur über Telekom beziehen. Sprich entweder Telekom und schnelles Internet oder langsames Internet. Da habe ich im Internet recherchiert und rausgefunden, dass das so nicht mehr stimmt. Das war der Grund, warum ich dann bei 1und1 DSL100 abgeschlossen habe, da man mir am Telefon gesagt, dass es ohne Probleme möglich wäre. Nun ist es jedoch so, dass wir gar nicht so merken, dass unser Internet schneller ist. Gerade in der oberen Etage kann man nicht ohne Router surfen oder Sky über Internet Fernsehen. Nun meine Frage: Bei der Fritzbox wird es jedoch angezeigt. Kann ich mich drauf verlassen? Oder wie macht ihr eure Messungen? Ich weiss, dass es Software gibt, aber der feste Rechner ist bereits alt und hat einen alten Internet Explorer drauf. Wenn ich mit einem Laptop im Wlan mich reinhänge, wird sicher die Geschwindigkeit sowieso niedriger und nicht verwertbar sein, oder? Vielen Dank für die Antworten.