addthis

Dienstag, 14. Februar 2012

Google-Index/- und Cache löschen

Daten aus Google-Index und Google-Cache löschen / entfernen:
Pietro Scherer
Daten aus dem Index oder Cache der Suchmaschine Google löschen.
Es gibt Fälle, in denen man sich wünscht, bestimmte Informationen in den Google-Suchergebnissen nicht mehr zu finden. Auch wenn es darum geht, unerwünschte Daten bei Google zu entfernen, ist der Suchmaschinenoptimierer der erste Ansprechpartner.

Aktuelle Inhalte einer Internetseite / Daten älterer Version im Google-Cache:
Die Titel-Links in den Google-Suchergebnissen verweisen immer auf die aktuellen Inhalte. Aber ein Aufruf des zugehörigen "Im Cache"-Links zeigt eine Seite in dem Zustand an, wie sie der Googlebot bei seinem letzten Besuch vorgefunden hat. Damit bestimmte Daten von der Suchmaschine Google nicht mehr angezeigt werden, reicht es also nicht aus, die betreffende Seite entsprechend zu ändern und die neue Version auf den Server hochzuladen. Die zeitlichen Abstände, in denen Googlebot Webseiten besucht, sind völlig unterschiedlich und können von wenigen Stunden bis mehreren Monaten reichen.

Unerwünschte eigene oder fremde Inhalte bei Google löschen:
Es ist ein Unterschied, ob es um Inhalte der eigenen Website oder um Inhalte von fremden Netzauftritten geht, die Sie bei der Suchmaschine Google löschen wollen. Die technischen Möglichkeiten, über Meta-tags und Anweisungen in der Datei robots.txt das Verhalten von Google & Co zu beeinflussen, sind bei der eigenen Website stets verfügbar, sie müssen nur genutzt werden. Und die Google Webmastertools stellen zusätzliche Möglichkeiten zum Entfernen eigener Inhalte aus Google-Index und Google-Cache bereit.

Schwieriger, nicht nur in rechtlicher Hinsicht, wird es bei Inhalten von fremden Netzauftritten. Hier bietet das öffentliche Google-Tool zum Entfernen von Webseiten einige Optionen zum Löschen. Wenn in den Google-Suchergebnissen ein Link zu einer Personensuchmaschine enthalten ist, und dort wiederum ein Verweis zu einer weiteren Quelle, müssen Sie gegebenenfalls schrittweise vorgehen, bis Sie die unerwünschten Daten bei Google entfernen können. Dies erfordert in hartnäckigen Fällen sorgfältige Planung des Vorgehens, einen gewissen Zeitaufwand und auch viel Geduld.

Anzeige von "Im Cache"-Links verhindern und Seiten aus dem Google-Cache löschen:
Sie können die Suchmaschine Google mit dem Eintrag noarchive im Meta-tag Googlebot oder robots einer Seite auffordern, keinen "Im Cache"-Link für diese Seite mehr anzuzeigen. Mit dem Eintrag nosnippet im gleichen Meta-tag lässt sich Google bitten, die Seite ganz aus dem Cache zu löschen; in diesem Fall werden auch keine Text-Schnipsel in der Trefferliste mehr angezeigt. Der vollständige Meta-tag hierfür würde so aussehen:

<meta name="googlebot" content="index, follow, noarchive, nosnippet">
Oder so:
<meta name="robots" content="index, follow, noarchive, nosnippet">

Die Einträge noarchive und nosnippet wirken natürlich nicht rückwirkend, sondern erst ab dem Zeitpunkt, zu dem Googlebot die Seite wieder besucht hat.

Inhalte aus dem Google-Index löschen (unerwünschte eigene Seiten oder Bilder):
Sie können die betreffende(n) Seite(n) oder das Bild (die Bilder) von Ihrem Server löschen und dann warten, bis Googlebot dort vorbeischaut, feststellt, dass es die Objekte nicht mehr gibt, und deshalb den Eintrag aus dem Index löscht. Aber wie schon gesagt: die zeitlichen Abstände, in denen Googlebot Webseiten besucht, können ziemlich groß sein.

Um die Löschung von Objekten Ihrer eigenen Website aus dem Index zu beschleunigen, bietet Google in den Webmastertools das Werkzeug URLs entfernen an.


Bevor Sie das Werkzeug URLs entfernen aufrufen, müssen Sie aber auf Ihrer Website einige Vorbereitungen treffen:

•    für Bilder: das betreffende Bild vom Server löschen
•    für Seiten: die betreffende Seite vom Server löschen oder zumindest über die Datei robots.txt
      oder über den Eintrag noindex im Meta-tag robots sperren
•    für Verzeichnisse: das betreffende Verzeichnis über die Datei robots.txt sperren oder alle Seiten
     des Verzeichnisses über die Datei robots.txt sperren

Dann melden Sie sich bei den Google Webmastertools an, wählen Ihre Website aus und rufen über Website-Konfiguration / Crawler-Zugriff den Eintrag URL entfernen auf. Dann aktivieren Sie die Schaltfläche Neuer Antrag auf Entfernung.

Anschließend ...
Geben Sie zunächst die genaue Adresse an (immer die Original-Adresse, nie die Cache-Adresse) und klicken Sie auf Weiter. 

Wählen Sie als Grund eine der angegebenen Möglichkeiten aus:

a. Seite aus Suchergebnissen und Cache entfernen
b. "Seite nur aus Cache entfernen"
c. "Verzeichnis entfernen"

Sie schließen den Vorgang jeweils ab, indem Sie auf Antrag übermitteln klicken.
Voraussetzung zur Nutzung der Google Webmastertools sind natürlich ein vorhandenes Google-Konto und die durchgeführte Registrierung (Verifizierung) Ihrer Website bei Google. Erforderlichenfalls müssen Sie diese beiden Schritte nachholen, bevor Sie die Google Webmastertools verwenden können.

Inhalte aus dem Google-Cache löschen (Cache-Kopie einer eigenen Seite mit unerwünschtem Begriff):
Unter bestimmten Voraussetzungen können Sie auch das öffentliche Google-Tool zum Entfernen von fremden Webseiten nutzen, um geänderte eigene Inhalte aus dem Google-Cache beschleunigt zu löschen: Diese Lösung kommt etwa dann in Betracht, wenn Sie auf dem Rechtsweg gezwungen wurden, die Erwähnung eines bestimmten Namens oder einer bestimmten Marke zu unterlassen:

Die aktuelle Seite muss schon geändert sein, das heißt, der unerwünschte Begriff in der Google-Cache-Version darf auf der aktuellen Seite nicht mehr vorkommen
Die aktuelle Seite, von der der unerwünschte Begriff entfernt wurde, darf für Googlebot über die Datei robots.txt nicht gesperrt sein und darf im Meta-tag robots nicht den Wert noindex enthalten.

Nachdem diese Voraussetzungen gegeben sind, gehen Sie folgendermaßen vor:
Erstellen Sie im Entfernen-Tool einen Neuen Antrag auf Entfernung
Geben Sie zunächst die Adresse an, die entfernt werden soll (URL, beginnend mit http..., immer die Original-Adresse, nie die Cache-Adresse angeben).

"Geben Sie ein Wort ein, das auf der Live-Seite nicht mehr angezeigt wird, in der im Cache gespeicherten Version jedoch noch vorhanden ist."
Sie schließen den Vorgang ab, indem Sie die Schaltfläche Im Cache gespeicherte Version diese Seite entfernen betätigen.

Inhalte aus dem Google-Index oder Cache löschen (unerwünschte fremde Seiten oder Bilder):
Schwieriger ist es, Inhalte fremder Websites aus dem Google-Index bzw. aus dem Cache zu löschen. Die Suchmaschine Google verlangt von Ihnen berechtigterweise, dass Sie sich zunächst mit dem Webmaster bzw. dem Inhaber der fremden Seite in Verbindung setzen, damit dieser die Seite sperrt oder die von Ihnen beanstandeten Daten von der Seite entfernt.

Wenn der Webmaster oder Inhaber der fremden Website Ihrem Wunsch nachkommt und die betreffende Seite gelöscht oder für Googlebot gesperrt oder inhaltlich geändert hat, haben Sie gute Chancen, dass Google Ihren Wunsch erfüllt, die verwaisten Inhalte auch aus dem Index bzw. aus dem Cache zu löschen. Falls sich der fremde Webmaster hingegen weigert, wird Google die Ihnen unerwünschten Daten nur unter sehr eingeschränkten Bedingungen aus dem Index bzw. aus dem Cache löschen.

Nachdem Sie sich mit dem fremden Webmaster bzw. Seiten-Inhaber geeinigt haben (oder auch nicht), rufen Sie das öffentliche Google-Tool zum Entfernen von Webseiten auf und erstellen einen Neuen Antrag auf Entfernung. Google hat die Benutzerführung im 2. Halbjahr 2011 mehrfach geändert und erheblich vereinfacht. Dann gehen Sie vor wie nachfolgend beschrieben:

Geben Sie zunächst die genaue Adresse an, die entfernt werden soll (URL, beginnend mit http..., immer die Original-Adresse, nie die Cache-Adresse angeben).
Anschließend prüft Google im Hintergrund, ob die Seite unter der angegebenen Adresse erreichbar ist, und ob sie vom Inhaber für Google gesperrt wurde.

Abhängig davon, was Google im Hintergrund geprüft und ermittelt hat, werden Ihnen von Google jetzt unterschiedliche Formulare angezeigt (die frühere Benutzer-Auswahl gibt es nicht mehr):

a. Wenn die Seite entfernt oder zumindest für Google gesperrt wurde:
     Prüf-Liste für technisch Interessierte und Selber-Prüfer (keine "Pflichtlektüre"):

Google hat geprüft, ob ...
 §  die angegebene Seite statt Statuscode 200 den Statuscode 404 oder 410 liefert
 §  oder der Zugriff auf die Seite für Googlebot über die Datei robots.txt gesperrt ist
 §  oder über den Meta-tag robots der Seite erkenntlich ist, dass die Seite  nicht  indexiert 
     werden soll.

<meta name="robots" content="noindex">

b. Wenn die Seite (noch) vorhanden und für Google erreichbar ist: 
    Prüf-Liste für technisch Interessierte und Selber-Prüfer (keine "Pflichtlektüre"):

 Google hat geprüft, ob...
 §  die angegebene Seite den erforderlichen Statuscode 200 liefert
 §  und der Zugriff auf die Seite für Googlebot über die Datei robots.txt nicht gesperrt    wurde
 §  und über den Meta-tag robots der Seite erkenntlich ist, dass die  Seite (weiterhin) 
     indexiert werden soll:

<meta name="robots" content="index">

Beantworten Sie Googles Frage, indem Sie diese Schaltfläche betätigen:
"Ja, diese Seite entfernen"

Solche Seiten werden im Erfolgsfall nach etwa einem Tag "für mindestens 90 Tage aus den Google-Suchergebnissen ausgeschlossen". Warum nur "für mindestens 90 Tage" und nicht gleich für mindestens ewig? Weil der Inhaber der Seite dort künftig ganz andere Inhalte unterbringen könnte, die mit Ihnen überhaupt nichts zu tun haben.

In diesem Fall "Geben Sie ein Wort ein, das auf der Live-Seite nicht mehr angezeigt wird, in der im Cache gespeicherten Version jedoch noch vorhanden ist". Achten Sie dabei auf die genaue Schreibweise des Wortes, etwa die Groß- oder Kleinschreibung einzelner Buchstaben. Der eingetragene Begriff darf auf der aktuellen Seite nicht mehr vorkommen, muss aber in der Google-Cache-Version noch enthalten sein (Unterscheidungs-Kriterium). Ein oft gemachter Fehler (anhand eines Beispiels): Sie heißen Peter Schmidt und geben als Begriff Peter Schmidt in das Formular ein. Wenn aber auf der aktuellen Seite noch ein Peter Schmid vorkommt, würde Ihr Entfernungs-Antrag von Google abgelehnt werden. Tragen Sie in diesem Fall also nur Schmidt(ohne Peter) in das Formular ein. Anschließend betätigen Sie die Schaltfläche Im Cache gespeicherte Version dieser Seite entfernen.

Im Erfolgsfall werden solche Seiten nach etwa einem Tag ohne Textschnippsel (schwarze Schrift), aber weiterhin mit Titel (blaue Schrift) und Adresse (grüne Schrift) in den Suchergebnissen angezeigt; der "Im Cache"-Link wird nicht mehr angezeigt, und die Cache Version ist nicht mehr erreichbar. Beachten Sie aber, dass die Entfernung derzeit nur mit HTML Inhalten funktioniert, also nicht mit "Text" in Form von Bildern oder Flash-Objekten.

In beiden Fällen führt Google die Änderungen nicht sofort aus, sondern merkt sich Ihren Entfernungs-Antrag zur späteren Erledigung vor.
Während dieser Zeit wird als "Status" Ausstehend angezeigt. Die gesammelten Anträge werden meistens innerhalb eines Tages im Stapelbetrieb abgearbeitet. Im Erfolgsfall wird danach als "Status" Entfernt angezeigt, bei Misserfolg Abgelehnt (in diesem Fall hält Google nebenstehend weitere Informationen für Sie bereit). Bei Erfolg Ihres Antrags kann es gelegentlich drei bis vier Tage dauern, bis alle Google Rechner weltweit synchronisiert sind.

Wenn Sie das öffentliche Google-Tool zum Entfernen von Webseiten nutzenwollen, müssen Sie sich zunächst über Ihr vorhandenes Google-Konto anmelden. Ein Google-Konto zu haben bedeutet, dass Sie bei Google registriert sind. Eine solche Registrierung ist kostenlos und ohne Angabe des Namens möglich, erforderlich ist lediglich irgendeine Email-Adresse, unter der Sie erreichbar sind.

Bei Ihrer Registrierung sollten Sie den Haken vor der Option "Webprotokoll aktivieren" entfernen, denn mit eingeschaltetem Webprotokoll würden Sie personalisierte Suchergebnisse erhalten. Die Benutzung des öffentlichen Google Tools setzt keine eigene verifizierte Website voraus. Bestimmte kritische persönliche Daten aus den Google-Suchergebnissen entfernen:

Einige besonders kritische persönliche Daten (Sozialversicherungs- oder Personalausweisnummer, Konto- oder Kreditkartennummer, ein Bild Ihrer Unterschrift, Ihr Name auf P0r#n0-Seiten) können auch ohne Mitwirkung des jeweiligen Webmasters oder Seiteninhabers aus den Google-Suchergebnissen entfernt werden.

Es gibt jeweils gesonderte Google-Formulare für ...


1.      Sozialversicherungs- oder Personalausweisnummer
2.      Konto- oder Kreditkartennummer
3.      Bild einer handschriftlichen Unterschrift
4.      Persönlicher Name oder Firmen-Name auf P0r#n0-Seiten

Das Wort P0r#n0-Seite gibt es im Google-Sprachgebrauch nicht. Stattdessen heißt es im unnachahmlichen Google-Deutsch "mit nicht jugendfreien Inhalten ..., die als Spam in den Google-Suchergebnissen aufgetaucht ist".

Die jeweils erforderlichen Angaben sind selbsterklärend und werden hier deshalb nicht weiter beschrieben. Füllen Sie das für Sie "zuständige" Formular vollständig aus und betätigen anschließend die Schaltfläche Senden.

Diese Anträge werden nicht automatisiert verarbeitet, sondern von Mitarbeitern der Firma Google geprüft. Gelegentlich ergibt sich die Notwendigkeit für Rückfragen, deshalb sollten Sie eine gültige Email-Adresse angeben, unter der Sie tatsächlich erreichbar sind.

Facebook-Konto gelöscht? Facebook-Spuren bei Google löschen
:
Wer sein Facebook-Konto gelöscht hat und einige Tage später über die Google-Bildersuche nach seinem Namen sucht, erlebt oft eine unangenehme Überraschung: Ein kleines Vorschaubild aus dem vermeintlich gelöschten Facebook-Profil springt ins Auge. Klickt man auf das Bild, zeigt Google eine Seite an, auf der das Vorschaubild nochmal angezeigt wird; daneben befindet sich ein Link "Vollbild anzeigen". Folgt man diesem Link, wird zwar (statt des ursprünglichen Profil-Bildes) ein Platzhalter-Bild angezeigt.

Der Knackpunkt daran ist jedoch, dass Facebook für die Adresse des "Vollbild"-Links den HTTP-Statuscode 200 (Gefunden) liefert. Deshalb kann der Google-Treffer des kleinen Vorschaubildes nicht über das öffentliche Google-Tool zum Entfernen von Webseiten gelöscht werden. Eine Löschung (Entfernung) bei Google wäre nur dann möglich, wenn Facebook statt Statuscode 200 für das Vollbild Statuscode 404 oder 410 liefern würde.

Ob der hier beschriebene Sachverhalt in allen Fällen der Konto-Löschung bei Facebook auftritt, kann ich nicht sagen, weil es im Facebook-Profil verschiedene Einstellungs-Möglichkeiten gibt.
Wenn Sie nach der Löschung Ihres Facebook-Kontos an Facebook schreiben wollen (ohne sich dort anzumelden): es gibt ein gut verstecktes Kontakt-Formular. Ob es erfolgreich ist, sich auf diesem Weg an Facebook zu wenden, kann ich nicht mit Sicherheit behaupten.

Die Suchmaschine Google ist für das beschriebene Problem nicht zuständig, sondern muss auf Statuscode 404 oder 410 als Voraussetzung zur Löschung des Links bestehen. Sonst könnte jeder kommen und beliebige fremde Inhalte bei Google löschen. Es ist ein reines Facebook-Problem!


Rufschädigende Domain mit Ihrem Namen (max-mustermann-zahlt-nicht.info) löschen:
Sie heißen Max Mustermann, und Ihr netter Geschäftspartner aus Freiburg hat die rufschädigende Domain max-mustermann-zahlt-nicht.info angemeldet, die von Google gleich als erstes Suchergebnis angezeigt wird, wenn jemand nach Ihrem Namen Max Mustermann sucht?


In einem solchen Fall führen Sie am besten folgende Maßnahmen durch (in dieser Reihenfolge):
Prüfen Sie, ob Sie Ihrem Geschäftspartner aus Freiburg wirklich den vollen Betrag überwiesen haben, auf den er Anspruch hat. Vielleicht erledigt sich das Problem durch Zahlung des ausstehenden Betrages. Wenn Sie den netten Freiburger jedoch schon vollständig bezahlt haben, beauftragen Sie einen Rechtsanwalt, der sich auf Medienrecht spezialisiert hat, mit dem Ziel, die Domain max-mustermann-zahlt-nicht.info zwangsweise abzumelden.

Nach Abregistrierung der rufschädigenden Domain können sie den Treffer http://max-mustermann-zahlt-nicht.info aus den Google-Suchergebnissen löschen lassen.
Hinweise: Der Name Max Mustermann und sein Geschäftspartner aus Freiburg sind hier nur als Beispiele genannt.

Unerwünschte Daten auf fremden Websites: rechtliche Fragen:
Was tun, wenn auf einem fremden Internetauftritt unerwünschte Daten (Texte oder Bilder) über Sie oder von Ihnen angezeigt werden, und der Webmaster bzw. Inhaber sich weigert, diese Daten zu entfernen?

Grundsätzlich gilt für Texte: Meinungsäußerungen und wahrheitsgemäße Tatsachen¬behauptungen sind zulässig. Beleidigungen (§185 StGB), üble Nachrede (§186 StGB), Verleumdungen (§187 StGB, §188 StGB), Nachstellung (§238 StGB) und Volksverhetzung (§130 Absatz 1 StGB) sind unzulässig und sogar strafbar. Die Gesetzestexte finden Sie u.a. bei dejure.org.

Und für Bilder gilt: Das Recht am eigenen Bild verbietet es anderen, gegen Ihren Willen Bilder zu veröffentlichen, auf denen Sie dargestellt sind (§22 Kunsturheberrechtsgesetz). Texte und Bilder, deren Urheberrecht bei Ihnen liegt, dürfen nicht von anderen veröffentlicht werden, außer Sie haben diesen anderen ausdrücklich oder auch durch Anerkennung deren AGB Nutzungsrechte gewährt.

Wenn Sie Rechtsberatung benötigen, wenden Sie sich an einen Anwalt, der sich auf Urheberrecht und/oder Medienrecht spezialisiert hat.


Erfassung durch Suchmaschinen verhindern, Robot aussperren:
Wie Sie von vornherein verhindern können, dass Daten Ihrer eigenen Website von Suchmaschinen erfasst werden, lesen Sie in den Abschnitten Meta-tag robots und robots.txt: Verzeichnisse oder Dateien für robots sperren. Dort finden Sie auch Hinweise zur "Wayback Machine" Archive.org.


Weitere Links zum Thema und Hinweise:

Google - Hilfe: "Eine Seite oder Website aus den Suchergebnissen von Google  entfernen"
Google - Hilfe: "Entfernen von Inhalten aus Google (bei Verstoß gegen geltende Gesetze)"
Google - Hilfe: "Persönliche Daten aus Google heraushalten"
Google - Blog: "Wie man unerwünschte Inhalte los wird"

Bitte beachten Sie: Die Nummern der Themen (und somit die Links) in der Google-Hilfe ändern sich gelegentlich, oder Google leitet auf andere Hilfe-Seiten mit anderen Inhalten weiter. Leider habe ich nicht die Zeit, alle paar Tage die Google-Hilfe-Links zu überprüfen ;-)

Außerdem ändert Google manchmal die Benutzerführung in den Webmastertools oder im öffentlichen Tool zum Entfernen von Webseiten. Erschrecken Sie also nicht, wenn Sie bei Google nicht alles genauso vorfinden wie hier beschrieben. Gehen Sie in Ruhe alle Optionen durch, bis Sie die gewünschte gefunden haben.


Google-Webmaster-Forum "Google Webmaster-Tools"
Dieses Google-Forum ist auch das richtige für Ihre Fragen hinsichtlich der Löschung unerwünschter Daten aus Index und Cache. Ihre Fragen werden meist von erfahrenen Praktikern beantwortet. Google-Mitarbeiter lesen dort im Hintergrund immer mit, gelegentlich schreiben sie sogar und geben konkrete Hinweise. Bevor Sie Ihr Problem dort darstellen, sollte Ihnen aber bewusst sein, dass es ein öffentliches Forum ist, und dass dort Hunderte von Besuchern mitlesen.

Vermeiden Sie bei einer Frage im Forum, den Suchbegriff, um den es geht, im Klartext anzugeben (wenig später könnte Ihr Beitrag im Google-Forum als zusätzlicher Treffer von der Suchmaschine Google angezeigt werden). Verwenden Sie einen Kurz-URL-Dienst wie zum Beispiel TinyURL, um die Adresse (URL) der Google-Suchergebnisliste oder Ihre zu löschende Adresse zu tarnen, wenn Sie danach gefragt werden.

Keine Kommentare:

Kommentar veröffentlichen