WayBackMachine – History löschen
Die WayBackMachine ist ein großes Internet-Archiv, dass seit 1996 Internetseiten in regelmäßigen Abständen archiviert. Längst gelöschte Webseiten können somit noch Jahre später eingesehen werden.
Zwar sind die gespeicherten Seiten nur bruchstückhaft, ohne Bilder und CSS verfügbar, jedoch reicht diese Ansicht um sich ein Bild von den archivierten Inhalten zu machen.
Zum einen kann dieses Archiv natürlich recht spannend sein, zu sehen wie z. B. heute bekannte Webseiten vor vielen Jahren begonnen haben. Allerdings wird es auch Situationen geben, wo ein Jahresrückblick für eine Webseite unerwünscht ist:
- Bei Übernahme einer bestehenden Domain möchte man evtl. nicht mit den bisherigen Internetauftritten in Verbindung gebracht werden.
- Im Falle von Rechtsstreitigkeiten oder Abmahnungen bezüglich einer Domain oder Inhalten, macht es unter Umständen Sinn, archivierte Inhalte zu löschen.
- “Personaler googlen Bewerber“, der Weg zur WayBackMachine ist sicherlich auch nicht mehr weit. Wer sich bewirbt sollte daher sichergehen, dass keine Inhalte im Archiv vorhanden sind, die einer erfolgreichen Bewerbung im Wege stehen können.
- …
WayBackMachine-History für einzelne Domains löschen
Es gibt glücklicherweise eine Möglichkeit für Domaineigner, die von der WayBackMachine archivierten Inhalte löschen zu lassen.
1.) Für die gewünschte Domain eine robots.txt im Rootverzeichnis anlegen:
http://domain.tld/robots.txt
User-agent: ia_archiver Disallow: /
Diese robots.txt Datei bewirkt nicht nur, dass in Zukunft keine Seiten mehr archiviert werden, sondern wird in diesem Fall auch den Spider dazu veranlassen, sämtliche bisherigen Archiveinträge für diese Domain zu löschen.
2.) Um das Löschen der Einträge zu beschleunigen, kann der Spider aufgefordert werden die Webseite in naher Zukunft aufzusuchen.
Dazu einfach unter http://www.alexa.com/site/help/webmasters#crawl_site die Domain ins Eingabefeld eintragen und auf “Crawl My Site” klicken.
Ab diesem Zeitpunkt kann nur noch abgewartet werden, bis der Alexa-Spider die Webseite besucht und anhand der robots.txt die Löschung des Archivs vornimmt.
ähnliche Beiträge:
- Duplicate Content vermeiden
Doppelter Inhalt für Suchmaschinen entsteht häufig dadurch, dass eine Webseite mit www. und ohne www
Adobe Flash Lite und Reader LE für Windows Mobile
Adobe Systems hat bekannt gegeben, dass Microsoft die Software Adobe Flash Lite und den Adobe Reader
Google Suche mit Zeitbegrenzung
Die erweiterte Suche von Google wurde mit einem weiteren hilfreichen Filter ausgestattet, mit dessen



