MBI Blog

Deep Web: wie komme ich an unsichtbare Information?

Posted on | September 18, 2006 | No Comments

Für die Suche im Web gibt es sehr viele allgemeine und spezifische Werkzeuge. Sie bedienen sich eines eigenen oder fremden Index, der automatisch oder manuell erstellt wird. Aber was passiert mit jenen Seiten, die überhaupt nicht abgedeckt werden? Das unsichtbare Web, auch Deep Web genannt, ist ein Vielfaches größer als jenes, welches wir sehen können.
Das sichtbare Netz (“visible web“) ist nichts anderes als jene Trefferlisten, die von Suchmaschinen generiert werden oder was sich in den meisten Web-Verzeichnissen wiederfindet. Das unsichtbare Netz hingegen (“invisible” oder “deepweb) ist alles Verborgene, dass online und digital verfügbar wäre. Viel, was früher noch zum unsichtbaren Netz gehörte, ist aufgrund verbesserter Spider-Technologie sichtbar geworden:

  • Formate außerhalb von HTML: pdf, Word, Excel u.a.
  • Dynamische Seiten wie php oder asp, welche oft mit individuellen Parametern versehen sind

Der Grund, dass aber Webseiten weiterhin im unsichtbaren Web verweilen, liegt aber nur zum Teil an der Technologie der Spider. Einfache Barrieren sind oft Login und Passwort, welche von Spidern nicht eingegeben werden können. Die meisten Inhalte dieses unsichtbaren Teils des Webs sind tausende spezialisierte Datenbanken, die in den meisten Fällen auch kostenpflichtig sind.

Wie kann ich trotzdem Informationen im Deep Web recherchieren? Hier eine kleine Zusammenstellung von Suchdiensten und anderen Möglichkeiten:

  • Poogee: durchsucht auch das Deep Web
  • Envisional: kostenpflichtige Software, die behauptet, das ganze Web zu durchleuchten. Schon die Liste der angegebenen Fähigkeiten ist beeindruckend, wenn’s wahr ist.
  • Alacra: sehr wirtschafts-orientierte Suchmaschine, die sehr viele kostenpflichtige Quellen listet. Umfangreich.
  • Copernic Agent: Software, die auf dem eigenen Rechner installiert werden muss; frei erhältlich, geht auch ins Deep Web
poogee
  • CompletePlanet: über 70.000 Datenbanken durchsuchbar
  • Beaucoup: ähnlich wie CompletePlanet
  • Google und Yahoo! auf der Suche nach Datenbanken einsetzen: Keyword und “database” eingeben
  • Infomine: eine große Ansammlung von wissenschaftlichen Themen und Webseiten; inkl. Suchmöglichkeiten; englisch-sprachig
  • AcademicInfo: eine großes wissenschaftliches Verzeichnis; US-lastig
  • Librarians Internet Index: eine sehr gute Übersicht, was sich wo im Web befindet
Librarians Internet Index
  • Invisible Web: Webseite mit über 10.000 Quellen, die nicht in Suchmaschinen ausgewiesen sind
  • Rechercheportal.de: deutsche Zusammenstellung von Web-Diensten und Datenbanken, von denen viele nicht in Suchmaschinen auftauchen

[Technorati Tags: Suchmaschinen - - ]

Comments

Leave a Reply





  • Web 2.0 Surfcamp

  • RSS Feed & Abo

  • eBook ‘e-Portfolio’

    eBook ePortfolio & Identität
  • Seiten

  • Disclaimer

    Copy rights
    You are free: to copy, distribute, display, and perform the work to make derivative works under the following conditions: Attribution. You must give the original author credit; Noncommercial. You may not use this work for commercial purposes; Share Alike. You may not alter, transform, or build upon this work For any reuse or distribution, you must make clear to others the license terms of this work. Any of these condition can be waived if you get permission from the author.


    Trotz sorgfältiger inhaltlicher Kontrolle übernehmen wir keine Haftung für die Inhalte externer Links. Für den Inhalt der verlinkten Seiten sind ausschließlich deren Betreiber verantwortlich. Aufgrund der sich ständig verändernden Inhalte bei Kommentaren ist es dem Betreiber nicht möglich, alle Beiträge lückenlos zu sichten, inhaltlich zu prüfen und die unmittelbare aktive Kontrolle darüber auszuüben. Es wird keine Verantwortung für den Inhalt, die Korrektheit und die Form der eingestellten Kommentare übernommen. Gesetzeswidrige Informationen werden unverzüglich entfernt, sobald die Betreiber oder die Administratoren Kenntnis von ihnen erlangt haben. Es werden auf der gesamten Domain keine Aufzeichnungen über das Besucherverhalten durchgeführt.
  • Switch to our mobile site