MBI Blog

Google dringt weiter ins Deep Web vor

Posted on | November 12, 2008 | No Comments

Bis vor kurzem galten gescante Seiten und Flash-Inhalte als unsichtbar für Suchmaschinen. Google versucht nun schon seit längerem, diesen Bereich des Deep Web doch für den eigenen Index aufzuarbeiten. Das geschieht auf zwei Ebenen:

  1. Dokumente, die in analoger Form vorliegen, mit Scannern digitalisiert wurden, aber in einem Bild-Format vorliegen, also nicht bearbeitet werden können wie ein Text-Dokument, werden nun mit Hilfe von OCR-Software gelesen und indexiert. Die dabei notwendige Rechner-Power ist gewaltig.
  2. Flash-Dateien werden nun teilweise “geöffnet” und ausgelesen: das betrifft Links und Texte in Flash-Format.

Bei aller Google-Vorsicht, Google ist im Bereich der Suchmaschinen-Technologie nicht von ungefähr Platzhirsch.

[Technorati Tags: - Suchmaschinen ]

Comments

Leave a Reply





  • Web 2.0 Surfcamp

  • RSS Feed & Abo

  • eBook ‘e-Portfolio’

    eBook ePortfolio & Identität
  • Seiten

  • Disclaimer

    Copy rights
    You are free: to copy, distribute, display, and perform the work to make derivative works under the following conditions: Attribution. You must give the original author credit; Noncommercial. You may not use this work for commercial purposes; Share Alike. You may not alter, transform, or build upon this work For any reuse or distribution, you must make clear to others the license terms of this work. Any of these condition can be waived if you get permission from the author.


    Trotz sorgfältiger inhaltlicher Kontrolle übernehmen wir keine Haftung für die Inhalte externer Links. Für den Inhalt der verlinkten Seiten sind ausschließlich deren Betreiber verantwortlich. Aufgrund der sich ständig verändernden Inhalte bei Kommentaren ist es dem Betreiber nicht möglich, alle Beiträge lückenlos zu sichten, inhaltlich zu prüfen und die unmittelbare aktive Kontrolle darüber auszuüben. Es wird keine Verantwortung für den Inhalt, die Korrektheit und die Form der eingestellten Kommentare übernommen. Gesetzeswidrige Informationen werden unverzüglich entfernt, sobald die Betreiber oder die Administratoren Kenntnis von ihnen erlangt haben. Es werden auf der gesamten Domain keine Aufzeichnungen über das Besucherverhalten durchgeführt.
  • Switch to our mobile site