Text-Fakten-Integration in Informationssystemen

Dieser Post ist eine Rezension eines Buchbeitrages von Maximilian Stempfhuber (Informationszentrum Sozialwissenschaften, Bonn), die im Sammelband Knowledge extended erschienen ist (Jülich, Band 14, im Jahr 2005). Stempfhuber geht es um das Problem der separierten Informationsarten „Fakten“ und „Text“, die zur Lösung eines Informationsbedürfnisses sehr oft mühsam aus verschiedenen Quellen herausgesucht werden müssen. Der Forderung nach einer Text-Fakten-Integration folgen nun erste Ansätze, wie eine Realisierung vollzogen werden kann.

Stempfhuber geht von der derzeitigen Situation im Bereich der Informationsbeschaffung aus: es gibt zwar eine Vielzahl von Quellen, die meist auch online und daher digital zur Verfügung stehen, und es existieren Technologien wie anwendungsneutrale Kommunikationsprotokolle wie SOAP und spezialisierte Formate (wie z.B. der Dublin Core), die eine weit höhere Integration von Information erlauben würden, in der Tat sind sie es aber nicht.
Eine Technik genügt nicht, um den gegenwärtigen Anforderungen der Informationsarbeiter zu genügen. Dies ergab eine Befragung von Nutzern. Hauptkritikpunkt war die mangelnde Integration von Primär- und Sekundärinformation und Quellen in einem System.

Am Beispiel der Marktforschung erläutert Stempfhuber anschaulich die Problematiken, die sich durch die getrennten Sphären von Fakten und Texten, von Quellen untereinander für den Informationsarbeiter ergeben. Um ein Produkt auf einen internationalen Markt einzuführen, bedarf es vorher grundlegender Entscheidungen, die auf Basis von Informationen

  • zum Markt selber (Volumen, Wachstum)
  • zu den rechtlichen Bestimmungen
  • zu Ansprechpartnern vor Ort
  • zum aktuellen Überblick über den Markt (Kundenwünsche z.B.)
  • zur Ermittlung der Wettbewerber

beruhen. Diese Informationen sind teilweise Fakten, teilweise Texte. Sie müssen mühsam aus verschiedensten Quellen gesammelt, verglichen und gegengeprüft werden. Nur der Gesamtprozess liefert auch das gewünschte Ergebnis, und zwar eine fundierte Entscheidungsgrundlage zu erhalten.
Die Auswertung von Anfragen an diverse Informationsdatenbanken und –quellen ergab, dass die Nutzer schon im Vorfeld eine Vorstellung über die gesuchte Informationsart hatten und deshalb eine bestimmte Quelle ausgesucht haben. Andere Aspekte, die zur Auswahl einer Quelle beitrugen, waren Fragen der Aktualität, der Datenlücken und der Gesamtperspektive von Informationen.

Im weiteren Teil des Beitrages stellt Stempfhuber ein Integrationsmodell für Primär- und Sekundärinformationen vor: das Informationssystem ELVIRA. ELVIRA erleichtert den Nutzern das gleichzeitige Auffinden von Information sowohl in Form der Primär- als auch Sekundärliteratur durch eine semantische Integration der Indexierungsvokabulare. Mit Hilfe des Thesaurus lassen sich beide Informationsquellen gleichzeitig ausheben.

Stempfhuber beschreibt das Translationsverfahren zwischen den beiden Informationsarten, die entweder durch intellektuelle Erstellung von Crosskonkordanzen oder durch statistische Verfahren erfolgen können. Die Suche in ELVIRA ist über Schlagwörter realisiert.

Stempfhuber resümiert: die Integration von Primär- und Sekundärdaten muss weiter vorangetrieben werden. Die Modelle stehen bereit.

Und hier das Buch zur Rezension - Knowledge extended!

Posting bookmarken | Sphere it





Verwandte Artikel:

  • None
Sie können alle Kommentare zu diesen Beitrag über RSS 2.0 verfolgen. Sie können eine Antwort hinter lassen, oder von Ihrer Seite den Beitrag verfolgen.

Hinterlassen Sie eine Antwort

 
Close
E-mail It