Ontologische Anpassung

Nachdem im vorangegangenen Kapitel Daten aufgespürt und strukturiert wurden, müssen die herausgefilterten Informationen in eine für Vermittler verständliche und vergleichbare Form gebracht werden.

Dazu sind unterschiedliche Formulierungen, die Gleiches ausdrücken, zu erkennen und auf ein Oberformat zu bringen. Beispielsweise sollten sprachlich und orthographisch voneinander abweichende Begriffe, die Gleiches ausdrücken, vereinheitlicht werden. „House“ als Oberkonzept von Musikstilen besitzt u.a. die Synonyme und Unterkonzepte „Chicago“, „Dub“, „Europop“, „Funk“ oder „Eurodance“ [Ishkur06].

Andererseits muss ein Begriff, welcher in unterschiedliche Bedeutung verwendet wird, im jeweiligen Kontext der Quelle auf seinen Sinn untersucht werden. So kann der Begriff „Blume“ als eine Krautpflanze mit auffälligem Blütenstand gemeint sein, jedoch auch der Schaum auf dem Bierglas. Duft und Aroma von Weinen sowie das bei Pferden auftretende weiße Zeichen auf deren Stirn bezeichnet man ebenso als „Blume“. [Brockhaus99] nennt zusätzlich die weiße Schwanzspitze von Hasen, Wildkaninchen, Fuchs und Wolf als „Blume“, sowie „Friedrich B. Blume“ (1893 – 1975), welcher als Musikforscher arbeitete.

In dieser Phase der Datenintegration wird versucht, zunächst Terme auf ihre Grund- bzw. Stammform zu reduzieren. Dies beinhaltet die Ersetzung von Umlauten, Akzentuierungen und Sonderzeichen. Wortverbünde werden in einzelne Token aufgespaltet, Abkürzungen aufgelöst. Die Bedeutung einzelner Terme wird durch Ontologien erkannt und gegebenenfalls zu Subkonzepten zusammengefasst, von Synonymen und Homonymen bereinigt und somit in den Zusammenhang der gegebenen Wissensbase eingefügt.

Unterkapitel

Ontologien
Im Folgenden soll kurz gezeigt werden, wie mit Hilfe von Ontologien beispielsweise ein Wissensbereich für elektronische Musik greifbar und entscheidbar abgebildet werden kann.
Alignment
Ontologie bieten also ein Vokubular, welches eine bestimmte Domäne beschreibt, sowie eine Spezifikation der Bedeutungen der genutzen Terme in diesem Vokabular. Sie orientieren sich nicht an objektiven Gegebenheiten, sondern an den Erfordernissen aus der subjektiven Sichtweise ihres Erstellers (Dinge, wie ein Einzelner sie auffasst).
Vorgehen
Die bisher beschriebenen Techniken dienen dazu, Domänenwissen meiteinander zu vereinen. Dadurch entstandene Konzeptsammlungen sind auch im Bereich der ontologischen Anpassung von Begrifflichkeiten und Instanzen nutzbar. Grundsätzlich sollen hier semantische Abweichungen erkannt und durch einheitliche, auf syntaktischer Ebene vergleichbare Zeichenketten ersetzt werden. Dazu kommen die folgenden Methoden zur Anwendung.
top