Simone Kirstein-Jost - Auflösung von Anaphern im Rahmen der Informationsextraktion für Ontologie-Management im Bereich Life Sciences

78,00 €
78,00 €
inkl. MwSt.
zzgl. Versandkosten

Lieferzeit max. 4 Tage *

Die Menge muss 1 oder mehr sein

Lieferung & Versand

  • Warensendung bis 500 g
    0,00 €
    Lieferzeit max. 4 Tage

Über das Buch

Zum Inhalt

Im Bereich Life Sciences spielt die maschinelle Extraktion und strukturierte Speicherung von Informationen in Ontologien eine zunehmend wichtige Rolle. Zur Gewährleistung einer guten Informationsextraktion (IE) müssen Anaphern korrekt aufgelöst werden.

Im Rahmen dieser Studie wird untersucht, inwiefern der vollautomatische, wissensarme Ansatz von [Mitkov et al. 2002] (MARS) zur Anaphernauflösung für die Domäne Life Sciences im Rahmen der Informationsextraktion für das Ontologie-Management adaptierbar ist. Zunächst wird eine Einführung in die linguistischen Grundlagen der Anaphorik und eine Einführung zu Ontologien gegeben. Exemplarisch wird das Forschungsprojekt Ontoverse und die in diesem Rahmen entwickelten Informationsextraktions-Methoden zum Aufbau und zur Pflege der Prototyp-Ontologie BIO2Me aus dem Bereich Bioinformatik vorgestellt.

Zur Beantwortung der Forschungsfrage wurde auf Basis des Algorithmus von MARS das in Ontoverse integrierbare Java-basierte System AnOnto entwickelt. Entscheidende Unterschiede zum Basissystem liegen neben der Implementierungstechnik vor allem in der Methodik der Vorverarbeitung. Die im Rahmen des Ontologie-Management zu verarbeitenden wissenschaftlichen Texte liegen ursprünglich nicht in reinem Textformat, sondern meist als PDF vorliegen und müssen zunächst konvertiert werden. Die Folgen der Konvertierungsprobleme spielen hinsichtlich der Adaptierbarkeit der Indikatoren eine große Rolle. Der Einsatz eines anderen Parsers (Machinese Semantics der Firma Connexor) als im Basissystem, macht die Entwicklung von Methoden und Strategien zur Extraktion von linguistisch relevanten Einheiten - wie z.B. Nominalphrasen und Präpositionalphrasen - notwendig. Die Untersuchung zeigt darüber hinaus, dass entscheidende Modifikationen vor allem hinsichtlich der domänenspezifischen Indikatoren wie Domain Verbs oder Term Preference erforderlich sind. Zur korpusspezifischen automatischen Anpassung dieser Indikatoren wurden spezielle…

Schlagworte

Computerlinguistik, Anaphern, Ontologien, Informationsextraktion, Life Science, Ruslan Mitkov, MARS, BIO2Me, Anaphernresolution, Bioinformatik, Informationsverarbeitung, Informationswissenschaft, Wissensmanagement, Informatik, Sprachwissenschaft

  • Schriftenreihe
    Forschungsergebnisse zur Informatik
  • ISSN
    1435-6260
  • Band
    65

Lieferzeit

(*) Die Lieferzeit beträgt innerhalb Deutschlands üblicherweise 2 bis 3 Werktage ab Zahlungseingang. Bei Bestellungen an Wochenenden und Feiertagen verzögert sich die Auslieferung entsprechend.