Diskontinuitäten in Dependenzparsern

Student:Tilmann Spiegelhauer
Title:Diskontinuitäten in Dependenzparsern
Type:study thesis
Advisors:Fischer, I.; Philippsen, M.
State:submitted on January 15, 2006
Prerequisits:
Topic:

Hintergrund
Zur syntaktischen Beschreibung von natürlichsprachlichen Sätzen sind aus der Linguistik zwei prinzipiell unterschiedliche Verfahren bekannt: das auch aus der Informatik bekannte Parsen mittels einer Phrasenstrukturgrammatik und das Parsen auf der Grundlage der Dependenzgrammatik. Am Lehrstuhl für Programmiersysteme wird ein Analysesystem für natürlichsprachliche Sätze auf Basis der Dependenztheorie entwickelt, dessen Augenmerk besonders auf Wortstellungsvarianten und diskontinuierlichen Konstituenten liegt. Das System setzt sich aus zwei unterschiedlichen Teilen zusammen, der Wörterbuchübersetzung und der Dependenzanalyse. Die Sprache besteht aus einem erweiterten Merkmalstrukturformalismus; der zugehörige Parser basiert auf Unifikation. Gefundene Teilanalysen werden in einer Chart gespeichert. Das Ergebnis der Analyse sind ein oder mehrere Dependenzbäume. Für den Parser existieren Grammatiken für das Lateinische, Englische, Deutsche, Japanische und Ungarische.
Diskontinuierliche Konstituenten sind Konstituenten, die nicht direkt nebeneinander im Satz stehen. Im Satz "Sebastian hat ein Beispiel gefunden, das das Problem illustriert." gehört der Relativsatz zum Objekt, ist aber im Satz von ihm getrennt durch das Partizip 2 des Verbes. Ebenso gehören der finite und der infinite Teil des Verbes zusammen, sie stehen aber nicht nebeneinander.

Aufgabenstellung
Ziel dieser Studienarbeit ist es den existierenden Dependenzparser um die Verarbeitung von diskontinuierlichen Konstituenten zu erweitern. Dabei müssen die in [Dormeyer] beschriebene Lexikonbeschreibungsprache und die dort beschriebenen Algorithmen implementiert und in den existierenden Parser eingepasst werden. Sämtliche bereits existierenden Grammatiken müssen weiter verarbeitbar sein. Die neue Parsererweiterung soll an ausgewählen Phänomenen des Deutschen und Englischen getestet werden.
Weiterhin sollen die in [Pröll] beschriebenen Fehler des Parsers behoben werden.
Bei der Implementierung ist auf Effizienz und Speicherverbrauch, sowie leichte Erweiterbarkeit zu achten.

Literatur
Barta, Csongor ; Dormeyer, Ricarda ; Fischer, Ingrid: Word Order and Discontinuities in a Dependency Grammar for Hungarian . In: Alexin, Zoltan ; Csendes, Dora (Hrsg.) : Proceedings of the 2nd Conference on Hungarian Computational Linguistics (MSZNY 2004) (2nd Conference on Hungarian Computational Linguistics (MSZNY 2004) Szeged, Hungary 9-10 December 2004). Szeged, Hungary : Juhosz Nyomda, 2004, S. 19-27.
Dormeyer, Ricarda: Syntaxanalyse auf Basis der Dependenzgrammatik. Erlangen, Universität, Dissertation, 2004. - 200 Seiten Zugl.: Berlin : Logos-Verlag, 2004 (Studien zur Mustererkennung Bd. 17) ISBN 3-8325-0723-X.
Tröger, Thomas: Ein Chartparser für natürliche Sprache auf der Grundlage der Dependenzgrammatik, Diplomarbeit, Universität Erlangen-Nürnberg, 2003.
Pröll, Alexandra: Dependenzparser für das Japanische, Studienarbeit, Universität Erlangen-Nürnberg, 2004.

watermark seal