Du er ikke logget ind
Beskrivelse
Automatischen Verfahren zur Lexikon-Akquisition gilt schon seit einigen Jahren ein besonderes Forschungsinteresse, da lexikalische Ressourcen bei einer Vielzahl von Systemen zur maschinellen Sprachverarbeitung eine wichtige Rolle spielen und der Aufwand fur den manuellen Aufbau solcher Ressourcen sehr hoch ist. Systeme, die beispielsweise fur die maschinelle Ubersetzung eingesetzt werden, sollten idealerweise den Inhalt eines gegebenen Textes erfassen konnen. Voraussetzung fur die automatische Erfassung des Inhalts eines Textes ist jedoch dessen vollstandige syntaktische Analyse, die nur dann durchgefuhrt werden kann, wenn ein maschinenlesbares syntaktisches Lexikon mit detaillierten Angaben zu Subkategorisierungseigenschaften zur Verfugung steht. Die vorliegende Arbeit beschreibt linguistisches Wissen und darauf aufbauende Verfahren zur automatischen Akquisition von Subkategorisierungsrahmen deutscher Verben aus Textcorpora, die fur den halbautomatischen Aufbau eines Subkategorisierungslexikons mit Angaben zu 6305 Verblemmata und 244 Subkategorisierungsrahmen eingesetzt worden sind. Fur Verben mit satzformigen Komplementen wird gezeigt, wie fehlende Subkategorisierungsrahmen in einem Subkategorisierungslexikon mit Hilfe automatisch anwendbarer, auf Subkategorisierungsalternationen basierender, linguistischer Regeln erganzt werden konnen.