Sprachtechnologie für die multilinguale Kommunikation
hat mittlerweile Eingang in zahlreiche Produkte gefunden, die in vielen
Bereichen der Wirtschaft zu einem selbstverständlichen Instrumentarium
geworden sind. Gründe hierfür liegen unter anderem im Zusammenrücken
der Märkte und dem rasanten Gebrauch des Internet als Recherche-, Informations-
und Präsentationsmedium. Die Anforderung an effiziente multilinguale
Kommuni-kation in all ihren Facetten stellt insbesondere auch für die
Computerlinguistik eine Herausforderung dar, denn die stets wachsende
Menge elektronisch verfügbaren Wissens macht Werkzeuge zur Aufbereitung
des Wissens, zum Wissensmanagement und zur maschinellen Sprachverarbeitung
notwendig. Computerlinguistische Forschung und Entwicklung ist zu Beginn
des 21. Jahrhunderts nicht nur eine akademische Übung, sondern inzwischen
auch zu einem Gegenstand wirtschaftlichen Interesses geworden. Das Spektrum
der in diesem Band enthaltenen Beiträge, die im Rahmen der Frühjahrstagung
der Gesellschaft für Linguistische Datenverarbeitung (GLDV) vom 26.
bis 28. März 2003 an der Hochschule Anhalt in Köthen präsentiert wurden,
umfasst Fragen von sprachtechnologischer Relevanz, die von konkreten
Einsatzfeldern wie der Übersetzung bzw. Lokalisierung von Produkten
über korpuslinguistische Fragestellungen bis hin zu theoretischen Erörterungen
reichen.
Zur CD-ROM:
Im
ersten Teil des Bandes, der unter dem Titel "Young Researchers
- Abschlussarbeiten" steht, werden die Ergebnisse von fünf Abschlussarbeiten
präsentiert, die in die Vorauswahl des Wettbewerbs um den GLDV-Preis
2003 für die beste Abschlussarbeit gekommen sind. Die Publikation des
Tagungsbandes zur GLDV-Frühjahrstagung enthält eine CD, auf der die
Abschlussarbeiten auch jeweils in ihrer als Diplom- oder Magisterarbeit
eingereichten Langform enthalten sind, um die in den Arbeiten vorgestellten
Innovationen und Verfahren auch im Detail studieren zu können.
Die vorgestellten Arbeiten reichen von Fragestellungen der Wissensextraktion
bis hin zur Textgenerierung und der akustischen Präsentation von Webinhalten:
Die Wissensextraktion aus elektronisch verfügbaren Korpora ist sowohl
Gegenstand der Arbeit von Christian Biemann, der ein Lernverfahren vorstellt,
mit dem aus großen Textkorpora semantische Relationen automatisch extrahiert
werden, als auch der Arbeit von Stefan Bordag, der sich mit der Auflösung
von Ambiguitäten auf lexikalischer Ebene beschäftigt und hierzu grafentheoretische
Ansätze ausnutzt, um mittels eines Approximationsverfahrens Gebrauchskontexte
einzelner Wortformen errechnet.
Auch die Arbeit von David Reitter beschäftigt sich mit Fragen der Wissensextraktion.
Er entwickelt einen Analysealgorithmus, der die Kohärenzstruktur eines
Textes mit Hilfe der Rhetorical Structure Theory analysiert. In einen
dem Text-Mining komplementären Bereich, den Bereich der Textgenerierung,
fällt die Arbeit von Christian Chiarcos, der eine Satzplanungs-komponente
entwickelt, die auf einem kognitiv plausiblen und kohärenten Modell
der Sprachproduktion aufbaut, das auf dem Konzept der Salienz als einer
Komponente der Topologie mentaler Diskursmodelle beruht.
Der akustischen Präsentation von Webinhalten ist schließlich die Arbeit
von Tobias Göbel gewidmet. Er entwickelt in seiner Arbeit ein Verfahren,
das Web-Seiten automatisch in VoiceXML-Dokumente transformiert, um sie
im Auto, am Telefon oder sehbehinderten Menschen verfügbar machen zu
können.
Uta Seewald-Heeg ist auch Mitherausgeberin des Gardez!-Bandes
"Evaluation
of the Linguistic Performance of Machine Translation Systems / Evaluation
der linguistischen Performanz maschineller Übersetzungssysteme"
(mit Rita Nübel)