Uta Seewald-Heeg (Hrsg.)
Sprachtechnologie für die multilinguale Kommunikation - Textproduktion, Recherche, Übersetzung, Lokalisierung
Beiträge der GLDV-Frühjahrstagung 2003

1. Aufl. 2003. 480 S. DIN A5. Broschur. Beigabe: CD-ROM
EURO 33,00
ISBN 978-3-89796-101-2
Sprachwissenschaft, Computerlinguistik und Neue Medien.
Herausgegeben v. Nico Weber. Band 5

Der Band ist vergriffen.


Sprachtechnologie für die multilinguale Kommunikation hat mittlerweile Eingang in zahlreiche Produkte gefunden, die in vielen Bereichen der Wirtschaft zu einem selbstverständlichen Instrumentarium geworden sind. Gründe hierfür liegen unter anderem im Zusammenrücken der Märkte und dem rasanten Gebrauch des Internet als Recherche-, Informations- und Präsentationsmedium. Die Anforderung an effiziente multilinguale Kommuni-kation in all ihren Facetten stellt insbesondere auch für die Computerlinguistik eine Herausforderung dar, denn die stets wachsende Menge elektronisch verfügbaren Wissens macht Werkzeuge zur Aufbereitung des Wissens, zum Wissensmanagement und zur maschinellen Sprachverarbeitung notwendig. Computerlinguistische Forschung und Entwicklung ist zu Beginn des 21. Jahrhunderts nicht nur eine akademische Übung, sondern inzwischen auch zu einem Gegenstand wirtschaftlichen Interesses geworden. Das Spektrum der in diesem Band enthaltenen Beiträge, die im Rahmen der Frühjahrstagung der Gesellschaft für Linguistische Datenverarbeitung (GLDV) vom 26. bis 28. März 2003 an der Hochschule Anhalt in Köthen präsentiert wurden, umfasst Fragen von sprachtechnologischer Relevanz, die von konkreten Einsatzfeldern wie der Übersetzung bzw. Lokalisierung von Produkten über korpuslinguistische Fragestellungen bis hin zu theoretischen Erörterungen reichen.

Zur CD-ROM:

Im ersten Teil des Bandes, der unter dem Titel "Young Researchers - Abschlussarbeiten" steht, werden die Ergebnisse von fünf Abschlussarbeiten präsentiert, die in die Vorauswahl des Wettbewerbs um den GLDV-Preis 2003 für die beste Abschlussarbeit gekommen sind. Die Publikation des Tagungsbandes zur GLDV-Frühjahrstagung enthält eine CD, auf der die Abschlussarbeiten auch jeweils in ihrer als Diplom- oder Magisterarbeit eingereichten Langform enthalten sind, um die in den Arbeiten vorgestellten Innovationen und Verfahren auch im Detail studieren zu können.
Die vorgestellten Arbeiten reichen von Fragestellungen der Wissensextraktion bis hin zur Textgenerierung und der akustischen Präsentation von Webinhalten: Die Wissensextraktion aus elektronisch verfügbaren Korpora ist sowohl Gegenstand der Arbeit von Christian Biemann, der ein Lernverfahren vorstellt, mit dem aus großen Textkorpora semantische Relationen automatisch extrahiert werden, als auch der Arbeit von Stefan Bordag, der sich mit der Auflösung von Ambiguitäten auf lexikalischer Ebene beschäftigt und hierzu grafentheoretische Ansätze ausnutzt, um mittels eines Approximationsverfahrens Gebrauchskontexte einzelner Wortformen errechnet.
Auch die Arbeit von David Reitter beschäftigt sich mit Fragen der Wissensextraktion. Er entwickelt einen Analysealgorithmus, der die Kohärenzstruktur eines Textes mit Hilfe der Rhetorical Structure Theory analysiert. In einen dem Text-Mining komplementären Bereich, den Bereich der Textgenerierung, fällt die Arbeit von Christian Chiarcos, der eine Satzplanungs-komponente entwickelt, die auf einem kognitiv plausiblen und kohärenten Modell der Sprachproduktion aufbaut, das auf dem Konzept der Salienz als einer Komponente der Topologie mentaler Diskursmodelle beruht.
Der akustischen Präsentation von Webinhalten ist schließlich die Arbeit von Tobias Göbel gewidmet. Er entwickelt in seiner Arbeit ein Verfahren, das Web-Seiten automatisch in VoiceXML-Dokumente transformiert, um sie im Auto, am Telefon oder sehbehinderten Menschen verfügbar machen zu können.

Uta Seewald-Heeg ist auch Mitherausgeberin des Gardez!-Bandes
"Evaluation of the Linguistic Performance of Machine Translation Systems / Evaluation der linguistischen Performanz maschineller Übersetzungssysteme"
(mit Rita Nübel)