Erstellung tschechischer und spanischer Grammatik-Regeln und Ressourcen für die maschinelle Weiterverarbeitung. Syntax, Wortbildung, Morphologie? Sprechen Sie mich an.
Ich biete
Hauptfach: Computerlinguistik mit den Schwerpunkten Textstruktur, Textgenerierung, Korpuslinguistik und maschinelle Übersetzung. Nebenfächer: Tschechische und spanische Linguistik. Abschlussarbeit bei Acrolinx: Evaluation von Ähnlichkeitsmaßen und Clusteringmethoden zum Termclustering.
Petra Procházková: Fundamentos de la lingüística de corpus Grundlagen der (spanischen) Korpuslinguistik, inklusive deutsch-spanischer Terminologie und Übersicht spanischer Korpora und Tagger.
Erstellung und Aufbereitung von Korpora (inkl. Taggen mit dem TreeTagger und Indexierung mit cwb) am Institut für Linguistik (HU)
Implementierung einer Cqp-Webschnittstelle am Institut für Linguistik (HU)
Lexikonfreier Lemmatisierer, der mit Hilfe der Flexionssuffixe und nur fünf heuristischer Regeln eine deutsche Wortliste lemmatisiert
Erstellung des Korpus „Akademisches Deutsch 2006“ (Zusammenfassungen deutscher Dissertationen) für das Studiengebiet Deutsch als Fremdsprache (FU)
Technische Planung und Realiserung des Projektes LatinUS am Institut für Romanistik (HU)
Referenzen
Gemeinsam mit Peter Kolb enstandene Kontext-Wörterbücher für zehn Sprachpaare mit über 25 Millionen Beispielsätzen sowie eine Datenbank mit spanischen Kollokationen. Darüber hinaus bieten wir Leistungen im Bereich der Computerlinguistik und der Sprachtechnologie an.