Erstellung tschechischer und spanischer Grammatik-Regeln und Ressourcen für die maschinelle Weiterverarbeitung. Syntax, Wortbildung, Morphologie? Sprechen Sie mich an.

Ich biete

Hauptfach: Computerlinguistik mit den Schwerpunkten Textstruktur, Textgenerierung, Korpuslinguistik und maschinelle Übersetzung. Nebenfächer: Tschechische und spanische Linguistik. Abschlussarbeit bei Acrolinx: Evaluation von Ähnlichkeitsmaßen und Clusteringmethoden zum Termclustering.

 

Studium

Dokumente

  • Erstellung und Aufbereitung von Korpora (inkl. Taggen mit dem TreeTagger und Indexierung mit cwb) am Institut für Linguistik (HU)
  • Implementierung einer Cqp-Webschnittstelle am Institut für Linguistik (HU)
  • Lexikonfreier Lemmatisierer, der mit Hilfe der Flexionssuffixe und nur fünf heuristischer Regeln eine deutsche Wortliste lemmatisiert
  • Erstellung des Korpus „Akademisches Deutsch 2006“ (Zusammenfassungen deutscher Dissertationen) für das Studiengebiet Deutsch als Fremdsprache (FU)
  • Technische Planung und Realiserung des Projektes LatinUS am Institut für Romanistik (HU)

Referenzen

Gemeinsam mit Peter Kolb enstandene Kontext-Wörterbücher für zehn Sprachpaare mit über 25 Millionen Beispielsätzen sowie eine Datenbank mit spanischen Kollokationen. Darüber hinaus bieten wir Leistungen im Bereich der Computerlinguistik und der Sprachtechnologie an.

Linguatools

Petra Prochazkova
Perleberger Str. 55
10559 Berlin


030-39839630

petra@prochazkova.de


Steuernummer 34/479/00409
Gemäß §19 UStG erhebe ich auf meine Leistungen keine Umsatzsteuer (Kleinunternehmerstatus).

Impressum