Gemeinsam mit Peter Kolb entstandene Kontext-Wörterbücher für zehn Sprachpaare mit über 80 Millionen Beispielsätzen sowie eine Datenbank mit spanischen Kollokationen. Darüber hinaus bieten wir Leistungen im Bereich der Computerlinguistik und der Sprachtechnologie an.

Linguatools

Dokumente

Erstellung tschechischer und spanischer Grammatik-Regeln und Ressourcen für die maschinelle Weiterverarbeitung. Syntax, Wortbildung, Morphologie? Sprechen Sie mich an.

Ich biete

  • Erstellung und Aufbereitung von Korpora (inkl. Taggen mit dem TreeTagger und Indexierung mit cwb) am Institut für Linguistik (HU)
  • Implementierung einer Cqp-Webschnittstelle am Institut für Linguistik (HU)
  • Lexikonfreier Lemmatisierer, der mit Hilfe der Flexionssuffixe und nur fünf heuristischer Regeln eine deutsche Wortliste lemmatisiert
  • Erstellung des Korpus „Akademisches Deutsch 2006“ (Zusammenfassungen deutscher Dissertationen) für das Studiengebiet Deutsch als Fremdsprache (FU)
  • Technische Planung und Realisierung des Projektes LatinUS am Institut für Romanistik (HU)

Referenzen

Hauptfach: Computerlinguistik mit den Schwerpunkten Textstruktur, Textgenerierung, Korpuslinguistik und maschinelle Übersetzung. Nebenfächer: Tschechische und spanische Linguistik. Abschlussarbeit bei Acrolinx: Evaluation von Ähnlichkeitsmaßen und Clusteringmethoden zum Termclustering.

 

Studium

Petra Prochazkova
Perleberger Str. 55
10559 Berlin


0178/6331861

petra@prochazkova.de


Umsatzsteuer DE283004029

Impressum