summaryrefslogtreecommitdiff
path: root/compound-split/de/wordlist.de
diff options
context:
space:
mode:
authorChris Dyer <cdyer@allegro.clab.cs.cmu.edu>2014-01-18 21:57:32 -0500
committerChris Dyer <cdyer@allegro.clab.cs.cmu.edu>2014-01-18 21:57:32 -0500
commit3c1e7365d8708846dfffd598158571d4c4abd097 (patch)
treebb1865a9e47f82ec5cef353e9ccce5043a255866 /compound-split/de/wordlist.de
parent1bc1a92c0f72fe4266182f9cb467b75e670a1dac (diff)
new tuning of crf compound splitter for wmt14
Diffstat (limited to 'compound-split/de/wordlist.de')
-rw-r--r--compound-split/de/wordlist.de18
1 files changed, 14 insertions, 4 deletions
diff --git a/compound-split/de/wordlist.de b/compound-split/de/wordlist.de
index 676a1e3c..3609b10b 100644
--- a/compound-split/de/wordlist.de
+++ b/compound-split/de/wordlist.de
@@ -1,8 +1,18 @@
-steuer
-teil
+deutschland
+gesamt
+haupt
+heraus
+herausforderung
+herausforderungen
+leistung
+leistungen
mittel
mitteln
-süd
nord
-gesamt
+selbstmord
+steuer
+süd
+teil
+ver
+weise
wieder