prepare_odm.sh
404 Bytes
odm=~/Pulpit/kuznia-pliki/sjp-odm-20120428/odm.txt
morfologik=~/Pulpit/kuznia-pliki/morfologik-distribution-1.5.2/lib/morfologik-tools-1.5.2.jar
enconv "$odm"
grep '[^,] ' "$odm" -v > bezspacji.txt
sed 's/$/\nxqxq/' bezspacji.txt > odm2.txt
java -jar "$morfologik" plstem -i odm2.txt --ie utf-8 > odm-tagged.txt
sed 's/xqxq.*//' odm-tagged.txt > to_disamb.txt
rm bezspacji.txt odm2.txt odm-tagged.txt