Commit 9eb8b75b03c1cff79ef505426d93b4ea23bfe5b1

Authored by Wojciech Jaworski
1 parent 7e3c122d

Model fonetycznny dla polskiego

morphology/data/alternations.dic
... ... @@ -12,7 +12,7 @@
12 12 s′ s′i s′
13 13 v′ v′i v′
14 14 z′ z′i z′
15   - ł′ ł′i ł′
  15 + l li l
16 16 c cy c
17 17 č čy č
18 18 ʒ ʒy ʒ
... ... @@ -20,13 +20,7 @@
20 20 ř řy ř
21 21 # š šy š
22 22 ž žy ž
23   - aʲ ai aʲ
24   - eʲ ei eʲ
25   - iʲ ii iʲ
26   - oʲ oi oʲ
27   - óʲ ói óʲ
28   - uʲ ui uʲ
29   - yʲ yi yʲ
  23 + j ji j
30 24  
31 25 @funkcjonalnie_miekkie_ae
32 26 b′ b′ b′
... ... @@ -39,7 +33,7 @@
39 33 s′ s′ s′
40 34 v′ v′ v′
41 35 z′ z′ z′
42   - ł′ ł′ ł′
  36 + l l l
43 37 c c c
44 38 č č č
45 39 ʒ ʒ ʒ
... ... @@ -47,13 +41,7 @@
47 41 ř ř ř
48 42 # š š š
49 43 ž ž ž
50   - aʲ aʲ aʲ
51   - eʲ eʲ eʲ
52   - iʲ iʲ iʲ
53   - oʲ oʲ oʲ
54   - óʲ óʲ óʲ
55   - uʲ uʲ uʲ
56   - yʲ yʲ yʲ
  44 + j j j
57 45 # c->č č c
58 46  
59 47 @funkcjonalnie_miekkie_wyglos
... ... @@ -88,11 +76,11 @@
88 76 z′ z′ z′
89 77 z′ óz′ oz′
90 78 z′ ąz′ ęz′
91   - ł′ ł′ ł′
92   - ł′ eł′ ł′
93   - ł′ ′eł′ ł′
94   - ł′ ół′ oł′
95   - ł′ ódł′ odł′
  79 + l l l
  80 + l el l
  81 + l ′el l
  82 + l ól ol
  83 + l ódl odl
96 84 c c c
97 85 c ec c
98 86 c ′ec c
... ... @@ -114,24 +102,18 @@
114 102 ř eř ř
115 103 ř ′eř ř
116 104 ř óř oř
117   - ř óʲř oʲř
  105 + ř ójř ojř
118 106 š š š
119 107 ž ž ž
120 108 ž ež ž
121 109 ž óž ož
122 110 ž ąž ęž
123   - aʲ aʲ aʲ
124   - eʲ eʲ eʲ
125   - iʲ iʲ iʲ
126   - oʲ oʲ oʲ
127   - oʲ óʲ oʲ
128   - óʲ óʲ óʲ
129   - uʲ uʲ uʲ
130   - yʲ yʲ yʲ
  111 + j j j
  112 + j ój oj
131 113  
132 114 @funkcjonalnie_twarde_y
133 115 b by b
134   - χ χy χ
  116 + x xy x
135 117 d dy d
136 118 # f fy f
137 119 h hy h
... ... @@ -145,8 +127,8 @@
145 127 t ty t
146 128 v vy v
147 129 # z zy z
148   - ǵ gʲi g
149   - ḱ kʲi k
  130 + g gʲi g
  131 + k kʲi k
150 132 # a ay a
151 133 # e ey e
152 134 # o oy o
... ... @@ -154,7 +136,7 @@
154 136  
155 137 @funkcjonalnie_twarde_e
156 138 b b b
157   - χ χ χ
  139 + x x x
158 140 d d d
159 141 f f f
160 142 h h h
... ... @@ -177,7 +159,7 @@
177 159  
178 160 @funkcjonalnie_twarde_a
179 161 b b b
180   - χ χ χ
  162 + x x x
181 163 d d d
182 164 f f f
183 165 h h h
... ... @@ -200,16 +182,16 @@
200 182  
201 183 @funkcjonalnie_twarde_i
202 184 b b′i b
203   - χ s′i χ
  185 + x s′i x
204 186 d d′i d
205 187 d ed′i ad
206 188 f f′i f
207 189 h z′i h
208   - ł ł′i ł
209   - ł eł′i oł
210   - ł s′ł′i sł
211   - ł z′ł′i zł
212   - ł rz′ł′i řł
  190 + ł li ł
  191 + ł eli oł
  192 + ł s′li sł
  193 + ł z′li zł
  194 + ł rz′li řł
213 195 m m′i m
214 196 m s′m′i sm
215 197 n n′i n
... ... @@ -237,7 +219,7 @@
237 219  
238 220 @funkcjonalnie_twarde_ie
239 221 b b′e b
240   - χ še χ
  222 + x še x
241 223 d d′e d
242 224 d z′d′e zd
243 225 d ed′e ad
... ... @@ -246,13 +228,13 @@
246 228 f f′e f
247 229 h še h
248 230 h že h
249   - ł ł′e ł
250   - ł s′ł′e sł
251   - ł z′ł′e zł
252   - ł eł′e ał
253   - ł eł′e oł
254   - ł etł′e atł
255   - ł ł′ł′e łł
  231 + ł le ł
  232 + ł s′le sł
  233 + ł z′le zł
  234 + ł ele ał
  235 + ł ele oł
  236 + ł etle atł
  237 + ł lle łł
256 238 m m′e m
257 239 m s′m′e sm
258 240 n n′e n
... ... @@ -283,8 +265,8 @@
283 265 b ąb ęb
284 266 b ós′b os′b
285 267 b óz′b oz′b
286   - χ χ χ
287   - χ eχ χ
  268 + x x x
  269 + x ex x
288 270 d d d
289 271 d ed d
290 272 d ód od
... ... @@ -294,7 +276,7 @@
294 276 ł ł ł
295 277 ł eł ł
296 278 ł ′eł ł
297   - ł eł′
  279 + ł el
298 280 ł ół oł
299 281 ł ′oł ł
300 282 ł řeł rł
... ... @@ -360,7 +342,7 @@
360 342 @funkcjonalnie_miekkie_ii
361 343 ai ai ai
362 344 bi bi bi
363   - χi χi χi
  345 + xi xi xi
364 346 di di di
365 347 ǯi ǯi ǯi
366 348 fi fi fi
... ... @@ -385,7 +367,7 @@
385 367 @funkcjonalnie_miekkie_ii_wyglos
386 368 bi bij bi
387 369 ci cyj ci
388   - χi χij χi
  370 + xi xij xi
389 371 di dyj di
390 372 ǯi ǯij ǯi
391 373 fi fij fi
... ... @@ -588,16 +570,16 @@
588 570 d d d
589 571 d ed ad
590 572 k d dk
591   - χ χ χ
  573 + x x x
592 574 h h h
593 575 g ž g
594 576 k k k
595 577 k k kk
596   - ł ł′ ł
597   -* ł eł′ oł
598   - ł eł′ ał
599   - k eł′ ałk
600   -* k ł′ ł′ek
  578 + ł l ł
  579 +* ł el oł
  580 + ł el ał
  581 + k el ałk
  582 +* k l lek
601 583 m m m
602 584 n n′ n
603 585 n en′ an
... ... @@ -625,10 +607,10 @@
625 607 d d′ d
626 608 k t′ k
627 609 * k ž ekk
628   - ł ł′ ł
629   - ł s′ł′ sł
630   - ł z′ł′ zł
631   -* ł rz′ł′ řł
  610 + ł l ł
  611 + ł s′l sł
  612 + ł z′l zł
  613 +* ł rz′l řł
632 614 m m′ m
633 615 n n′ n
634 616 n s′n′ sn
... ... @@ -651,7 +633,7 @@
651 633 k ni nk
652 634 k bi bok
653 635 n ieni on
654   - k ł′ ł′ek
  636 + k l lek
655 637 k ř rok
656 638 k ęzi ąsk
657 639 c ęc ąc
... ... @@ -689,15 +671,15 @@
689 671 ł ł ł
690 672  
691 673 @praet_i
692   - ł ł′i ł
693   -* ł edł′i adł
694   -* ł etł′i otł
695   -* ł es′ł′i osł
696   -* ł ez′ł′i azł
697   -* ł ez′ł′i ozł
698   -* ł s′ł′i sł
699   -* ł z′ł′i zł
700   -* ł eł′i ał
  674 + ł li ł
  675 +* ł edli adł
  676 +* ł etli otł
  677 +* ł es′li osł
  678 +* ł ez′li azł
  679 +* ł ez′li ozł
  680 +* ł s′li sł
  681 +* ł z′li zł
  682 +* ł eli ał
701 683  
702 684 @ae
703 685 a a a
... ... @@ -754,8 +736,8 @@
754 736 ž ž
755 737 r r
756 738 ł ł
757   -* eχ χ
758   -* seχ esχ
  739 +* ex x
  740 +* sex esx
759 741 * šed eš
760 742  
761 743 @patal_j
... ... @@ -784,7 +766,7 @@
784 766 ečn č
785 767 edm d
786 768 egn gi
787   - ekł′n kł′
  769 + ekln kl
788 770 emn mi
789 771 epn pi
790 772 espn spi
... ... @@ -795,7 +777,7 @@
795 777 ežm ž
796 778 ežn ž
797 779 zejm zj
798   - zekł′n skł′
  780 + zekln skl
799 781 zepn spi
800 782 zetn s′ci
801 783  
... ... @@ -809,9 +791,9 @@
809 791 ce t
810 792 če k
811 793 če t
812   -* d′e χ
  794 +* d′e x
813 795 * eše os
814   -* jd′e ł′az
  796 +* jd′e laz
815 797 šče sk
816 798 šče st
817 799 * ęd′e ad
... ... @@ -823,7 +805,7 @@
823 805 že z
824 806 * tanie t
825 807 aje aj
826   - ł′e ł′
  808 + le l
827 809 še s
828 810 * owie w
829 811 * z′re ziar
... ... @@ -833,8 +815,8 @@
833 815 * ieře r
834 816 * pieře epr
835 817 * spieře zepr
836   -* s′t′eł′e esł
837   -* s′t′eł′e sł
  818 +* s′t′ele esł
  819 +* s′t′ele sł
838 820 * edře dar
839 821 * emře mar
840 822 * epře par
... ... @@ -844,7 +826,7 @@
844 826 * ez′re ziar
845 827 * ez′ře ziar
846 828 * ežre žar
847   -* ieł′e eł
  829 +* iele eł
848 830 * zepře spar
849 831 * zetře star
850 832  
... ... @@ -854,7 +836,7 @@
854 836 @nieregularne
855 837 e je jad
856 838 e re ř
857   - e ieł′e eł
  839 + e iele eł
858 840 ie wie wiedzi
859 841 i s′pi sp
860 842 a ma mi
... ... @@ -866,7 +848,7 @@
866 848 @verb_impt
867 849 č k
868 850 č t
869   -* d′ χ
  851 +* d′ x
870 852 * edz ad
871 853 * ed′ od
872 854 * eš os
... ... @@ -875,12 +857,12 @@
875 857 * ez′ az
876 858 * ez′ oz
877 859 * gnij gi
878   -* ieł′ eł
879   -* jd′ ł′az
  860 +* iel eł
  861 +* jd′ laz
880 862 * mnij mi
881 863 * pnij pi
882 864 * ryj ar
883   -* š χ
  865 +* š x
884 866 * tnij ci
885 867 zč k
886 868 zč t
... ... @@ -893,7 +875,7 @@
893 875 * ęž eg
894 876 * s′ s
895 877 * s′cij s
896   -* s′ł′ij sł
  878 +* s′lij sł
897 879 s′nij s
898 880 * s′pij sp
899 881 * z′ z
... ... @@ -904,7 +886,7 @@
904 886 * žǯ zg
905 887 * žyj g
906 888 * z z
907   -* ł′aj ł′
  889 +* laj l
908 890 * rej r
909 891 * sij s
910 892 * wij w
... ... @@ -920,7 +902,7 @@
920 902 * ečnij č
921 903 * edmij d
922 904 * egnij gi
923   -* ekł′nij kł′
  905 +* eklnij kl
924 906 * emnij mi
925 907 * epnij pi
926 908 * espnij spi
... ... @@ -937,11 +919,11 @@
937 919 * pieř epr
938 920 * spieř zepr
939 921 * zejmij zj
940   -* zekł′nij skł′
  922 +* zeklnij skl
941 923 * zepnij spi
942 924 * zetnij s′ci
943   -* s′t′eł′ esł
944   -* s′t′eł′ sł
  925 +* s′t′el esł
  926 +* s′t′el sł
945 927  
946 928 @verb_ną
947 929 gn gi
... ... @@ -961,7 +943,7 @@
961 943 ečn č
962 944 edm d
963 945 egn gi
964   - ekł′n kł′
  946 + ekln kl
965 947 emn mi
966 948 epn pi
967 949 espn spi
... ... @@ -972,33 +954,33 @@
972 954 ežm ž
973 955 ežn ž
974 956 zejm zj
975   - zekł′n skł′
  957 + zekln skl
976 958 zepn spi
977 959 zetn s′ci
978 960  
979 961 @verb_j
980   -* ad eχ
  962 +* ad ex
981 963 č k
982 964 č t
983 965 c t
984 966 * ec ot
985   -* d χ
  967 +* d x
986 968 * edz ad
987 969 * ez az
988 970 * ior r
989   -* jd ł′az
  971 +* jd laz
990 972 * jd š
991 973 * nid eš
992 974 * nid š
993 975 * nijd eš
994 976 * nijd š
995   -* š χ
  977 +* š x
996 978 šč sk
997 979 šč st
998 980 * ójd oš
999 981 * ąd ad
1000 982 * ęd ad
1001   -* s′ł′
  983 +* s′l
1002 984 * s′pi sp
1003 985 žǯ zd
1004 986 žǯ zg
... ... @@ -1017,7 +999,7 @@
1017 999 g g
1018 1000 aj aj
1019 1001 k k
1020   - ł′ ł′
  1002 + l l
1021 1003 s s
1022 1004 t t
1023 1005 w w
... ... @@ -1026,15 +1008,15 @@
1026 1008 z z
1027 1009 * č č
1028 1010 * z′r ziar
1029   -* ieł′
  1011 +* iel
1030 1012 * oř ar
1031 1013 * r ar
1032 1014 * dz d
1033 1015 * bior ebr
1034 1016 * pior epr
1035 1017 * spior zepr
1036   -* s′t′eł′ esł
1037   -* s′t′eł′ sł
  1018 +* s′t′el esł
  1019 +* s′t′el sł
1038 1020 * edr dar
1039 1021 * emr mar
1040 1022 * epr par
... ... @@ -1057,9 +1039,9 @@
1057 1039  
1058 1040 @inf_e
1059 1041 edř dar
1060   - emł′ meł
  1042 + eml meł
1061 1043 emř mar
1062   - epł′ peł
  1044 + epl peł
1063 1045 epř par
1064 1046 espř spar
1065 1047 etř tar
... ... @@ -1067,7 +1049,7 @@
1067 1049 ez′r ziar
1068 1050 ez′ř ziar
1069 1051 ežr žar
1070   - ł′
  1052 + l
1071 1053 r ar
1072 1054 ř ar
1073 1055 zepř spar
... ... @@ -1274,7 +1256,7 @@
1274 1256 bes bes bes
1275 1257 by by by
1276 1258 ce ce ce
1277   - χe χe χe
  1259 + xe xe xe
1278 1260 cy cy cy
1279 1261 de de de
1280 1262 dy dy dy
... ...
morphology/data/fonetics_pl.dic
... ... @@ -5,123 +5,258 @@
5 5 ξ a ą b c ć d e ę f g h k l ł m n ń o ó p r s ś t u w y - ε
6 6 μ a ą b c ć d e ę f g k l ł m n ń o ó p r s ś t u w y ź ż - ε
7 7 λ b c ć d f g h k l ł m n ń p r s ś t w z ź ż - ε
8   -κ b c ć d f g h j k l ł m n ń p r s ś t w z ź ż - ε
9   -σ a ą b c ć d e ę f g i h k l ł m n ń o ó p r s ś t u w y z ź ż - ε
  8 +κ b c ć d f g h i j k l ł m n ń p r s ś t w z ź ż - ε
  9 +σ a ą b c ć d e ę f g j h k l ł m n ń o ó p r s ś t u w y z ź ż - ε
  10 +ρ aε achε amiε ąε eε ęε iε oε omε
  11 +
  12 +@rev_symbols
  13 +ω a ą e ę o ó u
  14 +δ a ą b c ć č d ʒ ǯ e ę f g h x i k l ł m n ń o ó p r ř s ś š t u v w y z ź ž - ε
  15 +λ b c ć č d ʒ ǯ f g h x k l ł m n ń p r ř s ś š t v w z ź ž - ε
  16 +κ b c ć č d ʒ ǯ f g h x i j ʲ k l ł m n ń p r ř s ś š t v w z ź ž - ε
  17 +ρ aε axε am′iε ąε eε ęε iε oε omε
  18 +
  19 +@rev_rules
  20 +p′ pi ω
  21 +p′ p iκ
  22 +pj pi ρ
  23 +b′ bi ω
  24 +b′ b iκ
  25 +bj bi ρ
  26 +m′ mi ω
  27 +m′ m iκ
  28 +m′j mi ρ
  29 +f′ fi ω
  30 +f′ f iκ
  31 +fj fi ρ
  32 +v′ wi ω
  33 +v′ w iκ
  34 +v w δ
  35 +vj wi ρ
  36 +#v w j
  37 +t′ ć λ
  38 +t′ ci ω
  39 +t′ c iκ
  40 +d′ dź λ
  41 +d′ dzi ω
  42 +d′ dz iκ
  43 +ʒ dz
  44 +tʲ ti ω
  45 +tʲ t iκ
  46 +tj ti ρ
  47 +dʲ di ω
  48 +dʲ d iκ
  49 +dj di ρ
  50 +č cz δ
  51 +čʲ czi ω
  52 +čʲ cz iκ
  53 +čʲ cz j
  54 +ǯ dż δ
  55 +ǯʲ dżi ω
  56 +ǯʲ dż iκ
  57 +s′ ś λ
  58 +s′ si ω
  59 +s′ s iκ
  60 +z′ ź λ
  61 +z′ zi ω
  62 +z′ z iκ
  63 +š sz δ
  64 +šʲ sz j
  65 +šʲ szi ω
  66 +šʲ sz iκ
  67 +ž ż δ
  68 +žʲ żi ω
  69 +žʲ ż iκ
  70 +lʲ li ω
  71 +lj li ρ
  72 +ř rz δ
  73 +ř rz j
  74 +rʲ ri ω
  75 +rʲ r iκ
  76 +n′ ń λ
  77 +n′ ni ω
  78 +n′ n iκ
  79 +n′j ni ρ
  80 +kʲ ki ω
  81 +kʲ k iκ
  82 +kʲj ki ρ
  83 +gʲ gi ω
  84 +gʲ g iκ
  85 +gʲj gi ρ
  86 +x ch δ
  87 +xʲ chi ω
  88 +xʲ ch iκ
  89 +xʲj chi ρ
  90 +hʲ hi ω
  91 +hʲ h iκ
  92 +aʲ a i
  93 +eʲ e i
  94 +oʲ o i
  95 +óʲ ó i
  96 +uʲ u i
  97 +iʲ i i
  98 +yʲ y i
10 99  
11 100 @rules
12 101 p′ pi ω
13 102 p′ p iκ
14   -p p δ
  103 +#p p δ
  104 +#p p j
  105 +pj pi ρ
15 106 b′ bi ω
16   -#bʲ bj ω
17 107 b′ b iκ
18   -b b δ
  108 +#b b δ
  109 +bj bi ρ
  110 +#zbitka
  111 +#b b j
19 112 m′ mi ω
20 113 m′ m iκ
21   -m m δ
  114 +#m m δ
  115 +m′j mi ρ
22 116 f′ fi ω
23 117 f′ f iκ
24   -f f δ
  118 +#f f δ
  119 +fj fi ρ
25 120 v′ wi ω
26 121 v′ w iκ
27 122 v w δ
  123 +vj wi ρ
  124 +#zbitka
  125 +#v w j
28 126 t′ ć λ
  127 +#zbitki
  128 +#t′ ć u
  129 +#t′ ć a
  130 +#t′ ć i
29 131 t′ ci ω
30   -cʲ cj ω
  132 +#c c j
31 133 t′ c iκ
32   -c c μ
  134 +#c c μ
33 135 d′ dź λ
34 136 d′ dzi ω
35 137 d′ dz iκ
36 138 ʒ dz δ
37   -t t δ
  139 +#zbitka
  140 +#ʒ dz j
  141 +#t t δ
  142 +#t t j
38 143 tʲ ti ω
39 144 tʲ t iκ
40   -d d ξ
  145 +tj ti ρ
  146 +#d d ξ
41 147 dʲ di ω
42 148 dʲ d iκ
  149 +#d d j
  150 +dj di ρ
43 151 č cz δ
  152 +čʲ czi ω
  153 +čʲ cz iκ
  154 +čʲ cz j
44 155 ǯ dż δ
  156 +ǯʲ dżi ω
  157 +ǯʲ dż iκ
45 158 s′ ś λ
46 159 s′ si ω
47   -sʲ sj ω
  160 +#s s j
48 161 s′ s iκ
49   -s s γ
  162 +#s s γ
50 163 z′ ź λ
51 164 z′ zi ω
52   -zʲ zj ω
  165 +#z z j
53 166 z′ z iκ
54   -z z δ
  167 +#z z δ
55 168 š sz δ
  169 +šʲ sz j
  170 +šʲ szi ω
  171 +šʲ sz iκ
56 172 ž ż δ
57   -ł′ l δ
58   -#lʲ li ω
59   -ł′ l iκ
60   -ł ł δ
  173 +žʲ żi ω
  174 +žʲ ż iκ
  175 +#l l δ
  176 +lʲ li ω
  177 +#l l iκ
  178 +#l l j
  179 +#ł ł δ
  180 +#zbitka
  181 +#ł ł i
  182 +#zbitka
  183 +#ł ł j
  184 +lj li ρ
61 185 ř rz δ
62   -r r γ
  186 +#zbitka
  187 +#ř rz j
  188 +r r zi
  189 +#r r γ
  190 +#r r j
63 191 rʲ ri ω
64 192 rʲ r iκ
65 193 n′ ń λ
66 194 n′ ni ω
67 195 n′ n iκ
68   -n n δ
  196 +#n n δ
  197 +#n n j
  198 +n′j ni ρ
69 199 kʲ ki ω
70 200 kʲ k iκ
71   -k k δ
  201 +#k k δ
  202 +#k k j
  203 +kʲj ki ρ
72 204 gʲ gi ω
73 205 gʲ g iκ
74   -g g δ
75   -χ ch δ
  206 +#g g δ
  207 +gʲj gi ρ
  208 +x ch δ
76 209 xʲ chi ω
77 210 xʲ ch iκ
78   -h h δ
  211 +xʲj chi ρ
  212 +#h h δ
79 213 hʲ hi ω
80 214 hʲ h iκ
81   -a a σ
82   -aʲ aj
83   -e e σ
84   -eʲ ej
85   -o o σ
86   -oʲ oj
87   -ó ó σ
88   -óʲ ój
89   -u u σ
90   -uʲ uj
91   -i i σ
92   -iʲ ij
93   -y y σ
94   -yʲ yj
95   -ą ą σ
96   -ę ę σ
97   -j j
98   -A A
99   -B B
100   -C C
101   -D D
102   -E E
103   -F F
104   -G G
105   -H H
106   -I I
107   -J J
108   -K K
109   -L L
110   -Ł Ł
111   -M M
112   -N N
113   -O O
114   -P P
115   -R R
116   -S S
117   -Ś Ś
118   -T T
119   -U U
120   -W W
121   -Y Y
122   -Z Z
123   -Ż Ż
124   -- -
  215 +#a a σ
  216 +aʲ a i
  217 +#e e σ
  218 +eʲ e i
  219 +#o o σ
  220 +oʲ o i
  221 +#ó ó σ
  222 +óʲ ó i
  223 +#u u σ
  224 +uʲ u i
  225 +#i i σ
  226 +iʲ i i
  227 +#y y σ
  228 +yʲ y i
  229 +#ą ą σ
  230 +#ę ę σ
  231 +#j j
  232 +#A A
  233 +#B B
  234 +#C C
  235 +#Ć Ć
  236 +#D D
  237 +#E E
  238 +#F F
  239 +#G G
  240 +#H H
  241 +#I I
  242 +#J J
  243 +#K K
  244 +#L L
  245 +#Ł Ł
  246 +#M M
  247 +#N N
  248 +#O O
  249 +#P P
  250 +#R R
  251 +#S S
  252 +#Ś Ś
  253 +#T T
  254 +#U U
  255 +#W W
  256 +#Y Y
  257 +#Z Z
  258 +#Ż Ż
  259 +#- -
125 260 #χ́ chi
126 261 #h́ hi
127 262  
... ...
morphology/data/obce.tab
... ... @@ -394,3 +394,1279 @@ rococo
394 394 lastrico
395 395 Servisco
396 396 cornflakes
  397 +developersko
  398 +düsseldorfsko
  399 +écru:d
  400 +explicite
  401 +extra:d
  402 +göteborsko
  403 +harvardzko
  404 +heavymetalowo
  405 +hvarsko
  406 +liverpoolsko
  407 +münstersko
  408 +newage'owo
  409 +novellowsko
  410 +oxfordzko
  411 +quebecko
  412 +queerowo
  413 +qumrańsko
  414 +reykjavicko
  415 +rock’n’rollowo
  416 +saussure’owsko
  417 +sexy:d
  418 +software’owo
  419 +tête-à-tête
  420 +vatowsko
  421 +vipowsko
  422 +vis-à-vis:d
  423 +würzbursko
  424 +niedevelopersko
  425 +niedüsseldorfsko
  426 +niegöteborsko
  427 +nieharvardzko
  428 +nieheavymetalowo
  429 +niehvarsko
  430 +nieliverpoolsko
  431 +niemünstersko
  432 +nienovellowsko
  433 +nieoxfordzko
  434 +niequebecko
  435 +niequeerowo
  436 +niequmrańsko
  437 +niereykjavicko
  438 +nierock’n’rollowo
  439 +niesaussure’owsko
  440 +niesoftware’owo
  441 +nievatowsko
  442 +nievipowsko
  443 +niewürzbursko
  444 +ampexowy
  445 +bouclé:a
  446 +brexitowy
  447 +daviscupowy
  448 +dell’arte:a
  449 +developerski
  450 +düsseldorfski
  451 +dżinsowy
  452 +écru:a
  453 +eventowy
  454 +extra:a
  455 +frotté:a
  456 +göteborski
  457 +harvardzki
  458 +heavymetalowy
  459 +hvarski
  460 +kickboxingowy
  461 +liverpoolski
  462 +maxi
  463 +münsterski
  464 +newage'owy
  465 +nieampexowy
  466 +niedaviscupowy
  467 +niedeveloperski
  468 +niedüsseldorfski
  469 +niegöteborski
  470 +nieharvardzki
  471 +nieheavymetalowy
  472 +niehvarski
  473 +niekickboxingowy
  474 +nieliverpoolski
  475 +niemünsterski
  476 +nienewage'owy
  477 +nienovellowski
  478 +nieoxfordzki
  479 +niequadowy
  480 +niequebecki
  481 +niequizowy
  482 +niequmrański
  483 +niereykjavicki
  484 +nierock’n’rollowy
  485 +niesaussure’owski
  486 +niesoftware’owy
  487 +niesurvivalowy
  488 +nieunixowy
  489 +nievatowski
  490 +nievipowski
  491 +niewürzburski
  492 +novellowski
  493 +oxfordzki
  494 +quadowy
  495 +quebecki
  496 +queerowy
  497 +quizowy
  498 +qumrański
  499 +reykjavicki
  500 +rock’n’rollowy
  501 +saussure’owski
  502 +sauté
  503 +sexy:a
  504 +software’owy
  505 +survivalowy
  506 +unixowy
  507 +vatowski
  508 +video:a
  509 +vipowski
  510 +würzburski
  511 +accusativus
  512 +adiectivum
  513 +adverbium
  514 +affidavit
  515 +agrément
  516 +aide-mémoire
  517 +Ajax
  518 +Aladár
  519 +alvit
  520 +ampex
  521 +ampexowość
  522 +appendix
  523 +aquapark
  524 +assemblé
  525 +Asterix
  526 +attaché
  527 +aval
  528 +Avia
  529 +Avignon
  530 +avocado
  531 +Avogadro
  532 +Avraham
  533 +axel
  534 +Aznavour
  535 +Beauvoir
  536 +becherovka
  537 +Beethoven
  538 +Benelux
  539 +blackjack
  540 +Blixen
  541 +bolivar
  542 +Bolivar
  543 +boliviano
  544 +bonvivant
  545 +bon-vivant
  546 +bordeaux
  547 +Bordeaux
  548 +bouclé:s
  549 +bourrée
  550 +Bovary:s1
  551 +Bovary:s2
  552 +boxing
  553 +Brâtianu
  554 +Brazzaville
  555 +Bregović
  556 +brexit
  557 +brexitowość
  558 +Brontë
  559 +Brückner
  560 +Buñuel
  561 +Buxtehude
  562 +calvados
  563 +Calvados
  564 +Caravaggio
  565 +caravaggionizm
  566 +caravan
  567 +caravaning
  568 +carving
  569 +Ceauşescu
  570 +centavo
  571 +Cervantes
  572 +chargé
  573 +Chevalier
  574 +cheviot:s1
  575 +cheviot:s2
  576 +chevrolet
  577 +Chomsky
  578 +cinéma-vérité
  579 +cinquecento
  580 +Cleveland
  581 +collectivum
  582 +colloquium
  583 +Compaq
  584 +compluvium
  585 +coniunctivus
  586 +coupé
  587 +cover
  588 +Cracovia
  589 +cracoviana
  590 +Craxi
  591 +crossing-over
  592 +curaçao
  593 +ćakra
  594 +d’Alembert
  595 +Däniken
  596 +d’Annunzio
  597 +d’Arc
  598 +d’Arquien
  599 +dativus
  600 +David
  601 +Davies
  602 +Davis
  603 +daviscupowość
  604 +Davos
  605 +Delacroix
  606 +dell’arte:s
  607 +démarche
  608 +Deneuve:s2
  609 +Denver
  610 +désintéressement
  611 +developer
  612 +developerskość
  613 +devotiomoderna
  614 +Discovery
  615 +divertimento
  616 +divertissement
  617 +dixieland
  618 +driver
  619 +Dürer
  620 +Dürrenmatt
  621 +düsseldorfskość
  622 +dźataka
  623 +dźinizm
  624 +écru:s
  625 +Elvis
  626 +entrée
  627 +equalizer
  628 +Essex
  629 +Esterházy
  630 +event
  631 +Everest
  632 +evergreen
  633 +Exbud
  634 +Excelsior
  635 +exemplum
  636 +exequatur
  637 +exodos
  638 +exodus
  639 +expo
  640 +exposé
  641 +expres
  642 +Express
  643 +exsequatur
  644 +extranet
  645 +fauxpas
  646 +favela
  647 +favoritka
  648 +fax
  649 +Fenix
  650 +fixing
  651 +floréal
  652 +frotté:s
  653 +führer
  654 +Gallux
  655 +Galvani
  656 +genetivus
  657 +Giraudoux
  658 +goretex
  659 +gore-tex
  660 +Göteborg
  661 +göteborskość
  662 +Graves
  663 +Guevara
  664 +Günter
  665 +harlequin
  666 +Harvard:s1
  667 +Harvard:s2
  668 +harvardzkość
  669 +Havel
  670 +heavymetal
  671 +heavymetalowiec
  672 +heavymetalowość
  673 +Hendrix
  674 +hexastyl
  675 +Hitlerjugend
  676 +Hoover
  677 +Hortex
  678 +hvarskość
  679 +imperativus
  680 +impluvium
  681 +infinitivus
  682 +Interfax
  683 +interrex
  684 +interview
  685 +iterativum
  686 +Ivan
  687 +Kandinsky
  688 +katzenjamer
  689 +katzenjammer
  690 +Kelvin
  691 +Kevin
  692 +kevlar
  693 +kick-boxer
  694 +kick-boxing
  695 +kickboxingowość
  696 +Kovacz
  697 +Ku-Klux-Klan
  698 +ländler
  699 +landrover
  700 +lavabo
  701 +Lavoisier
  702 +leitmotiv
  703 +lentex
  704 +Levi
  705 +lexus
  706 +Linux
  707 +Liverpool
  708 +liverpoolskość
  709 +locativus
  710 +Ludvig
  711 +Lukács
  712 +lurex
  713 +lux
  714 +luxfer
  715 +Machiavelli
  716 +Malmö
  717 +Malraux
  718 +Marivaux
  719 +Marquez
  720 +matrix
  721 +Max
  722 +maxisingel
  723 +maxwell
  724 +Maxwell
  725 +melex
  726 +Meliés
  727 +Merckx
  728 +Miloszević
  729 +minivan
  730 +mix
  731 +Montevideo
  732 +Münster
  733 +münsterskość
  734 +müsli
  735 +Narvik
  736 +nativespeaker
  737 +Navarra
  738 +neufchâtel
  739 +newage'owość
  740 +nieampexowość
  741 +niebrexitowość
  742 +niedaviscupowość
  743 +niedeveloperskość
  744 +niedüsseldorfskość
  745 +niegöteborskość
  746 +nieharvardzkość
  747 +nieheavymetalowość
  748 +niehvarskość
  749 +niekickboxingowość
  750 +nieliverpoolskość
  751 +niemünsterskość
  752 +nienovellowskość
  753 +nieoxfordzkość
  754 +niequebeckość
  755 +niequeerowość
  756 +niequizowość
  757 +niequmrańskość
  758 +niereykjavickość
  759 +nierock’n’rollowość
  760 +niesoczińskość
  761 +niesoftware’owość
  762 +niesurvivalowość
  763 +nieunixowość
  764 +nievatowskość
  765 +nievipowskość
  766 +niewürzburskość
  767 +Nixon
  768 +nominativus
  769 +non-violence
  770 +Novell
  771 +novellowskość
  772 +novum
  773 +O’Connell
  774 +Oliver
  775 +Olivia
  776 +Olivier
  777 +O’Neill
  778 +opéra-ballet
  779 +öre
  780 +overlock
  781 +oxer
  782 +Oxford
  783 +oxfordzkość
  784 +oxycort
  785 +passivum
  786 +Pavarotti
  787 +Pax
  788 +PAX
  789 +peiorativum
  790 +Pétain
  791 +Petőfi
  792 +Pewex
  793 +pitaval
  794 +plexi
  795 +plexiglas
  796 +Polgár
  797 +pontifex
  798 +praxis
  799 +prequel
  800 +prix
  801 +pulque
  802 +purée
  803 +pyrex
  804 +quad
  805 +quadowiec
  806 +quadriennale
  807 +quadrivium
  808 +quantum
  809 +quasimodo
  810 +Quasimodo
  811 +quattrocento
  812 +quebeckość
  813 +quebracho
  814 +queerowość
  815 +quetzal
  816 +quickstep
  817 +Quinn
  818 +quipu
  819 +Quisling
  820 +Quito
  821 +quiz
  822 +quizowość
  823 +qumrańskość
  824 +quodlibet
  825 +quorum
  826 +Radovan
  827 +randezvous
  828 +Ravel
  829 +Ravensbrück
  830 +ravioli
  831 +recitativo
  832 +refleksivum
  833 +reflexivum
  834 +rendez-vous
  835 +René
  836 +requiem
  837 +résumé
  838 +retriever
  839 +Rex
  840 +reykjavickość
  841 +Reykjavik
  842 +rock’n’roll
  843 +rock’n’rollowość
  844 +Roosevelt
  845 +roquefort
  846 +rover
  847 +Salvador
  848 +Savonarola
  849 +sequel
  850 +sex
  851 +sex-shop
  852 +skikjöring
  853 +skipjack:s1
  854 +skipjack:s2
  855 +slavica
  856 +slow-fox
  857 +software’owość
  858 +soirée
  859 +sollux
  860 +souvenir
  861 +squash
  862 +squat
  863 +squatter
  864 +squaw
  865 +Steven
  866 +Stevenson
  867 +Stradivari
  868 +stradivarius
  869 +substantivum
  870 +survival
  871 +survivalowiec
  872 +survivalowość
  873 +śikhara
  874 +śiwaizm
  875 +śudra
  876 +Tanjug
  877 +taxi
  878 +Teleexpress
  879 +telefax
  880 +telex
  881 +tequila
  882 +Thälmann
  883 +Thorvaldsen
  884 +torques
  885 +tournée
  886 +travelling
  887 +Travolta
  888 +triplex
  889 +trivium
  890 +Universal
  891 +Unix
  892 +unixowość
  893 +vacat
  894 +vacherin
  895 +Vaclav
  896 +vademecum
  897 +validol
  898 +valpolicella
  899 +Vancouver:s1
  900 +Vancouver:s2
  901 +van:s
  902 +vaporetto
  903 +Vargas
  904 +varia
  905 +varietes
  906 +variétés
  907 +varsaviana
  908 +varsavianista
  909 +varsavianistka
  910 +varsavianistyka
  911 +Vasco
  912 +vatermörder
  913 +vatowiec
  914 +vatowskość
  915 +vectra
  916 +vedetta
  917 +Vega
  918 +velarium
  919 +Velazquez
  920 +vendetta
  921 +ventôse
  922 +Ventzislav
  923 +veraikon
  924 +verbum
  925 +Verdi
  926 +Verdun
  927 +verlan
  928 +Vermeer
  929 +Vermont:s1
  930 +Vermont:s2
  931 +Veronese
  932 +Versace
  933 +verso
  934 +vertical
  935 +Vespucci
  936 +veto
  937 +Vetulani
  938 +viagra
  939 +vibrato
  940 +Victoria
  941 +video:s
  942 +vihuela
  943 +villanella
  944 +vina
  945 +vinaigrette
  946 +Vinci
  947 +vintage
  948 +viola
  949 +Violeta
  950 +Violetta
  951 +vipowskość
  952 +virelai
  953 +virement
  954 +Virginia
  955 +vis
  956 +vis-à-vis:s
  957 +Visconti
  958 +vivace
  959 +Vivaldi
  960 +vivant
  961 +vivarium
  962 +viveur
  963 +Vladimir
  964 +vlepka
  965 +vocativus
  966 +Vogel
  967 +Voigt
  968 +Voit
  969 +volapük
  970 +vol-au-vent
  971 +volksdeutsch
  972 +volkslista
  973 +volkswagen
  974 +volt
  975 +volta
  976 +Volta
  977 +volumen
  978 +volvo
  979 +vomitorium
  980 +voodoo
  981 +votum
  982 +voucher
  983 +vouvray
  984 +Vranitzky
  985 +würzburskość
  986 +xantia
  987 +Xawery
  988 +Xenia
  989 +xero
  990 +XML
  991 +Xymena
  992 +banjo
  993 +banjola
  994 +InterCity
  995 +iPad
  996 +iPhone
  997 +iPod
  998 +JavaScript
  999 +MacArthur
  1000 +MacDonald
  1001 +McDonald
  1002 +McLuhan
  1003 +bravissimo
  1004 +Vegas
  1005 +vel
  1006 +versus
  1007 +verte
  1008 +via
  1009 +vice
  1010 +vis-à-vis:p
  1011 +vivat
  1012 +von
  1013 +vulgo
  1014 +vw
  1015 +Abaúj
  1016 +abbreviatura
  1017 +Abélard
  1018 +abraxas
  1019 +Abraxas
  1020 +Ærø
  1021 +alax
  1022 +Aldridge
  1023 +Alexander
  1024 +Alexandrowicz
  1025 +Alexis
  1026 +Almodóvar
  1027 +AltaVista
  1028 +Alvaro
  1029 +Alvarus
  1030 +André
  1031 +Andy
  1032 +Antioquia
  1033 +appellativum
  1034 +aquaplaning
  1035 +Arequipa
  1036 +Ariège
  1037 +Atatürk
  1038 +augmentativum
  1039 +autoexec
  1040 +Avarua
  1041 +avaruański
  1042 +avensis
  1043 +avia
  1044 +aviomarin
  1045 +Axentowicz
  1046 +Axer
  1047 +azotox
  1048 +Bács-Kiskun
  1049 +Barrés
  1050 +Baxter
  1051 +beatbox
  1052 +Becquerel
  1053 +beethovenowski
  1054 +Béla
  1055 +biovital
  1056 +Blanqui
  1057 +Boavista
  1058 +botox
  1059 +bouclé
  1060 +Bourvil
  1061 +Bovary
  1062 +boxster
  1063 +Brändö
  1064 +Brasília
  1065 +Brecqhou
  1066 +Budexpo
  1067 +Calvin
  1068 +Canaveral
  1069 +Canova
  1070 +Caprivi
  1071 +caravaggionista
  1072 +caravaggionistyczny
  1073 +caravaningowy
  1074 +cardox
  1075 +carnival
  1076 +carvingowy
  1077 +Cassavetes
  1078 +Cavalcanti
  1079 +Cavalieri
  1080 +Cavalli
  1081 +cavata
  1082 +cavatina
  1083 +Cavendish
  1084 +Caxton
  1085 +Ceará
  1086 +Charles
  1087 +cheviot
  1088 +chiavetta
  1089 +Chiesanuova
  1090 +chippendale
  1091 +Chongqing
  1092 +Čiovo
  1093 +civic
  1094 +conquista
  1095 +Corcovado
  1096 +Corrèze
  1097 +Cortés
  1098 +Côte
  1099 +Côtes
  1100 +Cotopaxi
  1101 +cultivar
  1102 +Curaçao
  1103 +curving
  1104 +Cuvier
  1105 +ćela
  1106 +darśana
  1107 +Daugavpils
  1108 +Davenport
  1109 +Dąbrovia
  1110 +defectivum
  1111 +déjàvue
  1112 +Delerue
  1113 +dell’arte
  1114 +deminutivum
  1115 +Deneuve
  1116 +Devon
  1117 +ditox
  1118 +Dover
  1119 +Duchovna
  1120 +Duchovny
  1121 +duralexowy
  1122 +düsseldorfczyk
  1123 +düsseldorfka
  1124 +duumvirat
  1125 +Duval
  1126 +Duvall
  1127 +dux
  1128 +dźajnizm
  1129 +dźinijski
  1130 +dźinista
  1131 +dźiwanmukta
  1132 +easyJet
  1133 +eBay
  1134 +eCard
  1135 +Eckerö
  1136 +écru
  1137 +Enquist
  1138 +environment
  1139 +esidrex
  1140 +evanda
  1141 +Evanda
  1142 +Evangelista
  1143 +Evans
  1144 +evasion
  1145 +everyman
  1146 +Evita
  1147 +excelsior
  1148 +expat
  1149 +explorer
  1150 +export
  1151 +expresowy
  1152 +express
  1153 +expresso
  1154 +Expresso
  1155 +extra
  1156 +Extremadura
  1157 +Fårö
  1158 +Faure
  1159 +faxmodem
  1160 +Fejér
  1161 +Finistère
  1162 +Finström
  1163 +fluidex
  1164 +fluxus
  1165 +Föglö
  1166 +Fouquet
  1167 +Franche-Comté
  1168 +Frédéric
  1169 +frotté
  1170 +Fuerteventura
  1171 +Galdhøpiggen
  1172 +gańdźa
  1173 +Gaoxiong
  1174 +Gdovia
  1175 +Gemäldegalerie
  1176 +George
  1177 +Gérard
  1178 +geriavit
  1179 +gerovital
  1180 +gerundivum
  1181 +Giovanni
  1182 +gjuwecz
  1183 +Glover
  1184 +Głogovia
  1185 +Goiás
  1186 +gore
  1187 +Górnovia
  1188 +Gravesen
  1189 +gravis
  1190 +Gregory
  1191 +Grímsvötn
  1192 +Groër
  1193 +Großglockner
  1194 +Großtitlisschanze
  1195 +Grybovia
  1196 +Grytviken
  1197 +Gudźarat
  1198 +Günther
  1199 +Gustavia
  1200 +Győr
  1201 +Hagåtña
  1202 +Hajdú
  1203 +Hannover
  1204 +Hardy
  1205 +haridźan
  1206 +Harvard
  1207 +Harvey
  1208 +Havas
  1209 +Hawai'i
  1210 +Heerenveen
  1211 +Heilongjiang
  1212 +Helvetius
  1213 +herbatox
  1214 +Hévíz
  1215 +hex
  1216 +hexenmeister
  1217 +Höfuðborgarsvæðið
  1218 +Hoogovens
  1219 +Hornindalsvatnet
  1220 +Hōryū
  1221 +House
  1222 +Hübner
  1223 +Hvannadalshnúkur
  1224 +Hvar
  1225 +hydrox
  1226 +hydroxizin
  1227 +Hypernova
  1228 +idéefixe
  1229 +Iguaçu
  1230 +Île-de-France
  1231 +inchoativum
  1232 +intavolatura
  1233 +intensivum
  1234 +interrogativum
  1235 +intransitivum
  1236 +invar
  1237 +Invest
  1238 +Irving
  1239 +Iverson
  1240 +jacquemart
  1241 +jadźńa
  1242 +Jadźurweda
  1243 +Jämtland
  1244 +jaquemart
  1245 +Järva
  1246 +Järvamaa
  1247 +Jarvis
  1248 +Jász-Nagykun-Szolnok
  1249 +Javier
  1250 +Jēkabpils
  1251 +Jelgava
  1252 +Ještěd
  1253 +Jiangxi
  1254 +Joaquin
  1255 +Jõgeva
  1256 +Jõgevamaa
  1257 +Jouvet
  1258 +Jovovich
  1259 +jukebox
  1260 +Jūrmala
  1261 +Kalevipoeg
  1262 +Kangwŏn
  1263 +Kékes
  1264 +kickboxing
  1265 +Kīlauea
  1266 +Kíthira
  1267 +kochanoviana
  1268 +Koguryŏ
  1269 +Köhler
  1270 +Kökar
  1271 +Komárom
  1272 +König
  1273 +Korčula
  1274 +Korvatunturi
  1275 +Kovacs
  1276 +Krüger
  1277 +kuponovka
  1278 +Küttel
  1279 +KwaZulu
  1280 +Kyŏnggi
  1281 +Lääne
  1282 +Läänemaa
  1283 +Lääne-Virumaa
  1284 +Lagerkvist
  1285 +LaSalle
  1286 +Lascaux
  1287 +Lawrence
  1288 +Laxness
  1289 +Leverkusen
  1290 +Levin
  1291 +Levinas
  1292 +Levinson
  1293 +Lévi-Strauss
  1294 +levisy
  1295 +lexmark
  1296 +Libreville
  1297 +Liepāja
  1298 +Limanovia
  1299 +livarot
  1300 +livebox
  1301 +liverpoolczyk
  1302 +liverpoolka
  1303 +Lomé
  1304 +Lovecraft
  1305 +lumpex
  1306 +luxomierz
  1307 +Lysgårdsbakken
  1308 +maalox
  1309 +MacKay
  1310 +MacLean
  1311 +MacLuhan
  1312 +Macquarie
  1313 +madroxin
  1314 +mahjong
  1315 +Malkovich
  1316 +malström
  1317 +Manggha
  1318 +maqam
  1319 +Marañón
  1320 +Marvell
  1321 +Marvin
  1322 +masmix
  1323 +Mátra
  1324 +maverick
  1325 +maxim
  1326 +maxima
  1327 +Maximilian
  1328 +maximum
  1329 +Maxpol
  1330 +McArthur
  1331 +McCain
  1332 +McCoy
  1333 +McCullers
  1334 +McEwan
  1335 +McKinley
  1336 +McLaughlin
  1337 +McLeod
  1338 +McMillan
  1339 +McNeill
  1340 +McQueen
  1341 +McTiernan
  1342 +Melnox
  1343 +Michoacán
  1344 +Midi-Pyrénées
  1345 +Mijatović
  1346 +miralux
  1347 +Moldoveanu
  1348 +Möller
  1349 +Møn
  1350 +Monteverdi
  1351 +Montgomery
  1352 +Mühlenkopfschanze
  1353 +Mulhacén
  1354 +Müller
  1355 +multivan
  1356 +Multivita
  1357 +Multi-Vita
  1358 +Münchhausen
  1359 +Müritz
  1360 +navara
  1361 +Navassa
  1362 +navicert
  1363 +Navratilova
  1364 +nervosol
  1365 +Neuchâtel
  1366 +Nevada
  1367 +Nevis
  1368 +nexia
  1369 +nexus
  1370 +nieavaruański
  1371 +niebeethovenowski
  1372 +niecaravaggionistyczny
  1373 +niecaravaningowy
  1374 +niecarvingowy
  1375 +nieduralexowy
  1376 +niedźinijski
  1377 +nieexpresowy
  1378 +nieextra
  1379 +niequeenslandzki
  1380 +niequezoński
  1381 +nierooseveltowski
  1382 +niesexy
  1383 +niesmoothjazzowy
  1384 +nietelexowy
  1385 +nietexarkański
  1386 +nievarsavianistyczny
  1387 +nievilski
  1388 +Nièvre
  1389 +nievukovarski
  1390 +Ningxia
  1391 +Niven
  1392 +Novak
  1393 +novelletta
  1394 +novial
  1395 +novotel
  1396 +Novotel
  1397 +Nuku'alofa
  1398 +O'ahu
  1399 +Oaxaca
  1400 +octavia
  1401 +Ōkurayama
  1402 +Onyx
  1403 +Öræfajökull
  1404 +Örebro
  1405 +Öskjuvatn
  1406 +Östergötland
  1407 +Østfold
  1408 +overall
  1409 +overbooking
  1410 +overclocking
  1411 +overdubbing
  1412 +oxazepam
  1413 +oxeladin
  1414 +oxford
  1415 +Oxfordshire
  1416 +oxyterracyna
  1417 +Óniseks
  1418 +Paavo
  1419 +padovana
  1420 +Padovano
  1421 +Päijänne
  1422 +paintbox
  1423 +Pál
  1424 +Pará
  1425 +Paricutín
  1426 +Pärnumaa
  1427 +Pavel
  1428 +pavulon
  1429 +Paxton
  1430 +Petöfi
  1431 +pewex
  1432 +Pierce
  1433 +pocztex
  1434 +Põlva
  1435 +Popocatépetl
  1436 +Popović
  1437 +Port-aux-Français
  1438 +Porto-Novo
  1439 +previa
  1440 +Privatdozent
  1441 +proverbium
  1442 +provider
  1443 +Qinghai
  1444 +Qiqihar
  1445 +quap
  1446 +quasi
  1447 +Queensland
  1448 +Queenslandczyk
  1449 +Queenslandka
  1450 +queenslandzki
  1451 +Quentin
  1452 +querela
  1453 +Querétaro
  1454 +quest
  1455 +quezoński
  1456 +Rastislav
  1457 +Réaumur
  1458 +reconquista
  1459 +Reeves
  1460 +rex
  1461 +rexton
  1462 +Reykjavík
  1463 +Rēzekne
  1464 +RheinEnergieStadion
  1465 +rhovyl
  1466 +Ridge
  1467 +rivanol
  1468 +Riviera
  1469 +rooseveltowski
  1470 +Rover
  1471 +Roxana
  1472 +RTV
  1473 +Safjan
  1474 +Saint-Barthélemy
  1475 +Salpausselkä
  1476 +Saltvik
  1477 +Samsø
  1478 +Sándor
  1479 +Sanovia
  1480 +Sansovino
  1481 +saxhorn
  1482 +Schröder
  1483 +sedativa
  1484 +semtex
  1485 +Service
  1486 +Severn
  1487 +sexy
  1488 +Shaanxi
  1489 +Shanxi
  1490 +shire
  1491 +Silver
  1492 +Silvia
  1493 +simplex
  1494 +skate
  1495 +smoothjazzowy
  1496 +Snæfellsjökull
  1497 +Solvay
  1498 +Sør
  1499 +Soufrière
  1500 +squatters
  1501 +Stalexport
  1502 +Stavanger
  1503 +Stavros
  1504 +Stevens
  1505 +Suðurland
  1506 +Suðurnes
  1507 +supernova
  1508 +supervisor
  1509 +Suva
  1510 +Svalbard
  1511 +Sven
  1512 +Svensson
  1513 +Svitlica
  1514 +Svoboda
  1515 +Sylvia
  1516 +Szatmár
  1517 +śaktyzm
  1518 +śilpaśastra
  1519 +tampax
  1520 +Tarnovia
  1521 +tavria
  1522 +tavrija
  1523 +telexowy
  1524 +tex
  1525 +texarkański
  1526 +texel
  1527 +Texel
  1528 +Thingvallavatn
  1529 +Thorshavn
  1530 +Tommy
  1531 +Topkapı
  1532 +Torquemada
  1533 +Torvalds
  1534 +Tórshavn
  1535 +Travis
  1536 +Trevor
  1537 +Triglav
  1538 +Trøndelag
  1539 +Tuchovia
  1540 +Tuvalu
  1541 +übermensch
  1542 +Ullevi
  1543 +unisex
  1544 +univira
  1545 +Vadim
  1546 +Vaduz
  1547 +Vágar
  1548 +vagina
  1549 +Val
  1550 +Valais
  1551 +Valentino
  1552 +Valga
  1553 +Valgamaa
  1554 +Valladolid
  1555 +Valletta
  1556 +Valls
  1557 +valonea
  1558 +van
  1559 +Vancouver
  1560 +Vangelis
  1561 +Vanuatu
  1562 +Vanzetti
  1563 +vaquero
  1564 +Vårdö
  1565 +Varga
  1566 +variorum
  1567 +Värmland
  1568 +varsavianistyczny
  1569 +Varsinais
  1570 +Vas
  1571 +Vasari
  1572 +vaticinium
  1573 +Vaud
  1574 +vauxhall
  1575 +vegantin
  1576 +Vegeta
  1577 +Veltins
  1578 +Ven
  1579 +Venda
  1580 +Vendryes
  1581 +Vendsyssel
  1582 +venflon
  1583 +venta
  1584 +Ventspils
  1585 +Vera
  1586 +Veracruz
  1587 +veramid
  1588 +Verena
  1589 +Verheugen
  1590 +Verhofstadt
  1591 +Vermont
  1592 +Vest
  1593 +Vestfirðir
  1594 +Vestfold
  1595 +Vesturland
  1596 +Victor
  1597 +victoria
  1598 +Vidal
  1599 +video
  1600 +videoblog
  1601 +videoclip
  1602 +videotelefon
  1603 +Vidor
  1604 +Vienne
  1605 +Vietcong
  1606 +Vijandi
  1607 +Vijay
  1608 +Vikersundbakken
  1609 +Viktor
  1610 +Vilaine
  1611 +vilcacora
  1612 +Viljandimaa
  1613 +Villardczycy
  1614 +Villas
  1615 +Villon
  1616 +vilski
  1617 +Vincent
  1618 +Vincenz
  1619 +vioform
  1620 +viper
  1621 +virga
  1622 +Viru
  1623 +Virumaa
  1624 +Vis
  1625 +visa
  1626 +Visa
  1627 +vis-à-vis
  1628 +Vista
  1629 +Vitamed
  1630 +vitara
  1631 +vitaral
  1632 +Vitus
  1633 +Vizcaya
  1634 +Vlaminck
  1635 +vlepkarz
  1636 +vlog
  1637 +Vogt
  1638 +Vogtlandarena
  1639 +Volker
  1640 +Volkskammer
  1641 +Volkswagen
  1642 +Vonnegut
  1643 +Vorarlberg
  1644 +Vormsi
  1645 +Võru
  1646 +Võrumaa
  1647 +Vossler
  1648 +voyeur
  1649 +voyeuryzm
  1650 +Vredeman
  1651 +Vries
  1652 +Vukovar
  1653 +vukovarski
  1654 +Vulcano
  1655 +Vuoksi
  1656 +Vytautas
  1657 +wajśja
  1658 +Wallström
  1659 +Waverley
  1660 +Wilde
  1661 +Xavier
  1662 +xedos
  1663 +xenia
  1664 +Xining
  1665 +Xinjiang
  1666 +xsara
  1667 +Yvelines
  1668 +Zemplén
  1669 +zovirax
  1670 +Zvezda
  1671 +Þingvallavatn
  1672 +Þórisvatn
... ...
morphology/data/rules.dic
... ... @@ -18,8 +18,8 @@
18 18 @ADJ-FLEX
19 19 funkcjonalnie_miekkie_iy flex=y con cat=adj
20 20 funkcjonalnie_twarde_y flex=y con cat=adj
21   - funkcjonalnie_miekkie_iy χ flex=ych con cat=adj
22   - funkcjonalnie_twarde_y χ flex=ych con cat=adj
  21 + funkcjonalnie_miekkie_iy x flex=ych con cat=adj
  22 + funkcjonalnie_twarde_y x flex=ych con cat=adj
23 23 funkcjonalnie_miekkie_iy m flex=ym con cat=adj
24 24 funkcjonalnie_twarde_y m flex=ym con cat=adj
25 25 funkcjonalnie_miekkie_iy m′i flex=ymi con cat=adj
... ... @@ -28,8 +28,8 @@
28 28 funkcjonalnie_twarde_e e flex=e con cat=adj
29 29 funkcjonalnie_miekkie_ae ego flex=ego con cat=adj
30 30 funkcjonalnie_twarde_e ego flex=ego con cat=adj
31   - funkcjonalnie_miekkie_ae eʲ flex=ej con cat=adj
32   - funkcjonalnie_twarde_e eʲ flex=ej con cat=adj
  31 + funkcjonalnie_miekkie_ae ej flex=ej con cat=adj
  32 + funkcjonalnie_twarde_e ej flex=ej con cat=adj
33 33 funkcjonalnie_miekkie_ae emu flex=emu con cat=adj
34 34 funkcjonalnie_twarde_e emu flex=emu con cat=adj
35 35 funkcjonalnie_miekkie_ae a flex=a con cat=adj
... ... @@ -45,12 +45,12 @@
45 45  
46 46 @ADJ-FLEX-GRAD
47 47 sz y flex=y cat=adj:grad
48   - sz yχ flex=ych cat=adj:grad
  48 + sz yx flex=ych cat=adj:grad
49 49 sz ym flex=ym cat=adj:grad
50 50 sz ym′i flex=ymi cat=adj:grad
51 51 sz e flex=e cat=adj:grad
52 52 sz ego flex=ego cat=adj:grad
53   - sz eʲ flex=ej cat=adj:grad
  53 + sz ej flex=ej cat=adj:grad
54 54 sz emu flex=emu cat=adj:grad
55 55 sz a flex=a cat=adj:grad
56 56 sz ą flex=ą cat=adj:grad
... ... @@ -58,7 +58,7 @@
58 58  
59 59 @ADJ-GRAD
60 60 adj_grad_sz š grad=sz con
61   - adj_grad_iejsz eʲš grad=iejsz con
  61 + adj_grad_iejsz ejš grad=iejsz con
62 62  
63 63 @ADV-FLEX
64 64 funkcjonalnie_miekkie_ae o flex=o con cat=adv
... ... @@ -71,9 +71,9 @@
71 71 funkcjonalnie_miekkie_iy flex=y1 con cat=noun
72 72 funkcjonalnie_twarde_y flex=y2 con cat=noun
73 73 funkcjonalnie_miekkie_ii flex=y3 con cat=noun
74   - funkcjonalnie_miekkie_iy χ flex=ych con cat=noun
75   - funkcjonalnie_twarde_y χ flex=ych con cat=noun
76   - funkcjonalnie_miekkie_ii χ flex=ych con cat=noun
  74 + funkcjonalnie_miekkie_iy x flex=ych con cat=noun
  75 + funkcjonalnie_twarde_y x flex=ych con cat=noun
  76 + funkcjonalnie_miekkie_ii x flex=ych con cat=noun
77 77 funkcjonalnie_miekkie_iy m flex=ym con cat=noun
78 78 funkcjonalnie_twarde_y m flex=ym con cat=noun
79 79 funkcjonalnie_miekkie_ii m flex=ym con cat=noun
... ... @@ -99,9 +99,9 @@
99 99 funkcjonalnie_twarde_a a flex=a2 con cat=noun
100 100 funkcjonalnie_miekkie_ii a flex=a3 con cat=noun
101 101 kontrakcje a flex=a4 con cat=noun
102   - funkcjonalnie_miekkie_ae aχ flex=ach con cat=noun
103   - funkcjonalnie_twarde_a aχ flex=ach con cat=noun
104   - funkcjonalnie_miekkie_ii aχ flex=ach con cat=noun
  102 + funkcjonalnie_miekkie_ae ax flex=ach con cat=noun
  103 + funkcjonalnie_twarde_a ax flex=ach con cat=noun
  104 + funkcjonalnie_miekkie_ii ax flex=ach con cat=noun
105 105 funkcjonalnie_miekkie_ae am′i flex=ami con cat=noun
106 106 funkcjonalnie_twarde_a am′i flex=ami con cat=noun
107 107 funkcjonalnie_miekkie_ii am′i flex=ami con cat=noun
... ... @@ -149,7 +149,7 @@
149 149 kapitaliki_y flex=yC con cat=noun
150 150 kapitaliki_e e flex=eC con cat=noun
151 151 kapitaliki_e em flex=emC con cat=noun
152   - kapitaliki_a aχ flex=achC con cat=noun
  152 + kapitaliki_a ax flex=achC con cat=noun
153 153 kapitaliki_a am′i flex=amiC con cat=noun
154 154 kapitaliki_a a flex=aC con cat=noun
155 155 kapitaliki_a ą flex=ąC con cat=noun
... ... @@ -167,7 +167,7 @@
167 167 @GER-FLEX
168 168 ger om flex=om
169 169 ger am′i flex=ami
170   - ger aχ flex=ach
  170 + ger ax flex=ach
171 171 ger e flex=e
172 172 ger a flex=a
173 173 ger u flex=u
... ... @@ -175,7 +175,7 @@
175 175 ger_wyglos flex=ε
176 176  
177 177 @PACT-FLEX
178   - pact yχ flex=ych
  178 + pact yx flex=ych
179 179 pact ym flex=ym
180 180 pact ym′i flex=ymi
181 181 pact e flex=e
... ... @@ -189,7 +189,7 @@
189 189 pact flex=ε
190 190  
191 191 @PPAS-FLEX
192   - ppas yχ flex=ych
  192 + ppas yx flex=ych
193 193 ppas ym flex=ym
194 194 ppas ym′i flex=ymi
195 195 ppas e flex=e
... ... @@ -313,7 +313,7 @@
313 313 funkcjonalnie_twarde_i e group=ie cat=verb
314 314  
315 315 @NOUN-FLEX-FOREIGN
316   - obce_funkcjonalnie_miekkie_ae aχ flex=ach1f con cat=noun
  316 + obce_funkcjonalnie_miekkie_ae ax flex=ach1f con cat=noun
317 317 obce_funkcjonalnie_miekkie_ae ami flex=ami1f con cat=noun
318 318 obce_funkcjonalnie_miekkie_ae a flex=a1f con cat=noun
319 319 obce_funkcjonalnie_miekkie_ae ą flex=ą1f con cat=noun
... ... @@ -329,7 +329,7 @@
329 329 obce_funkcjonalnie_miekkie_ae ów flex=ów1f con cat=noun
330 330 obce_funkcjonalnie_miekkie_ae u flex=u1f con cat=noun
331 331 obce_funkcjonalnie_twarde_iy flex=y2f con cat=noun
332   - obce_funkcjonalnie_twarde_iy χ flex=ych2f con cat=noun
  332 + obce_funkcjonalnie_twarde_iy x flex=ych2f con cat=noun
333 333 obce_funkcjonalnie_twarde_iy m flex=ym2f con cat=noun
334 334 obce_funkcjonalnie_twarde_iy mi flex=ymi2f con cat=noun
335 335 obce_funkcjonalnie_twarde_ie flex=ie2f con cat=noun
... ... @@ -338,7 +338,7 @@
338 338 obce_funkcjonalnie_twarde_e em flex=em2f con cat=noun
339 339 obce_funkcjonalnie_twarde_e emu flex=emu2f con cat=noun
340 340 obce_funkcjonalnie_twarde_a a flex=a2f con cat=noun
341   - obce_funkcjonalnie_twarde_a aχ flex=ach2f con cat=noun
  341 + obce_funkcjonalnie_twarde_a ax flex=ach2f con cat=noun
342 342 obce_funkcjonalnie_twarde_a ami flex=ami2f con cat=noun
343 343 obce_funkcjonalnie_twarde_a ą flex=ą2f con cat=noun
344 344 obce_funkcjonalnie_twarde_a ę flex=ę2f con cat=noun
... ... @@ -350,7 +350,7 @@
350 350 obce_funkcjonalnie_twarde_a u flex=u2f con cat=noun
351 351 obce_funkcjonalnie_twarde_i flex=i2f con cat=noun
352 352 obce_funkcjonalnie_twarde_wyglos flex=ε2f con cat=noun
353   - obce_funkcjonalnie_miekkie_iy χ flex=ych1f con cat=noun
  353 + obce_funkcjonalnie_miekkie_iy x flex=ych1f con cat=noun
354 354 obce_funkcjonalnie_miekkie_iy m flex=ym1f con cat=noun
355 355 obce_funkcjonalnie_miekkie_iy mi flex=ymi1f con cat=noun
356 356 obce_funkcjonalnie_miekkie_iy flex=y1f con cat=noun
... ... @@ -358,8 +358,8 @@
358 358 obce_eu go flex=ego3f con cat=noun
359 359 obce_eu m flex=em3f con cat=noun
360 360 obce_eu mu flex=emu3f con cat=noun
361   - obce_eu χ flex=ech3f con cat=noun
362   - obce_ech χ flex=ech4f con cat=noun
  361 + obce_eu x flex=ech3f con cat=noun
  362 + obce_ech x flex=ech4f con cat=noun
363 363  
364 364 @NOUN-FLEX-APOSTROF
365 365 obce_ais ’go flex='ego2 con cat=noun
... ... @@ -381,7 +381,7 @@
381 381 obce_apostrof ’i flex='i con cat=noun
382 382 obce_apostrof ’om flex='om con cat=noun
383 383 obce_apostrof ’ami flex='ami con cat=noun
384   - obce_apostrof ’aχ flex='ach con cat=noun
  384 + obce_apostrof ’ax flex='ach con cat=noun
385 385 obce_apostrof 'a flex='a con cat=noun
386 386 obce_apostrof 'u flex='u con cat=noun
387 387 obce_apostrof 'owi flex='owi con cat=noun
... ... @@ -397,7 +397,7 @@
397 397 obce_apostrof 'i flex='i con cat=noun
398 398 obce_apostrof 'om flex='om con cat=noun
399 399 obce_apostrof 'ami flex='ami con cat=noun
400   - obce_apostrof 'aχ flex='ach con cat=noun
  400 + obce_apostrof 'ax flex='ach con cat=noun
401 401 obce_apostrof flex='ε con cat=noun
402 402  
403 403 @NOUN-142
... ...
morphology/dict.ml
... ... @@ -365,6 +365,11 @@ let remove_exceptional_lemmata dict =
365 365 if StringSet.mem exceptional_lemmata entry.lemma then dict
366 366 else entry :: dict)
367 367  
  368 +let remove_exceptional_lemmata_gen ex dict =
  369 + Xlist.fold dict [] (fun dict entry ->
  370 + if StringSet.mem ex entry.lemma then dict
  371 + else entry :: dict)
  372 +
368 373 let generate_stem dict =
369 374 Xlist.rev_map dict (fun entry ->
370 375 {entry with stem=
... ... @@ -387,9 +392,9 @@ let fonetic_translation dict =
387 392 Xlist.fold dict [] (fun dict e ->
388 393 try
389 394 let lemma,lemma_suf = Stem.simplify_lemma_full e.lemma in
390   - {e with lemma = Fonetics.translate Fonetics.rules lemma;
  395 + {e with lemma = List.hd (Fonetics.translate true Fonetics.rules lemma); (* FIXME *)
391 396 forms = Xlist.map e.forms (fun f ->
392   - {f with orth = Fonetics.translate Fonetics.rules f.orth})} :: dict
  397 + {f with orth = List.hd (Fonetics.translate true Fonetics.rules f.orth)})} :: dict (* FIXME *)
393 398 with _ -> dict)
394 399  
395 400 let validate rules dict =
... ...
morphology/fonetics.ml
1 1 open Xstd
2 2 open Printf
3 3  
4   -type status = Idle | Symbols | Rules
  4 +type status = Idle | Symbols | Rules | RevSymbols | RevRules
5 5 type rule = {set: string; find: string; suf: string}
6 6  
7 7 module CharTree = struct
... ... @@ -58,20 +58,27 @@ module CharTree = struct
58 58 end
59 59  
60 60 let load_rules filename =
61   - let status,symbol_defs,rules = File.fold_tab filename (Idle,StringMap.empty,[]) (fun (status,symbol_defs,rules) -> function
62   - ["@symbols"] -> Symbols,symbol_defs,rules
63   - | ["@rules"] -> Rules,symbol_defs,rules
64   - | [key;vals] ->
65   - if status <> Symbols then failwith "Fonetics.load_rules: status" else
66   - status, StringMap.add symbol_defs key (Xstring.split " " vals), rules
  61 + let status,symbol_defs,rev_symbol_defs,rules,rev_rules =
  62 + File.fold_tab filename (Idle,StringMap.empty,StringMap.empty,[],[]) (fun (status,symbol_defs,rev_symbol_defs,rules,rev_rules) -> function
  63 + ["@symbols"] -> Symbols,symbol_defs,rev_symbol_defs,rules,rev_rules
  64 + | ["@rev_symbols"] -> RevSymbols,symbol_defs,rev_symbol_defs,rules,rev_rules
  65 + | ["@rules"] -> Rules,symbol_defs,rev_symbol_defs,rules,rev_rules
  66 + | ["@rev_rules"] -> RevRules,symbol_defs,rev_symbol_defs,rules,rev_rules
  67 + | [key;vals] ->
  68 + (match status with
  69 + Symbols -> status, StringMap.add symbol_defs key (Xstring.split " " vals), rev_symbol_defs, rules, rev_rules
  70 + | RevSymbols -> status, symbol_defs, StringMap.add rev_symbol_defs key (Xstring.split " " vals), rules, rev_rules
  71 + | _ -> failwith "Fonetics.load_rules: status 1")
67 72 | [v;r;s] ->
68   - if status <> Rules then failwith "Fonetics.load_rules: status" else
69   - status, symbol_defs, {set=v; find=r; suf=s} :: rules
  73 + (match status with
  74 + Rules -> status, symbol_defs, rev_symbol_defs, {set=v; find=r; suf=s} :: rules, rev_rules
  75 + | RevRules -> status, symbol_defs, rev_symbol_defs, rules, {set=r; find=v; suf=s} :: rev_rules
  76 + | _ -> failwith "Fonetics.load_rules: status 2")
70 77 | line -> failwith ("load_rules: " ^ (String.concat "\t" line))) in
71   - if status <> Rules then failwith "Fonetics.load_rules: status" else
72   - symbol_defs, rules
  78 + if status <> Rules && status <> RevRules then failwith "Fonetics.load_rules: status 3" else
  79 + symbol_defs, rev_symbol_defs, rules, rev_rules
73 80  
74   -let prepare_rules (symbol_defs,rules) =
  81 +let prepare_rules symbol_defs rules =
75 82 (* let symbol_defs = StringMap.map symbol_defs (function
76 83 "ε" -> ""
77 84 | s -> s) in *)
... ... @@ -83,28 +90,30 @@ let prepare_rules (symbol_defs,rules) =
83 90 {r with suf=String.concat "" l}))) in
84 91 CharTree.create rules
85 92  
86   -let rules = prepare_rules (load_rules "data/fonetics_pl.dic")
  93 +let rules, rev_rules =
  94 + let symbol_defs,rev_symbol_defs,rules,rev_rules = load_rules "data/fonetics_pl.dic" in
  95 + prepare_rules symbol_defs rules,
  96 + prepare_rules rev_symbol_defs rev_rules
87 97  
88   -exception TranslateNotFound of string
89   -exception TranslateMultipleSolutions of string
90   -
91   -let rec translate_rec found rules s =
92   - if s = "ε" then List.rev found else
  98 +let rec translate_rec closure found rules s =
  99 + if s = "ε" then [List.rev found] else
93 100 let l = CharTree.find rules s in
94 101 (* Xlist.iter l (fun (t,r) ->
95 102 printf "s=%s t=%s set=%s find=%s suf=%s\n%!" s t r.set r.find r.suf); *)
96   - match l with
97   - [] -> raise (TranslateNotFound s)
98   - | [t,r] ->
99   - translate_rec (r.set :: found) rules (r.suf ^ t)
100   - | _ -> raise (TranslateMultipleSolutions s)
101   -
102   -let translate rules s =
  103 + let l = if l = [] && closure then
  104 + let n = String.length s in
  105 + let c = String.sub s 0 1 in
  106 + [String.sub s 1 (n-1),{find=c; set=c; suf=""}] else l in
  107 + List.flatten (Xlist.rev_map l (fun (t,r) ->
  108 + translate_rec closure (r.set :: found) rules (r.suf ^ t)))
  109 +
  110 +let translate closure rules s =
103 111 (* printf "translate 1: %s\n%!" s; *)
104   - let l = translate_rec [] rules (s ^ "ε") in
105   - let s = String.concat "" l in
  112 + let ll = translate_rec closure [] rules (s ^ "ε") in
  113 + Xlist.rev_map ll (String.concat "")
  114 +(* let s = String.concat "" l in
106 115 (* printf "translate 2: %s\n%!" s; *)
107   - s
  116 + s*)
108 117  
109 118 (*let _ = translate rules "blafickie"
110 119 let _ = translate rules "blafiacki"
... ...
morphology/generate.ml
... ... @@ -137,24 +137,44 @@ let _ =
137 137 (* Dict.split_dict sgjp_path polimorf_filename results_path; *)
138 138 ()
139 139  
  140 +let obce = StringSet.of_list (File.load_lines "../morphology/data/obce.tab")
  141 +
  142 +let find_not_fonetic_parsed ex path filename =
  143 + let dict = Dict.load_tab_full (path ^ filename) in
  144 + let dict = Dict.remove_exceptional_lemmata_gen ex dict in
  145 + Xlist.iter dict (fun e ->
  146 + Xlist.iter e.forms (fun f ->
  147 + if Fonetics.translate false Fonetics.rules f.orth = [] then printf "%s\n%!" e.lemma))
  148 +
  149 +(* Test translacji fonetycznej *)
  150 +let _ =
  151 + (* find_not_fonetic_parsed obce results_path adv_sgjp_filename; *)
  152 + (* find_not_fonetic_parsed obce results_path adj_sgjp_filename; *)
  153 + (* find_not_fonetic_parsed obce results_path noun_sgjp_filename; *)
  154 + (* find_not_fonetic_parsed obce results_path verb_sgjp_filename; *)
  155 + (* find_not_fonetic_parsed obce sgjp_path sgjp_filename; *)
  156 + (* find_not_fonetic_parsed obce sgjp_path polimorf_filename; *)
  157 + ()
  158 +
140 159 let test_fonetics path filename =
141 160 let dict = Dict.load_tab_full (path ^ filename) in
  161 + let dict = Dict.remove_exceptional_lemmata_gen obce dict in
142 162 Xlist.iter dict (fun e ->
143 163 Xlist.iter e.forms (fun f ->
144   - let _ =
145   - try Fonetics.translate Fonetics.rules f.orth with
146   - Fonetics.TranslateNotFound s -> printf "NF %s %s\n%!" f.orth s; ""
147   - | Fonetics.TranslateMultipleSolutions s -> printf "MS %s %s\n%!" f.orth s; ""
148   - in
149   - ()));
  164 + let l = Fonetics.translate true Fonetics.rules f.orth in
  165 + Xlist.iter l (fun s ->
  166 + match StringSet.to_list (StringSet.of_list (Fonetics.translate true Fonetics.rev_rules s)) with
  167 + [] -> printf "NF %s %s\n%!" f.orth s
  168 + | [t] -> if t <> f.orth then printf "NE %s %s %s\n%!" f.orth s t
  169 + | l -> printf "MS %s %s: %s\n%!" f.orth s (String.concat " " l))));
150 170 ()
151 171  
152 172 (* Test translacji fonetycznej *)
153 173 let _ =
154   - (* test_fonetics results_path adv_sgjp_filename;
  174 + test_fonetics results_path adv_sgjp_filename;
155 175 test_fonetics results_path adj_sgjp_filename;
156 176 test_fonetics results_path noun_sgjp_filename;
157   - test_fonetics results_path verb_sgjp_filename; *)
  177 + test_fonetics results_path verb_sgjp_filename;
158 178 ()
159 179  
160 180 (* Wypisanie nieodmiennych *)
... ... @@ -250,7 +270,7 @@ let _ =
250 270  
251 271 (* Generowanie reguł *)
252 272 let _ =
253   - Dict.generate_rules compound_rule_trees results_path adj_sgjp_filename "results/rules-odm-adj.txt";
  273 + (* Dict.generate_rules compound_rule_trees results_path adj_sgjp_filename "results/rules-odm-adj.txt"; *)
254 274 (* Dict.generate_rules compound_rule_trees results_path noun_sgjp_filename "results/rules-odm-noun.txt"; *)
255 275 (* Dict.generate_rules compound_rule_trees results_path adv_sgjp_filename "results/rules-adv.txt"; *)
256 276 (* Dict.generate_rules compound_rule_trees results_path verb_sgjp_filename "results/rules-verb.txt"; *)
... ...