Commit d58c85840a3622b4440d52146b609b93b91d5e67
1 parent
a2056391
reguły morfologiczne dla ortografii obcej
Showing
4 changed files
with
295 additions
and
0 deletions
morphology/data/alternations.dic
... | ... | @@ -412,6 +412,7 @@ |
412 | 412 | szj szyj szj |
413 | 413 | zj zyj zj |
414 | 414 | |
415 | + | |
415 | 416 | @kontrakcje |
416 | 417 | t ę ęt |
417 | 418 | t ęci ęt |
... | ... | @@ -1078,3 +1079,207 @@ |
1078 | 1079 | zetrz star |
1079 | 1080 | źr ziar |
1080 | 1081 | |
1082 | +# gwiazdka con rozpoznawany_fragment fragment_przepisywany_w_lemacie | |
1083 | + | |
1084 | +@obce_funkcjonalnie_twarde_a | |
1085 | + c k c # Fonseca, Lorca, Sica, nasca itd. | |
1086 | + ch ch ch # cha-cha -> cha-chy | |
1087 | + gh gh gh # Aghi | |
1088 | + m m m # Bramah | |
1089 | + shu shu shu | |
1090 | + szu szu szu # Joszua | |
1091 | + du du du # Pardua | |
1092 | + tu tu tu # Gargantua | |
1093 | + use uz use # berceuse -> berceuzą, zę itd. | |
1094 | + v v v # Java, baklava -> Jav | |
1095 | + x x x # Dixa, Laxa, Jaxa | |
1096 | + z z z # pizza, stanza | |
1097 | + | |
1098 | +@obce_funkcjonalnie_twarde_ae | |
1099 | + ac ak ac | |
1100 | + ec ek ec | |
1101 | + ic ik ic | |
1102 | + oc ok oc # Optiroc | |
1103 | + aq ak aq # Haq | |
1104 | + cq k cq # Gracq | |
1105 | + c c c # Lorce | |
1106 | + c ce c # Lorca -> Lorce | |
1107 | + ey ey ey # Cartney, Presley, cockney... | |
1108 | + ay ay ay # Thackeray | |
1109 | + oy oy oy # Boy | |
1110 | + dok dk dok # Akademgorodok | |
1111 | + gh dz gh # Agha | |
1112 | + gy gy gy # Nagy -> Nagya itd. | |
1113 | + ay ay ay # Kayah (tu można by wydzielić męskie) | |
1114 | + dź dź dź # pudźa -> pudźom | |
1115 | + gh gh gh # Gogh, Pittsburgh | |
1116 | + gi gi gi # Borgia | |
1117 | + gn gn gn | |
1118 | + kie k kie # Bandtkie -> Bandtkowie, Bandtków | |
1119 | + lj lj lj # Ilja, ninja | |
1120 | + ly ly ly # Zápolya | |
1121 | + nc nk nc # Poulenc, Leblanc | |
1122 | + oy oy oy | |
1123 | + que k que # Remarque | |
1124 | + ri ri ri # paria, Aria | |
1125 | + ti ti ti # Izwiestia | |
1126 | + ly ly ly # Kodaly | |
1127 | + st sti st # głasnost | |
1128 | + use uz use # berceuse -> berceuzą, zę itd. | |
1129 | + x ksi x # Dixa, Laxa, Jaxa | |
1130 | + | |
1131 | +@obce_funkcjonalnie_twarde_ie | |
1132 | + ais aisi ais | |
1133 | + bes bi bes # Delibes -> Delibie | |
1134 | + ce si ce # Lawrence -> Lawrensie, breakdance | |
1135 | + ct kci ct # compact -> compakcie | |
1136 | + de dzi de | |
1137 | + dh dz dh # Sargodha | |
1138 | + dh dzi dh # Lundegårdh | |
1139 | + fe fi fe # high-life | |
1140 | + h dz h | |
1141 | + m mi m # Bramah | |
1142 | + me mi me # Brantôme, mainframe | |
1143 | + ne ni ne # Danone itd. | |
1144 | + nes ni nes | |
1145 | +* ng ni ng # d'Estainie | |
1146 | + nh ni nh # Minh | |
1147 | + ph fi ph # Joseph | |
1148 | + phe fi phe # Christophe | |
1149 | + re rz re | |
1150 | + res rz res # Ingres | |
1151 | + rh rz rh # Cerha -> Cerze | |
1152 | + rs rz rs # parcours -> parcourze | |
1153 | + se si se # Cruise, anglaise | |
1154 | + sne śni sne # Daisne | |
1155 | + ste ści ste # Benveniste | |
1156 | + stes ści stes # Costes | |
1157 | + te ci te # White -> Whicie, Capote, Fayette, Bernadotte | |
1158 | + tes ci tes # Descartes | |
1159 | + th ci th # Forsyth, Hogarth, Kenneth, Hertha, Inkatha | |
1160 | + th si th | |
1161 | + the ci the # Forsythe | |
1162 | + thes ci thes # Barthes | |
1163 | + use uzi use # berceuse | |
1164 | + v vi v # Java, baklava -> Jav | |
1165 | + ve vi ve # Redgrave, drive | |
1166 | + x ksi x # Dixa | |
1167 | + | |
1168 | +@obce_funkcjonalnie_twarde_e | |
1169 | + ac aki ac | |
1170 | + aq aki aq # Haq | |
1171 | + co ki c # Greco, Marco, Servisco (inst) | |
1172 | + cq ki cq # Gracq | |
1173 | + cques ki cques # Jacques | |
1174 | + dok dki dok # Akademgorodok | |
1175 | + ec eki ec | |
1176 | + gh ghi gh # Gogh, Pittsburgh | |
1177 | + gue gi gue # Doumergue -> Doumergiem | |
1178 | + gues gi gues # Desargues -> Desargiem | |
1179 | + ic aki ac | |
1180 | + ic iki ic # metalic, Atlantic | |
1181 | + je j je # Skopje, polje | |
1182 | + ke ki ke # Blakiem | |
1183 | + kie ki kie # Bandtkiem | |
1184 | + nc nki nc # Poulenc, Leblanc | |
1185 | +* ng n ng # d'Estaingem, d'Estaingy | |
1186 | + oc oki oc # Optiroc | |
1187 | + ov ov ov # Nemcova -> Nemcovej | |
1188 | + que ki que # Braque | |
1189 | + ques ki ques # Jaques | |
1190 | + | |
1191 | +#- klasa z nieruchomą końcówką rdzenia, bez alternacji pod koniec | |
1192 | +@obce_funkcjonalnie_twarde_iy | |
1193 | + ai ai ai # Jókai, Jokaiowie | |
1194 | + bee bee bee # Toynbee | |
1195 | + co ki c # Greco, Marco, Servisco (depr) | |
1196 | + cques ki cques # Jacques | |
1197 | + dhi dhi dhi | |
1198 | + die die die # Rushdie | |
1199 | + dy dy dy # Hunyady, Ormandy | |
1200 | + dí dí dí # Gaudí | |
1201 | + eu eu eu # Depardieu, Richelieu -> euch itd. | |
1202 | + ghi ghi ghi # nuraghi | |
1203 | + gie gie gie # Carnegie | |
1204 | + gue gi gue # Doumergue -> Doumergiem | |
1205 | + gues gi gues # Desargues -> Desargiem | |
1206 | + ji ji ji # Noji | |
1207 | + ke ki ke # Blakiem | |
1208 | + kie kie kie # Muskie, Bandtkie -> Bandtkiech | |
1209 | + ky c ky | |
1210 | + ky ki ky # Panofsky, Radetzky... | |
1211 | + ky ky ky | |
1212 | + lye lye lye # Selye -> Selyów itd. | |
1213 | + nii ni nii | |
1214 | + nii nii nii # Dziubanii -> Dziubaniiego, Dziubanie (depr - podobnie niżej do końca) | |
1215 | + nyi nyi nyi # Zrínyi # !!! Gandhi, Zrinyi, nuraghi jest niezmienne w pl:nom | |
1216 | + pi pi pi # yuppi | |
1217 | + pie pie pie # Gillespie, hippie, yuppie (przy tych pl na "pies") | |
1218 | + que ki que # Braque | |
1219 | + ques ki ques # Jaques | |
1220 | + re ry re # Tagore -> Tagorym(i), Tagorych | |
1221 | + rii ri rii | |
1222 | + rii rii rii # Murii | |
1223 | + ssy ssy ssy # Jarossy -> Jarossyego, ale Jarossyowie | |
1224 | + szky scy szky | |
1225 | + szky ski szky # Aujeszky -> Aujeskiego itd. | |
1226 | + szky szky szky # Aujeszkyego | |
1227 | + thy thy thy # Horthy | |
1228 | + tie tie tie # Christie | |
1229 | + zo zi zo # paparazzo -> paparazzim | |
1230 | + ři ři ři | |
1231 | +* ng ngy ng # d'Estaing -> .y | |
1232 | + | |
1233 | +@obce_funkcjonalnie_miekkie_ii_wyglos | |
1234 | + ay ai ay # Kayah -> Kai | |
1235 | + ci cyj ci # dacia, lancia -> dacyj, lancyj | |
1236 | + czi czyj czi # glediczia, welwiczia -> glediczyj, welwiczyj | |
1237 | + oy oi oy # Goya | |
1238 | +* ay ai ay # Broadwai | |
1239 | +* oy oi oy # cowboi | |
1240 | + | |
1241 | +@obce_ais | |
1242 | + ais ais ais | |
1243 | + | |
1244 | +@obce_apostrof | |
1245 | + bes bes bes | |
1246 | + by by by | |
1247 | + ce ce ce | |
1248 | + cy cy cy | |
1249 | + de de de | |
1250 | + dy dy dy | |
1251 | + es es es | |
1252 | + fe fe fe | |
1253 | + ge ge ge | |
1254 | + ges ges ges | |
1255 | + gues gues gues | |
1256 | + ke ke ke | |
1257 | + kes kes kes | |
1258 | + ky ky ky | |
1259 | + le le le # ensemble, Google | |
1260 | + les les les | |
1261 | + ly ly ly | |
1262 | + ly ly ly | |
1263 | + me me me | |
1264 | + my my my | |
1265 | + ne ne ne | |
1266 | + nes nes nes | |
1267 | + pe pe pe | |
1268 | + phe phe phe | |
1269 | + phy phy phy | |
1270 | + ques ques ques | |
1271 | + re re re | |
1272 | + res res res | |
1273 | + ry ry ry | |
1274 | + se se se | |
1275 | + ses ses ses | |
1276 | + sy sy sy | |
1277 | + te te te | |
1278 | + tes tes tes | |
1279 | + the the the | |
1280 | + thes thes thes | |
1281 | + thy thy thy | |
1282 | + uy uy uy | |
1283 | + ve ve ve | |
1284 | + ze ze ze | |
1285 | +* es e es # cornflakes -> cornflake'ach + cornflakesach | |
... | ... |
morphology/data/rev_rules.dic
... | ... | @@ -32,6 +32,7 @@ |
32 | 32 | @NOUN-LEMMA-CAP |
33 | 33 | kapitaliki_wyglos lemma=ε |
34 | 34 | kapitaliki_wyglos A lemma=A |
35 | +# lemma=końcówka_lematu | |
35 | 36 | |
36 | 37 | @VERB-LEMMA-PATAL |
37 | 38 | funkcjonalnie_miekkie_iy ć lemma=ć |
... | ... | @@ -57,3 +58,14 @@ |
57 | 58 | dowolne yć lemma=yć |
58 | 59 | inf_e eć lemma=eć |
59 | 60 | |
61 | +@NOUN-LEMMA-FOREIGN | |
62 | + obce_funkcjonalnie_twarde_a a lemma=a | |
63 | +* obce_funkcjonalnie_twarde_a ah lemma=ah # Bramah | |
64 | + obce_funkcjonalnie_twarde_ae lemma=ε | |
65 | + obce_funkcjonalnie_twarde_ae a lemma=a | |
66 | + obce_funkcjonalnie_twarde_ie lemma=ε | |
67 | + obce_funkcjonalnie_twarde_ie a lemma=a | |
68 | + obce_funkcjonalnie_twarde_iy lemma=y | |
69 | + obce_funkcjonalnie_miekkie_ii_wyglos a lemma=a | |
70 | + obce_funkcjonalnie_miekkie_ii_wyglos lemma=ε | |
71 | + obce_ais lemma=ais | |
... | ... |
morphology/data/rules.dic
... | ... | @@ -312,3 +312,80 @@ |
312 | 312 | verb_j e group=e cat=verb |
313 | 313 | funkcjonalnie_twarde_i e group=ie cat=verb |
314 | 314 | |
315 | +# produktywność nazwa_alternacji(->alternations.dic) końcówka [lista: nazwa=wartość] (sama nazwa->wartość tj pozycja z alternacji) | |
316 | +@NOUN-FLEX-FOREIGN | |
317 | + obce_funkcjonalnie_miekkie_i flex=y1 con cat=noun | |
318 | + obce_funkcjonalnie_twarde_iy flex=y2 con cat=noun | |
319 | + obce_funkcjonalnie_twarde_iy ch flex=ych con cat=noun | |
320 | + obce_funkcjonalnie_twarde_iy m flex=ym con cat=noun | |
321 | + obce_funkcjonalnie_twarde_iy mi flex=ymi con cat=noun | |
322 | +* obce_funkcjonalnie_twarde_iy es flex=s con cat=noun # yuppi -> yuppies | |
323 | +* obce_funkcjonalnie_twarde_iy s flex=s con cat=noun # hippies, yuppies | |
324 | + obce_funkcjonalnie_twarde_ae e flex=e1 con cat=noun | |
325 | + obce_funkcjonalnie_twarde_ie e flex=e1 con cat=noun | |
326 | + obce_funkcjonalnie_twarde_ae ego flex=ego con cat=noun | |
327 | + obce_funkcjonalnie_twarde_e e flex=e2 con cat=noun | |
328 | + obce_funkcjonalnie_twarde_e ego flex=ego con cat=noun | |
329 | + obce_funkcjonalnie_twarde_ae ej flex=ej con cat=noun | |
330 | + obce_funkcjonalnie_twarde_e ej flex=ej con cat=noun | |
331 | + obce_funkcjonalnie_twarde_ae em flex=em1 con cat=noun | |
332 | + obce_funkcjonalnie_twarde_e em flex=em2 con cat=noun | |
333 | + obce_funkcjonalnie_twarde_ae emu flex=emu con cat=noun | |
334 | + obce_funkcjonalnie_twarde_e emu flex=emu con cat=noun | |
335 | + obce_funkcjonalnie_twarde_ae a flex=a1 con cat=noun | |
336 | + obce_funkcjonalnie_twarde_ae ach flex=ach con cat=noun | |
337 | + obce_funkcjonalnie_twarde_a ach flex=ach con cat=noun | |
338 | + obce_funkcjonalnie_twarde_ae ami flex=ami1 con cat=noun | |
339 | + obce_funkcjonalnie_twarde_a ami flex=ami1 con cat=noun | |
340 | + obce_funkcjonalnie_twarde_ae ą flex=ą con cat=noun | |
341 | + obce_funkcjonalnie_twarde_a ą flex=ą con cat=noun | |
342 | + obce_funkcjonalnie_twarde_ae ę flex=ę con cat=noun | |
343 | + obce_funkcjonalnie_twarde_a ę flex=ę con cat=noun | |
344 | + obce_funkcjonalnie_twarde_ae o flex=o1 con cat=noun | |
345 | + obce_funkcjonalnie_twarde_a o flex=o2 con cat=noun | |
346 | + obce_funkcjonalnie_twarde_ae om flex=om con cat=noun | |
347 | + obce_funkcjonalnie_twarde_a om flex=om con cat=noun | |
348 | + obce_funkcjonalnie_twarde_ae owie flex=owie con cat=noun | |
349 | + obce_funkcjonalnie_twarde_a ów flex=ów con cat=noun | |
350 | + obce_funkcjonalnie_twarde_a owie flex=owie con cat=noun | |
351 | + obce_funkcjonalnie_twarde_ae ów flex=ów con cat=noun | |
352 | + obce_funkcjonalnie_twarde_ae u flex=u1 con cat=noun | |
353 | + obce_funkcjonalnie_twarde_a i flex=i2 con cat=noun # Aghi, głasnosti | |
354 | + obce_funkcjonalnie_twarde_a y flex=i2 con cat=noun # Joszuy | |
355 | + obce_funkcjonalnie_miekkie_ii_wyglos flex=ε3 con cat=noun | |
356 | + obce_ais ’go flex=ego con cat=noun | |
357 | + obce_ais ’mu flex=emu con cat=noun | |
358 | + obce_ais ’m flex=em con cat=noun | |
359 | + obce_ais 'go flex=ego con cat=noun | |
360 | + obce_ais 'mu flex=emu con cat=noun | |
361 | + obce_ais 'm flex=em con cat=noun | |
362 | + obce_ais flex=ε con cat=noun | |
363 | + obce_apostrof 'a flex='a con cat=noun | |
364 | + obce_apostrof ’u flex='u con cat=noun | |
365 | + obce_apostrof ’owi flex='owi con cat=noun | |
366 | + obce_apostrof ’em flex='em con cat=noun | |
367 | + obce_apostrof ’ie flex='ie con cat=noun | |
368 | + obce_apostrof ’u flex='u con cat=noun | |
369 | + obce_apostrof ’y flex='y con cat=noun | |
370 | + obce_apostrof ’owie flex='owie con cat=noun | |
371 | + obce_apostrof ’e flex='e con cat=noun #rocaille'e | |
372 | + obce_apostrof ’ów flex='ów con cat=noun | |
373 | + obce_apostrof ’i flex='i con cat=noun #scrabble'i, chippendale'i | |
374 | + obce_apostrof ’om flex='om con cat=noun | |
375 | + obce_apostrof ’ami flex='ami con cat=noun | |
376 | + obce_apostrof ’ach flex='ach con cat=noun | |
377 | + obce_apostrof 'a flex='a con cat=noun | |
378 | + obce_apostrof 'u flex='u con cat=noun | |
379 | + obce_apostrof 'owi flex='owi con cat=noun | |
380 | + obce_apostrof 'em flex='em con cat=noun | |
381 | + obce_apostrof 'ie flex='ie con cat=noun | |
382 | + obce_apostrof 'u flex='u con cat=noun | |
383 | + obce_apostrof 'y flex='y con cat=noun | |
384 | + obce_apostrof 'owie flex='owie con cat=noun | |
385 | + obce_apostrof 'e flex='e con cat=noun #rocaille'e | |
386 | + obce_apostrof 'ów flex='ów con cat=noun | |
387 | + obce_apostrof 'i flex='i con cat=noun #scrabble'i, chippendale'i | |
388 | + obce_apostrof 'om flex='om con cat=noun | |
389 | + obce_apostrof 'ami flex='ami con cat=noun | |
390 | + obce_apostrof 'ach flex='ach con cat=noun | |
391 | + obce_apostrof flex=ε con cat=noun | |
... | ... |
morphology/data/schemata.dic
... | ... | @@ -27,3 +27,4 @@ PREF-ε FIN-FLEX-J VERB-FLEX2-J VERB-GROUP-J-NĄ VERB-LEMMA-NĄ |
27 | 27 | PREF-NIE GER-FLEX VERB-FLEX2-J VERB-GROUP-J-NĄ VERB-LEMMA-NĄ |
28 | 28 | PREF-NIE PACT-FLEX VERB-FLEX2-J VERB-GROUP-J-NĄ VERB-LEMMA-NĄ |
29 | 29 | PREF-NIE PPAS-FLEX VERB-FLEX2-J VERB-GROUP-J-NĄ VERB-LEMMA-NĄ |
30 | +NOUN-FLEX-FOREIGN NOUN-LEMMA-FOREIGN | |
... | ... |