Commit 92afcb9c30fe4b3747336666ffdb27a531dc4bc4
1 parent
8961f929
nowe segmenty od Witka
git-svn-id: svn://svn.nlp.ipipan.waw.pl/morfeusz/trunk@334 ff4e3ee1-f430-4e82-ade0-24591c43f1fd
Showing
1 changed file
with
102 additions
and
17 deletions
input/segmenty.dat
... | ... | @@ -64,13 +64,22 @@ adja |
64 | 64 | #ifdef split |
65 | 65 | # Czas przeszły (z uwzględnieniem prefiksów): |
66 | 66 | # np. „gniotł·am” |
67 | -moze_interp( prefv>? praet_sg_agl (aglsg1_wok|aglsg2_wok) ) | |
67 | +moze_interp( praet_sg_agl (aglsg1_wok|aglsg2_wok) ) | |
68 | +# i wersja z prefv | |
69 | +# moze_interp( prefv> praet_sg_agl (aglsg1_wok|aglsg2_wok)) !weak | |
68 | 70 | # np. „czytał·em” |
69 | -moze_interp(prefv>? praet_sg_masc (aglsg1_wok|aglsg2_wok)) | |
71 | +moze_interp( praet_sg_masc (aglsg1_wok|aglsg2_wok)) | |
72 | +# i wersja z prefv | |
73 | +# moze_interp(prefv> praet_sg_masc (aglsg1_wok|aglsg2_wok)) !weak | |
70 | 74 | # np. czytała·ś, czytało·ś |
71 | -moze_interp(prefv>? praet_sg_nmasc (aglsg1_nwok|aglsg2_nwok)) | |
75 | +moze_interp( praet_sg_nmasc (aglsg1_nwok|aglsg2_nwok)) | |
76 | +# i wersja z prefv | |
77 | +# moze_interp(prefv> praet_sg_nmasc (aglsg1_nwok|aglsg2_nwok)) !weak | |
72 | 78 | # np. „czytali·ście” |
73 | -moze_interp(prefv>? praet_pl (aglpl1_nwok|aglpl2_nwok)) | |
79 | +moze_interp( praet_pl (aglpl1_nwok|aglpl2_nwok)) | |
80 | +# i wersja z prefv | |
81 | +# moze_interp(prefv> praet_pl (aglpl1_nwok|aglpl2_nwok)) !weak | |
82 | + | |
74 | 83 | |
75 | 84 | # przeszlik pojedynczy w formie nieaglutynacyjnej, np. „gniótł”: |
76 | 85 | moze_interp(praet_sg_nagl) |
... | ... | @@ -83,17 +92,25 @@ moze_interp(praet_pl) |
83 | 92 | |
84 | 93 | # Tryb warunkowy: |
85 | 94 | # np. „gniótł·by” |
86 | -moze_interp(prefv>? praet_sg_nagl by) | |
95 | +moze_interp(praet_sg_nagl by) | |
96 | +# wersja z prefv: | |
97 | +# moze_interp(prefv> praet_sg_nagl by) !weak | |
87 | 98 | # np. „czytało·by” |
88 | -moze_interp(prefv>? praet_sg by) | |
99 | +moze_interp(praet_sg by) | |
100 | +# wersja prefv | |
101 | +# moze_interp(prefv> praet_sg by) !weak | |
89 | 102 | # np. „gnietli·by” |
90 | -moze_interp(prefv>? praet_pl by) | |
103 | +moze_interp( praet_pl by) | |
104 | +# moze_interp(prefv> praet_pl by) !weak | |
91 | 105 | # np. „gniótł·by·ś” |
92 | -moze_interp(prefv>? praet_sg_nagl by (aglsg1_nwok|aglsg2_nwok)) | |
106 | +moze_interp(praet_sg_nagl by (aglsg1_nwok|aglsg2_nwok)) | |
107 | +# moze_interp(prefv> praet_sg_nagl by (aglsg1_nwok|aglsg2_nwok)) !weak | |
93 | 108 | # np. „czytał·by·m” |
94 | -moze_interp(prefv>? praet_sg by (aglsg1_nwok|aglsg2_nwok)) | |
109 | +moze_interp(praet_sg by (aglsg1_nwok|aglsg2_nwok)) | |
110 | +# moze_interp(prefv> praet_sg by (aglsg1_nwok|aglsg2_nwok)) !weak | |
95 | 111 | # np. „gnietli·by·śmy” |
96 | -moze_interp(prefv>? praet_pl by (aglpl1_nwok|aglpl2_nwok)) | |
112 | +moze_interp(praet_pl by (aglpl1_nwok|aglpl2_nwok)) | |
113 | +# moze_interp(prefv> praet_pl by (aglpl1_nwok|aglpl2_nwok)) !weak | |
97 | 114 | #else |
98 | 115 | moze_interp(praetcond) |
99 | 116 | moze_interp(praetaglt) |
... | ... | @@ -102,12 +119,12 @@ moze_interp(praet_pl) !weak |
102 | 119 | #endif |
103 | 120 | |
104 | 121 | # Prefiksy czasownikowe dla form fin, rozkaźników i imiesłowów przysłówkowych |
105 | -moze_interp(prefv> fin) | |
106 | -moze_interp(prefv> impt) | |
122 | +# moze_interp(prefv> fin) !weak | |
123 | +# moze_interp(prefv> impt) !weak | |
107 | 124 | moze_interp(pcon) |
108 | 125 | moze_interp(pant) |
109 | -moze_interp(prefv> pcon) | |
110 | -moze_interp(prefv> pant) | |
126 | +# moze_interp(prefv> pcon) !weak | |
127 | +# moze_interp(prefv> pant) !weak | |
111 | 128 | |
112 | 129 | |
113 | 130 | # np. „by·ś” |
... | ... | @@ -231,7 +248,7 @@ moze_interp( prefs> dywiz> rzeczowniki ) !weak |
231 | 248 | moze_interp( pref_dyw> rzeczowniki ) !weak |
232 | 249 | # czasownikowe np. „po·nakapywać” |
233 | 250 | moze_interp(inf_imperf|praet_imperf|imps_imperf|fin_imperf|impt_sg_imperf|impt_pl_imperf|impt_sg_perf|impt_pl_perf) |
234 | -moze_interp( prefv> (inf_imperf by? |praet_imperf|imps_imperf|fin_imperf|impt_sg_imperf|impt_pl_imperf|ppas|pact|ger) ) !weak | |
251 | +# moze_interp( prefv> (inf_imperf by? |praet_imperf|imps_imperf|fin_imperf|impt_sg_imperf|impt_pl_imperf|ppas|pact|ger) ) !weak | |
235 | 252 | # przymiotnikowe i przysłówkowe np. „do·żylny”, |
236 | 253 | # „euro·sodomski”, „bez·argumentowy” |
237 | 254 | moze_interp(ppas|adv_pos|pact) |
... | ... | @@ -324,6 +341,10 @@ moze_interp((adja|num_zloz|pol_zloz) dywiz ) |
324 | 341 | moze_interp(prep_n|prep_na) |
325 | 342 | moze_interp((prep_n|prep_na) n) |
326 | 343 | |
344 | +# Zapis łączny liczby wraz z jednostką miary, np: 5°C, 2m². | |
345 | +moze_interp(miary) | |
346 | +moze_interp( (dig+) miary ) | |
347 | + | |
327 | 348 | # predykatywy (typ pred jest używany w regułach dla zapisów niepoprawnych poniżej) |
328 | 349 | moze_interp(pred) |
329 | 350 | |
... | ... | @@ -342,7 +363,7 @@ moze_interp( dig>+ dywiz> (adj_pos|adv_pos) ) |
342 | 363 | moze_interp( dig>+ przecinek> dig> dywiz> (adj_pos|adv_pos) ) |
343 | 364 | |
344 | 365 | # liczba rzymska z formą przymiotnikową: XIX-wieczny |
345 | -# moze_interp( liczba_rzymska> dywiz> (adj_pos|adv_pos) ) | |
366 | +moze_interp( liczba_rzymska> dywiz> (adj_pos|adv_pos) ) | |
346 | 367 | |
347 | 368 | # formy złoż. z sufiksami rzeczownikowymi przyłączającymi formy złoż. liczebników: |
348 | 369 | # moze_interp( num_zloz>+ suf_num ) !weak |
... | ... | @@ -431,6 +452,7 @@ romandigL |
431 | 452 | romandigC |
432 | 453 | romandigD |
433 | 454 | romandigM |
455 | +liczba_rzymska | |
434 | 456 | adja |
435 | 457 | adj_pos |
436 | 458 | adj_com |
... | ... | @@ -443,6 +465,7 @@ niemniej |
443 | 465 | pewno |
444 | 466 | negat |
445 | 467 | samotny |
468 | +miary | |
446 | 469 | interp |
447 | 470 | aglsg1_wok |
448 | 471 | aglsg2_wok |
... | ... | @@ -480,6 +503,8 @@ prep_na |
480 | 503 | emoticon |
481 | 504 | killfile |
482 | 505 | pred |
506 | +lewe | |
507 | +prawe | |
483 | 508 | samodz |
484 | 509 | |
485 | 510 | |
... | ... | @@ -505,7 +530,6 @@ samotny brev:pun |
505 | 530 | # samotny brev:npun |
506 | 531 | # samotny interj |
507 | 532 | samotny emoticon |
508 | -interp interp | |
509 | 533 | aglsg1_wok aglt:sg:pri:%:wok |
510 | 534 | aglpl1_wok aglt:pl:pri:%:wok |
511 | 535 | aglsg1_nwok aglt:sg:pri:%:nwok |
... | ... | @@ -574,6 +598,7 @@ impt_pl_perf impt:pl:%:perf |
574 | 598 | num_zloz num:comp |
575 | 599 | prep_n prep:%:wok |
576 | 600 | pred pred |
601 | +interp interp | |
577 | 602 | samodz % |
578 | 603 | |
579 | 604 | [lexemes] |
... | ... | @@ -605,6 +630,7 @@ z_aglt_nwok gdzie adv |
605 | 630 | z_aglt gdzież adv |
606 | 631 | z_aglt któż subst:% |
607 | 632 | z_aglt_nwok kto subst:% |
633 | +z_aglt_nwok co subst:% | |
608 | 634 | z_aglt_by jakby comp |
609 | 635 | z_aglt_by jakoby comp |
610 | 636 | z_aglt_nwok kiedy adv |
... | ... | @@ -747,8 +773,20 @@ my my ppron12:pl:nom:% |
747 | 773 | wy wy ppron12:pl:nom:% |
748 | 774 | pref_dyw e-+ prefa |
749 | 775 | pref_dyw e-+ prefs |
776 | +miary °C brev:% | |
777 | +miary °F brev:% | |
778 | +miary m² brev:% | |
779 | +miary m³ brev:% | |
780 | + | |
750 | 781 | |
751 | 782 | [separator chars] |
783 | + | |
784 | +# ( | |
785 | +40 | |
786 | + | |
787 | +# ) | |
788 | +41 | |
789 | + | |
752 | 790 | # , |
753 | 791 | 44 |
754 | 792 | |
... | ... | @@ -758,3 +796,50 @@ pref_dyw e-+ prefs |
758 | 796 | # ; |
759 | 797 | 59 |
760 | 798 | |
799 | +# [ | |
800 | +91 | |
801 | + | |
802 | +# ] | |
803 | +93 | |
804 | + | |
805 | +# { | |
806 | +123 | |
807 | + | |
808 | +# } | |
809 | +125 | |
810 | + | |
811 | +# « | |
812 | +171 | |
813 | + | |
814 | +# » | |
815 | +187 | |
816 | + | |
817 | +# ‹ | |
818 | +8249 | |
819 | + | |
820 | +# › | |
821 | +8250 | |
822 | + | |
823 | +# „ | |
824 | +8222 | |
825 | + | |
826 | +# ” | |
827 | +8221 | |
828 | + | |
829 | +# ‚ | |
830 | +8218 | |
831 | + | |
832 | +# ’ | |
833 | +8217 | |
834 | + | |
835 | +# “ | |
836 | +8220 | |
837 | + | |
838 | +# ‘ | |
839 | +8216 | |
840 | + | |
841 | +# – | |
842 | +8211 | |
843 | + | |
844 | +# — | |
845 | +8212 | |
... | ... |