Commit 92afcb9c30fe4b3747336666ffdb27a531dc4bc4

Authored by Jan Szejko
1 parent 8961f929

nowe segmenty od Witka

git-svn-id: svn://svn.nlp.ipipan.waw.pl/morfeusz/trunk@334 ff4e3ee1-f430-4e82-ade0-24591c43f1fd
Showing 1 changed file with 102 additions and 17 deletions
input/segmenty.dat
... ... @@ -64,13 +64,22 @@ adja
64 64 #ifdef split
65 65 # Czas przeszły (z uwzględnieniem prefiksów):
66 66 # np. „gniotł·am”
67   -moze_interp( prefv>? praet_sg_agl (aglsg1_wok|aglsg2_wok) )
  67 +moze_interp( praet_sg_agl (aglsg1_wok|aglsg2_wok) )
  68 +# i wersja z prefv
  69 +# moze_interp( prefv> praet_sg_agl (aglsg1_wok|aglsg2_wok)) !weak
68 70 # np. „czytał·em”
69   -moze_interp(prefv>? praet_sg_masc (aglsg1_wok|aglsg2_wok))
  71 +moze_interp( praet_sg_masc (aglsg1_wok|aglsg2_wok))
  72 +# i wersja z prefv
  73 +# moze_interp(prefv> praet_sg_masc (aglsg1_wok|aglsg2_wok)) !weak
70 74 # np. czytała·ś, czytało·ś
71   -moze_interp(prefv>? praet_sg_nmasc (aglsg1_nwok|aglsg2_nwok))
  75 +moze_interp( praet_sg_nmasc (aglsg1_nwok|aglsg2_nwok))
  76 +# i wersja z prefv
  77 +# moze_interp(prefv> praet_sg_nmasc (aglsg1_nwok|aglsg2_nwok)) !weak
72 78 # np. „czytali·ście”
73   -moze_interp(prefv>? praet_pl (aglpl1_nwok|aglpl2_nwok))
  79 +moze_interp( praet_pl (aglpl1_nwok|aglpl2_nwok))
  80 +# i wersja z prefv
  81 +# moze_interp(prefv> praet_pl (aglpl1_nwok|aglpl2_nwok)) !weak
  82 +
74 83  
75 84 # przeszlik pojedynczy w formie nieaglutynacyjnej, np. „gniótł”:
76 85 moze_interp(praet_sg_nagl)
... ... @@ -83,17 +92,25 @@ moze_interp(praet_pl)
83 92  
84 93 # Tryb warunkowy:
85 94 # np. „gniótł·by”
86   -moze_interp(prefv>? praet_sg_nagl by)
  95 +moze_interp(praet_sg_nagl by)
  96 +# wersja z prefv:
  97 +# moze_interp(prefv> praet_sg_nagl by) !weak
87 98 # np. „czytało·by”
88   -moze_interp(prefv>? praet_sg by)
  99 +moze_interp(praet_sg by)
  100 +# wersja prefv
  101 +# moze_interp(prefv> praet_sg by) !weak
89 102 # np. „gnietli·by”
90   -moze_interp(prefv>? praet_pl by)
  103 +moze_interp( praet_pl by)
  104 +# moze_interp(prefv> praet_pl by) !weak
91 105 # np. „gniótł·by·ś”
92   -moze_interp(prefv>? praet_sg_nagl by (aglsg1_nwok|aglsg2_nwok))
  106 +moze_interp(praet_sg_nagl by (aglsg1_nwok|aglsg2_nwok))
  107 +# moze_interp(prefv> praet_sg_nagl by (aglsg1_nwok|aglsg2_nwok)) !weak
93 108 # np. „czytał·by·m”
94   -moze_interp(prefv>? praet_sg by (aglsg1_nwok|aglsg2_nwok))
  109 +moze_interp(praet_sg by (aglsg1_nwok|aglsg2_nwok))
  110 +# moze_interp(prefv> praet_sg by (aglsg1_nwok|aglsg2_nwok)) !weak
95 111 # np. „gnietli·by·śmy”
96   -moze_interp(prefv>? praet_pl by (aglpl1_nwok|aglpl2_nwok))
  112 +moze_interp(praet_pl by (aglpl1_nwok|aglpl2_nwok))
  113 +# moze_interp(prefv> praet_pl by (aglpl1_nwok|aglpl2_nwok)) !weak
97 114 #else
98 115 moze_interp(praetcond)
99 116 moze_interp(praetaglt)
... ... @@ -102,12 +119,12 @@ moze_interp(praet_pl) !weak
102 119 #endif
103 120  
104 121 # Prefiksy czasownikowe dla form fin, rozkaźników i imiesłowów przysłówkowych
105   -moze_interp(prefv> fin)
106   -moze_interp(prefv> impt)
  122 +# moze_interp(prefv> fin) !weak
  123 +# moze_interp(prefv> impt) !weak
107 124 moze_interp(pcon)
108 125 moze_interp(pant)
109   -moze_interp(prefv> pcon)
110   -moze_interp(prefv> pant)
  126 +# moze_interp(prefv> pcon) !weak
  127 +# moze_interp(prefv> pant) !weak
111 128  
112 129  
113 130 # np. „by·ś”
... ... @@ -231,7 +248,7 @@ moze_interp( prefs> dywiz> rzeczowniki ) !weak
231 248 moze_interp( pref_dyw> rzeczowniki ) !weak
232 249 # czasownikowe np. „po·nakapywać”
233 250 moze_interp(inf_imperf|praet_imperf|imps_imperf|fin_imperf|impt_sg_imperf|impt_pl_imperf|impt_sg_perf|impt_pl_perf)
234   -moze_interp( prefv> (inf_imperf by? |praet_imperf|imps_imperf|fin_imperf|impt_sg_imperf|impt_pl_imperf|ppas|pact|ger) ) !weak
  251 +# moze_interp( prefv> (inf_imperf by? |praet_imperf|imps_imperf|fin_imperf|impt_sg_imperf|impt_pl_imperf|ppas|pact|ger) ) !weak
235 252 # przymiotnikowe i przysłówkowe np. „do·żylny”,
236 253 # „euro·sodomski”, „bez·argumentowy”
237 254 moze_interp(ppas|adv_pos|pact)
... ... @@ -324,6 +341,10 @@ moze_interp((adja|num_zloz|pol_zloz) dywiz )
324 341 moze_interp(prep_n|prep_na)
325 342 moze_interp((prep_n|prep_na) n)
326 343  
  344 +# Zapis łączny liczby wraz z jednostką miary, np: 5°C, 2m².
  345 +moze_interp(miary)
  346 +moze_interp( (dig+) miary )
  347 +
327 348 # predykatywy (typ pred jest używany w regułach dla zapisów niepoprawnych poniżej)
328 349 moze_interp(pred)
329 350  
... ... @@ -342,7 +363,7 @@ moze_interp( dig>+ dywiz> (adj_pos|adv_pos) )
342 363 moze_interp( dig>+ przecinek> dig> dywiz> (adj_pos|adv_pos) )
343 364  
344 365 # liczba rzymska z formą przymiotnikową: XIX-wieczny
345   -# moze_interp( liczba_rzymska> dywiz> (adj_pos|adv_pos) )
  366 +moze_interp( liczba_rzymska> dywiz> (adj_pos|adv_pos) )
346 367  
347 368 # formy złoż. z sufiksami rzeczownikowymi przyłączającymi formy złoż. liczebników:
348 369 # moze_interp( num_zloz>+ suf_num ) !weak
... ... @@ -431,6 +452,7 @@ romandigL
431 452 romandigC
432 453 romandigD
433 454 romandigM
  455 +liczba_rzymska
434 456 adja
435 457 adj_pos
436 458 adj_com
... ... @@ -443,6 +465,7 @@ niemniej
443 465 pewno
444 466 negat
445 467 samotny
  468 +miary
446 469 interp
447 470 aglsg1_wok
448 471 aglsg2_wok
... ... @@ -480,6 +503,8 @@ prep_na
480 503 emoticon
481 504 killfile
482 505 pred
  506 +lewe
  507 +prawe
483 508 samodz
484 509  
485 510  
... ... @@ -505,7 +530,6 @@ samotny brev:pun
505 530 # samotny brev:npun
506 531 # samotny interj
507 532 samotny emoticon
508   -interp interp
509 533 aglsg1_wok aglt:sg:pri:%:wok
510 534 aglpl1_wok aglt:pl:pri:%:wok
511 535 aglsg1_nwok aglt:sg:pri:%:nwok
... ... @@ -574,6 +598,7 @@ impt_pl_perf impt:pl:%:perf
574 598 num_zloz num:comp
575 599 prep_n prep:%:wok
576 600 pred pred
  601 +interp interp
577 602 samodz %
578 603  
579 604 [lexemes]
... ... @@ -605,6 +630,7 @@ z_aglt_nwok gdzie adv
605 630 z_aglt gdzież adv
606 631 z_aglt któż subst:%
607 632 z_aglt_nwok kto subst:%
  633 +z_aglt_nwok co subst:%
608 634 z_aglt_by jakby comp
609 635 z_aglt_by jakoby comp
610 636 z_aglt_nwok kiedy adv
... ... @@ -747,8 +773,20 @@ my my ppron12:pl:nom:%
747 773 wy wy ppron12:pl:nom:%
748 774 pref_dyw e-+ prefa
749 775 pref_dyw e-+ prefs
  776 +miary °C brev:%
  777 +miary °F brev:%
  778 +miary m² brev:%
  779 +miary m³ brev:%
  780 +
750 781  
751 782 [separator chars]
  783 +
  784 +# (
  785 +40
  786 +
  787 +# )
  788 +41
  789 +
752 790 # ,
753 791 44
754 792  
... ... @@ -758,3 +796,50 @@ pref_dyw e-+ prefs
758 796 # ;
759 797 59
760 798  
  799 +# [
  800 +91
  801 +
  802 +# ]
  803 +93
  804 +
  805 +# {
  806 +123
  807 +
  808 +# }
  809 +125
  810 +
  811 +# «
  812 +171
  813 +
  814 +# »
  815 +187
  816 +
  817 +# ‹
  818 +8249
  819 +
  820 +# ›
  821 +8250
  822 +
  823 +# „
  824 +8222
  825 +
  826 +# ”
  827 +8221
  828 +
  829 +# ‚
  830 +8218
  831 +
  832 +# ’
  833 +8217
  834 +
  835 +# “
  836 +8220
  837 +
  838 +# ‘
  839 +8216
  840 +
  841 +# –
  842 +8211
  843 +
  844 +# —
  845 +8212
... ...