segmenty.dat
5.22 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
[options]
aggl=permissive strict isolated
praet=split composite
[combinations]
#define wsz_interp (interp|kropka|dywiz)*
#define moze_interp(segmenty) wsz_interp segmenty wsz_interp
# Segmenty występujące samodzielnie:
#
# domyślny typ segmentu samodzielnego:
moze_interp(samodz)
# segment samotny, który nie dopuszcza nawet znaku interpunkcyjnego po
# sobie
samotny
# przeszlik pojedynczy w formie nieaglutynacyjnej, np. „gniótł”:
moze_interp(praet_sg_na)
# przeszlik pojedynczy w formie niezróżnicowanej aglutynacyjnie, np. „moze”:
moze_interp(praet_sg)
# przeszlik mnogi, np. „czytali”:
moze_interp(praet_pl)
# partykuła „by”:
moze_interp(by)
# inne segmenty, które dopuszczają po sobie aglutynant,
# np. „powininna”, „czyżby”:
moze_interp(z_aglt)
# forma przymiotnikowa (dopuszcza adja):
moze_interp(adj)
# dywiz (jako samodzielny segment jest tyko błędnym użyciem w funkcji
# myślnika, ale trzeba to dopuścić):
dywiz
#ifdef isolated
adja
#endif
# Połączenia z aglutynantami:
#
#ifdef split
# Czas przeszły:
# np. „gniotł·am”
moze_interp( praet_sg_agl aglsg )
# np. „czytał·em”
moze_interp(praet_sg aglsg)
# np. „czytali·ście”
moze_interp(praet_pl aglpl)
# Tryb warunkowy:
# np. „gniótł·by”
moze_interp(praet_sg_na by)
# np. „czytało·by”
moze_interp(praet_sg by)
# np. „gnietli·by”
moze_interp(praet_pl by)
# np. „gniótł·by·ś”
moze_interp(praet_sg_na by aglsg)
# np. „czytał·by·m”
moze_interp(praet_sg by aglsg)
# np. „gnietli·by·śmy”
moze_interp(praet_pl by aglpl)
#else
# moze_interp(praetcond)
#endif
# np. „by·ś”
moze_interp(by aglsg)
# np. „by·ście”
moze_interp(by aglpl)
# np. „gdyby·m”
moze_interp(z_aglt aglsg)
# np. „gdyby·ście”
moze_interp(z_aglt aglpl)
# To jest dużo za dużo, ale tytułem eksperymentu:
#ifdef permissive
moze_interp(samodz aglsg)
moze_interp(samodz aglpl)
#endif
# Złożone formy przymiotnikowe
# np. „biało·-·czerwony”
moze_interp( (adja dywiz)+ adj )
# poniższe załatwione przez + powyżej:
# # np. „niebiesko·-·biało·-·czerwona”
# adja dywiz adja dywiz adj interp?
# # itd. (zatrzymujemy się pragmatycznie na 5 członach)
# adja dywiz adja dywiz adja dywiz adj interp?
# adja dywiz adja dywiz adja dywiz adja dywiz adj interp?
# Formy zanegowane stopnia wyższego przymiotników i przysłówków (WK)
# np. „nie·grzeczniejszy”, „nie·grzeczniej”
moze_interp( nie> adj_com )
# Formy „zanegowane” gerundiów i imiesłowów:
# np. „nie·czytanie”, „nie·przeczytany”, „nie·czytający”:
moze_interp( nie> negat )
# Przyimki akceptujące krótką formę „-ń”
moze_interp(z_on_agl)
# np. „do·ń”
moze_interp(z_on_agl on_agl)
# Liczba zapisana jako ciąg cyfr:
moze_interp( dig )
# Formacje prefiksalne
#### trzeba wydzielić odpowiednie samodze!
# rzeczownikowe
# np. „euro·sodoma”, „e-·papieros”
moze_interp(nomina)
moze_interp( prefs> nomina )
# czasownikowe np. „po·nakapywać”
moze_interp(verba_imperf)
moze_interp( prefv> verba_imperf )
# przymiotnikowe np. „do·żylny”, „euro·sodomski”, „bez·argumentowy”
moze_interp(adjectiva)
moze_interp(prefa> adj)
moze_interp( prefa> adjectiva )
# Apozycje z dywizem
# np. „kobieta-prezydent”
moze_interp( samodz dywiz samodz )
# poniższe do sprawdzenia, najwyraźniej obecne w tekstach, skoro wprowadziliśmy:
# ?
adj dywiz adj
# ?
adj dywiz samodz
# ?
samodz dywiz adj
#### PONIŻEJ REGUŁY WK
# Stopień najwyższy:
# np. „naj·zieleńszy”, „naj·mądrzej”
moze_interp( naj> adj_sup )
# Cząstka li przy osobowych formach czasownika oddzielona dywizem: znasz-li ten kraj
moze_interp( praet_sg dywiz li)
moze_interp( praet_pl dywiz li)
moze_interp( praet_sg_na dywiz li)
moze_interp( fin dywiz li)
# i bez dywizu --- czy bez dywizu jest sens to łapać?
#moze_interp( praet_sg li)
#moze_interp( praet_pl li)
#moze_interp( praet_sg_na li)
#moze_interp( fin li)
[segment types]
naj
nie
prefs
prefv
prefa
dig
adja
adj
adj_sup
negat
on_agl
z_on_agl
samotny
interp
aglsg
aglpl
praetcond
praet_sg_agl
praet_sg_na
praet_sg
praet_pl
samodz
[tags]
naj naj
nie nie
prefs prefs
prefv prefv
prefa prefa
dig dig
adja adja
adj adj:%:pos
adj_sup adj:%:sup
adj_sup adv:sup
adj_com adj:%:com
adj_com adj:%:com
negat ger:%:neg
negat pact:%:neg
negat ppas:%:neg
on_agl ppron3:sg:gen.acc:m1.m2.m3:ter:nakc:praep
z_on_agl prep:%
samotny brev:pun
samotny brev:npun
samotny interj
interp interp
aglsg aglt:sg:%
aglpl aglt:pl:%
praet_sg_agl praet:sg:%:agl
praet_sg_na praet:sg:%:nagl
praet_sg praet:sg:%
praet_pl praet:pl:%
praet_sg winien:sg:%
praet_pl winien:pl:%
fin fin:%
nomina subst:%
nomina ger:%
nomina depr:%
adjectiva adv:%
adjectiva ppas:%
adjectiva pact:%
verba_imperf praet:%:imperf
verba_imperf fin:%:imperf
verba_imperf inf:imperf
verba_imperf imps:imperf
verba_imperf impt:%:imperf
samodz %
[lexemes]
z_aglt aby:comp
z_aglt bowiem:comp
by by:qub
li li:qub
z_aglt by:comp
z_aglt cóż:subst
z_aglt czemu:adv
z_aglt czyżby:qub
z_aglt choćby:comp
z_aglt chociażby:comp
z_aglt dlaczego:adv
z_aglt dopóki:comp
z_aglt dopóty:conj
z_aglt gdyby:comp
z_aglt gdzie:qub
z_aglt gdzie:adv
z_aglt jakby:comp
z_aglt jakoby:comp
z_aglt kiedy:adv
z_aglt kiedy:comp
z_aglt tylko:qub
z_aglt żeby:comp
dywiz -:interp
kropka .:interp