system_wzorow.html
35.8 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
{% extends "reader_flat.html" %}
{% block title %}Systematyzacja wzorów fleksyjnych dla Słownika gramatycznego języka polskiego{% endblock %}
{% block text-content %}
<h1>Systematyzacja wzorów fleksyjnych dla <em>Słownika gramatycznego języka polskiego</em><a name="przypis1back" href="#przypis1"><sup>1</sup></a></h1>
<h2>Spis treści</h2>
<ol>
<li><a href="#ch1">Podstawy teoretyczne</a></li>
<li><a href="#ch2">Wzory rzeczownikowe</a></li>
<li><a href="#ch3">Wzory zaimkowe</a></li>
<li><a href="#ch4">Wzory przymiotnikowe</a></li>
<li><a href="#ch5">Wzory liczebnikowe</a></li>
<li><a href="#ch6">Wzory czasownikowe</a></li>
<li><a href="#ch7">Wzory przyimkowe</a></li>
<li><a href="#ch8">Po co to wszystko?</a></li>
<li><a href="#ch9">Pozycje cytowane</a></li>
</ol>
<p>
Celem <em>Słownika gramatycznego języka polskiego</em> (<a href="http://sgjp.pl/">sgjp.pl</a>)
w zakresie fleksji jest dokładne podanie paradygmatów
wszystkich leksemów odmiennych polszczyzny współczesnej w wersji
pisanej. Został on zasadniczo osiągnięty już w wersji
elektronicznej SGJP dwukrotnie wydanej na płycie CD-ROM (SGJP 2007,
SGJP 2012). Zostały opracowane typy odmiany leksemów oraz
realizujące je wzory. Leksemom odmiennym są przyporządkowane
wzory, które poprawnie generują wszystkie formy leksemów. Niestety
symbole przypisane poszczególnym wzorom nie układają się w
przejrzysty system.</p>
<p>Celem ostatniego etapu pracy, którego wynikiem jest wersja internetowa
słownika, było opracowanie jednolitego i w miarę możności
przejrzystego systemu symboli dla wszystkich wzorów fleksyjnych
użytych w słowniku. Ze względu na dużą liczbę wzorów (ok.
1000, w tym prawie 800 rzeczownikowych) jest to zadanie trudne.
Konieczna była dokładna analiza usystematyzowanego materiału –
w zestawieniu z dotychczasowymi doświadczeniami jego
implementacji w obu opublikowanych wersjach słownika.</p>
<p>Przy
tworzeniu systemu wzorów fleksyjnych za podstawę wzięto
systematyzację Jana Tokarskiego zawartą w SJPDor. (oraz słownikach
wywodzących się od niego). Jej zalety to logiczność,
przejrzystość i, co najważniejsze, znaczne rozpowszechnienie.
Operuje nią chyba niewielu użytkowników, ale faktycznie istnieje
ona w milionach papierowych kopii. I jest wykorzystana, bezpośrednio
lub pośrednio, zapewne we wszystkich programach komputerowych
operujących fleksją polską. Nawiązanie do klasyfikacji
Tokarskiego powinno stanowić ułatwienie dla kogoś, kto będzie
operował systemem oznaczeń zastosowanych w SGJP.
</p>
<a name="ch1"></a><h3>1. Podstawy teoretyczne</h3>
<p> Jest rzeczą oczywistą, że przedmiotem opisu jest w naszej sytuacji
pisana wersja polszczyzny. Opozycje fleksyjne języka polskiego,
regularnie występujące morfemy gramatyczne czy alternacje muszą
być analizowane w kontekście napisów, tego, jak zapisywane są
słowa – z uwzględnieniem zarówno najbardziej podstawowych
cech polskiego systemu graficznego (np. skomplikowanych zasad
oddawania na piśmie spółgłoskowych fonemów miękkich), jak i
szczegółowych zwyczajów ortograficznych, czasem powszechnie
respektowanych i skodyfikowanych w zasadach pisowni.</p>
<p>Zestawianie regularnie skontrastowanych serii napisów pozwoliło słowa
występujące w polskich tekstach zinterpretować jako formy
wyrazowe (fleksyjne) i pogrupować w leksemy. Charakterystyczną
część wspólną słów (wyodrębnianą graficznie), będących
wykładnikami form tego samego leksemu, nazywamy <strong>trzonem
(fleksyjnym)</strong><a name="przypis2back" href="#przypis2"><sup>2</sup></a>,
pozostałą – następującą po nim część słowa – <strong>zakończeniem</strong>.
</p>
<p>Leksemy układają się w klasy, odpowiadające z grubsza tradycyjnie
wyodrębnianym częściom mowy. Leksemy należące do jednej klasy
charakteryzują się podobnymi cechami fleksyjnymi, mają paradygmaty
zbudowane według podobnych zasad. Te właściwości są istotne przy
tworzeniu wzorów fleksyjnych. Ten sam wzór fleksyjny mają leksemy,
które mają identyczne zakończenia we wszystkich formach
wyrazowych, tj. różnią się tylko trzonem fleksyjnym,
charakterystycznym dla leksemu.</p>
<p>Naczelnym naszym zadaniem jest zdyscyplinowany opis fleksji. Doświadczenia,
zarówno samego opisu, jak – tym bardziej – komputerowej jego
implementacji, pokazują konieczność dwustopniowej realizacji tego
zadania. Należy bowiem oddzielić opis funkcji form fleksyjnych
(fleksja głęboka, ściśle powiązana ze składnią) i czysto
zewnętrzny opis poszczególnych form fleksyjnych i ich wzajemnych
stosunków (fleksja powierzchniowa).</p>
<p>
Rozróżnienie to widać bardzo wyraźnie we wzorach liczebnikowych, w których
niewiele słów (np. <em>pięćset</em>,
<em>pięciuset</em> i rzadkie <em>pięciomaset</em>)
obsługuje skomplikowany paradygmat zbudowany na opozycjach
(przypadka i rodzaju), mających wiele wartości, czyli służy do wypełnienia
wielu klatek paradygmatu.</p>
<p>W niniejszym omówieniu, inaczej niż w całym słowniku i instrukcji do niego, gdzie ograniczamy się do technicznego podziału
formy wyrazowej na trzon fleksyjny i zakończenie,
posługujemy się również terminami wziętymi z tradycyjnej
analizy morfologicznej: <strong>temat</strong> danego
leksemu jest to wyabstrahowany zbiór ciągów liter charakterystycznych dla
danego leksemu (alternantów tematu), między którymi zachodzą
relacje uznane za typowe dla języka polskiego,
<strong>końcówka</strong> – to ciąg liter występujący w formie wyrazowej po alternancie
tematu, charakteryzujący daną formę leksemu. Zwróćmy uwagę na
to, że nie można powiedzieć, że występuje ona w końcowej
części słowa, może bowiem po niej iść jeszcze <strong>postfiks</strong>
(np. +ś, +kolwiek); zdarza się też, że między tematem a końcówką
występuje znak graficzny (łącznik lub apostrof), którego
tradycyjnie nie włącza się do żadnej z tych cząstek. Z kolei <strong>prefiks</strong>
to początkowa część słów będących wykładnikami danego
leksemu, odróżniająca je od słów pokrewnych słowotwórczo;
leksemy różniące się prefiksem odmieniają się na ogół
podobnie.</p>
<a name="ch2"></a><h3>2. Wzory rzeczownikowe</h3>
<p> Usystematyzowanie wzorów rzeczownikowych było najtrudniejsze. Członkowie zespołu
SGJP wykonali wiele prób systematyzacji wzorów deklinacyjnych i
wprowadzili wiele pojęć pomocniczych (Gruszczyński 1989,
Gruszczyński 2001, Gruszczyński–Saloni 2005, Skowrońska 2011).
Zasadniczym efektem tych prac było oddzielenie wyróżnianych typów
wzorów od klas rodzajowych, wprowadzone już w książce
Gruszczyńskiego (1989). Widać to jaskrawo w wypadku podrodzajów
rodzaju męskiego: paradygmat każdego z trzech rzeczowników <span class="leksem">pływak</span>
może być uznany za szczególną realizację tego samego wzoru,
różnice obejmują bowiem tylko trzy klatki paradygmatu, przy czym
w dwu z nich (bierniku obu liczb) występuje forma
przeniesiona z innej klatki tegoż paradygmatu, a trzecia
klatka (forma niedeprecjatywna mianownika liczby mnogiej) jest
specyficzna tylko dla jednego podrodzaju – <em>m1</em>
(męskoosobowego). Tradycyjnie wyróżnia się też rzeczowniki
odmieniane według wzorów przymiotnikowych (w SJPDor.
„<em>odm.</em> jak przym.”),
a także rzeczowniki męskie „odmienne jak żeńskie” (np.
w SJPDor.: „<strong>wojewoda</strong>
<em>m odm.</em> jak <em>ż
IV</em>”).
W pierwszym wypadku rzeczownik ma wszystkie formy takie jak
„homonimiczny” przymiotnik, tylko ograniczone do jednego rodzaju,
np. nazwisko <span class="leksem">Topolski</span>
ma – po ucięciu dwu pierwszych liter – formy takie, jak <span class="leksem">polski</span>
w rodzaju <em>m1</em>,
a <span class="leksem">Topolska</span>
– takie, jak <span class="leksem">polski</span>
w rodzaju <em>f</em>.
W drugim wypadku różnice są większe, np. rzeczownik <span class="leksem">wojewoda</span>
ma – po ucięciu początkowych liter – formy takie jak rzeczownik
<span class="leksem">woda</span>, ale
z dwoma wyjątkami: dopełniacza (i systemowo synkretycznego
z nim biernika) liczby mnogiej (w którym występuje
końcówka <em>-ów</em>, charakterystyczna dla rodzaju męskiego) oraz specjalnej formy niedeprecjatywnej
mianownika (i systemowo synkretycznego z nim wołacza) liczby
mnogiej; ponadto w jego paradygmacie nie występuje alternant
tematu z <em>ó</em> (<em>wód</em>).</p>
<p> Obserwacje te były punktem wyjścia do pomysłu, żeby wzór obejmował
rzeczowniki różnych rodzajów, jeśli różnice w wybranych
kilku klatkach są uwarunkowane rodzajowo. Prowadziło to do
umieszczenia w schemacie wzoru większej liczby klatek niż
obejmuje paradygmat rzeczownika. Natomiast zbędne było dwukrotne
umieszczanie we wzorze form objętych synkretyzmem uniwersalnym dla
danego typu (np. celownika i miejscownika wzorów typu
żeńskiego). Schemat wzoru obejmuje zatem tylko formy bazowe (zob.
SGJP 2012:45–6). Paradygmat konkretnego rzeczownika uzyskuje się z
kilku wskaźników: nazwy leksemu, oznaczenia rodzaju i symbolu
wzoru.</p>
<p>Wzory rzeczownikowe dzielą się na typy – w zależności od zasobu
wprowadzonych form bazowych. Wyróżniono pięć typów, którym
odpowiadają następujące znaki, występujące jako pierwsze
w symbolach wzorów:</p>
<ul class="nopun">
<li>A – odmiana typu przymiotnikowego</li>
<li>B – odmiana typu męskiego</li>
<li>C – odmiana typu nijakiego</li>
<li>D – odmiana typu żeńskiego</li>
<li>E – odmiana nietypowa</li>
</ul>
<p> Symbol wzoru rzeczownikowego, podobnie jak czasownikowego, składa się
z dwu segmentów rozdzielonych separatorem + (drugi segment jest
opcjonalny; występuje tylko wtedy, gdy zachodzi potrzeba) <sup><a name="przypis3back" href="#przypis3">3</a></sup>.
Segment pierwszy podaje podstawową klasyfikację fleksyjną i
najczęściej zawiera litery którejś z form leksemu
(najczęściej podstawowej) uczestniczące w alternacjach.
</p>
<p> Pierwszy segment zaczyna się od znaku A, B, C, D lub E, wskazującego typ
odmiany (i – pośrednio – rzeczownikowość). Na drugim miejscu
w symbolu wzoru rzeczownikowego występuje (z wyjątkiem
typu E) liczba z przedziału 1–5, wskazująca na sposób
odmiany, przede wszystkim uwarunkowany charakterem zakończenia
tematu:</p>
<ul class="nopun">
<li>1 – temat na spółgłoskę miękką</li>
<li>2 – temat na spółgłoskę stwardniałą</li>
<li>3 – temat na spółgłoskę tylnojęzykową (fonologicznie – /k/ i
/g/, a także – z wyjątkami – /x/ i /h/ – ze względu na
reguły użycia <em>i</em> zmiękczającego.)</li>
<li>4 – temat na spółgłoskę twardą (oprócz /k/, /g/ oraz czasem /x/ i /h/</li>
<li>5 – temat niejednolity (najczęściej: wszystkie formy w <em>sg</em> zneutralizowane)</li>
</ul>
<p> Podział ten jest – w zasadniczej koncepcji – przejęty z SJPDor.,
gdzie dla rzeczowników męskich i żeńskich wyróżniono grupy I,
II, III i IV, prawie takie same, jak zdefiniowano wyżej:
różnica sprowadza się do tego, że do grupy III zaliczono tam
również wszystkie rzeczowniki o temacie zakończonym
(fonologicznie) /x/ i /h/, kierując się zasobem końcówek. Dla
nas istotniejsza była inna cecha: fonemom tym odpowiada <em>(c)h</em>,
po którym w funkcji znaku zmiękczenia występuje (lub nie
występuje) <em>i</em> według podobnych zasad, jak po literach odpowiadających fonemom
twardym innym niż /k/ i /g/. Ponadto tę samą zasadę rozciągnięto
na rzeczowniki nijakie, dla których w SJPDor. zastosowano
„uproszczony podział” (tematy na spółgłoskę miękką i
stwardniałą razem w grupie I). Dla rzeczowników z grupy <em>nVI</em>
z SJPDor., typu <span class="leksem">muzeum</span>,
utworzono wzór C5.
</p>
<p>
Podział tematów nie jest stosowany rygorystycznie. Leksemy przyporządkowane
poszczególnym wzorom nie zawsze mają zakończenie tematu zgodne
z podaną tu listą. Czasem, zwłaszcza w wypadku, gdy temat
jest stały, nie alternujący, zaliczane są do wzoru o innym
zakończeniu. Zdarza się bowiem, że identyczny zestaw końcówek
występuje u rzeczowników po temacie należącym do różnych grup,
jak jest na przykład w wypadku leksemów <span class="leksem">Montaigne</span>
(temat na miękką) i <span class="leksem">George</span>
(temat na stwardniałą). – oba odmieniają się według tego
samego wzoru: B1+'w(ów). Na miejscach trzecim i dalszych symbolu wzoru (przed separatorem +)
występują litery uczestniczące w alternacjach, np.:
</p>
<ul class="nopun">
<li>B3g – litera <em>g</em> (<em>szpieg</em>)</li>
<li>B3k – litera <em>k</em> (<em>rybak</em>)</li>
<li>B3q – litera <em>q</em> (<em>Haq</em>)</li>
<li>D2(se) – ciąg liter <em>se</em> (<em>berceuse</em>)</li>
<li>B1i – litera <em>i</em> (<em>modrzew(ia)</em>)</li>
</ul>
<p>
Ich funkcją jest uszczegółowienie znaku drugiego (liczbowego).
Wystąpienie liter w nawiasie wskazuje, że powinny być one
traktowane jako jednolity blok, uczestniczący w alternacjach na
prawach jednego symbolu (w podanym przykładzie określonemu
fonemowi odpowiada tylko pierwsza litera). Kolejne litery
(niekonieczne występujące w formie podstawowej) wpisywane są
w symbolu wzoru bez nawiasu w porządku <em>a
tergo</em>, np.:</p>
<ul class="nopun">
<li>D4hc (np. <em>mucha</em>)</li>
<li>B3ke (np. <em>Turek</em>)</li>
<li>B3gró (np. <em>mórg</em>)</li>
<li>D4re (np. <em>kołdra</em>)</li>
<li>D4rei (np. <em>gra</em>)</li>
</ul>
<p>
Po ciągu liter (<em>a tergo</em>) może wystąpić nietypowa (również: niema albo czytana
niestandardowo) końcówka sg:nom, a także 0 – w wypadku, gdy
w rzeczowniku żeńskim w sg:nom występuje końcówka zerowa,
np.:
</p>
<ul class="nopun">
<li>D2(o) (np. <em>Trapsz</em>)</li>
<li>D4r(ha) (np. <em>Cerha</em>)</li>
<li>D3(ca) (np. <em>carioca</em>)</li>
<li>D1we0 (np. <em>marchew</em>)</li>
<li>D1wei0 (np. <em>cerkiew</em>)</li>
</ul>
<p>Znaki po separatorze + wskazują odstępstwa od schematu wprowadzonego systematycznie, w
szczególności nietypowe końcówki, np.:</p>
<ul class="nopun">
<li>B4+u (np. <em>skarb</em>)</li>
<li>B3keic+w (np. <em>Maciek</em>)</li>
</ul>
<p>
Zestaw tych znaków jest obecnie następujący:</p>
<ul class="nopun">
<li>- – łącznik występujący między tematem a końcówką, np. <em>NIK-u</em></li>
<li>' – apostrof występujący między tematem a końcówką (np. <em>Chomsky’ego</em>)</li>
<li>u – wyjątkowa końcówka sg:gen +u (np. <em>filmu</em>)</li>
<li>(owi) – wyjątkowa końcówka sg:dat +owi (np. <em>koniskowi</em>)</li>
<li>(u) – wyjątkowa końcówka sg:dat +u (np. <em>>kotu</em>, <em>Berdyczowu</em>)</li>
<li>(u?) – wyjątkowa końcówka sg:dat +u – jako alternatywna (np. <em>Lwu</em> – <em>Lwowi</em></li>
<li>! – wyjątkowa końcówka sg:voc, np. zerowa (<em>Marlowe</em>), +sie (od: <em>Smith</em>)</li>
<li>!? – wyjątkowa końcówka sg:voc obok regularnej (np. <em>mołodcze</em> –<em>mołodcu</em>)</li>
<li>e – wyjątkowa końcówka pl:nom +e (np. <em>szanse</em>, <em>kwadranse</em>, <em>woźnice</em>)</li>
<li>w – wyjątkowa końcówka pl:nom:m1 +owie (np. <em>zięciowie</em>) </li>
<li>a – wyjątkowa końcówka pl:nom +a (np. <em>grunta</em>, <em>bracia</em>)</li>
<li>i – wyjątkowakońcówkapl:nom:m1/f/m3 +i (np. <em>ortodoksi</em>, <em>Kaszubi</em>, <em>nici</em>, <em>śmieci</em>)</li>
<li>(ie) – wyjątkowa końcówka pl:nom:m1 +ie (np. <em>Cyganie</em>) </li>
<li>y – wyjątkowa końcówka pl:nom(:m1) +y (np. <em>rzeczy</em>, <em>myszy</em>, <em>statuy</em>, <em>zdrajcy</em>)</li>
<li>c – wyjątkowa końcówka pl:nom:f +ce (<em>ręce</em>)</li>
<li>(ów) – wyjątkowa końcówka pl:gen: +ów (np. <em>papierosisków</em>)</li>
<li>(y) – wyjątkowa końcówka pl:gen lub sg:gen +y (np. <em>naręczy</em>, <em>statuy</em>)</li>
<li>(i) – wyjątkowa końcówka pl:gen: +i (np. <em>osiedli</em>)</li>
<li>0 – wyjątkowa końcówka zerowa pl:gen (np. <em>procent</em>, <em>krakowian</em>, <em>sług</em>)</li>
<li>(mi) – wyjątkowa końcówka pl:inst +mi (np. <em>liśćmi</em>)</li>
<li>(y?) – wyjątkowa końcówka alternatywna pl:inst +y (np. <em>czasy</em>, <em>słowy</em>)</li>
<li>(ech) – wyjątkowa końcówka pl:loc +ech (np. <em>Włoszech</em>)</li>
<li>(sz) – nietypowy alternant sz (dla h) (np. <em>yamasze</em>)</li>
<li>(dz) – nietypowy alternant dz (dla h) (np. <em>Pradze</em>)</li>
<li>(ż) – nietypowy alternant ż (dla h)(np.<em>braże</em></li>
<li>(yj) – końcówka +yj w pl:gen:fnuni lub sg:nom (np. <em>Szeptyćkyj</em>)</li>
<li>(-x) – brak formy podanej po minusie (defektywność): (-pl:gen), (-fchar), (-fneut) (np. <em>Brda</em>)</li>
<li>(pl) – odmiana wyjątkowa w liczbie mnogiej. Tylko A1+(pl) – <em>sędzia</em></li>
<li>(sg) – odmiana wyjątkowa w liczbie pojedynczej. Tylko A1+(sg) – <em>paparazzo</em></li>
<li>(num.) – odmiana wyjątkowa w specjalnych użyciach. Tylko A1+(sg)<li>
<li>M4+(num.) – <em>raz</em></li>
<li>Pozostałe ciągi dwóch i więcej znaków w nawiasie – odpowiednie litery
w którejś z form, najczęściej w zakończeniu, np. (ęt),
(ęc), (en), (on), (in), (i), (es) (por. wyżej)</li>
<li>M – paradygmat (przymiotnikowy) ograniczony do typu męskiego (<em>m1</em> lub <em>m2</em>) – w wypadku braku symbolu dla typu A wartość ta jest domyślna </li>
<li>N – paradygmat (przymiotnikowy) ograniczony do rodzaju nijakiego</li>
<li>Ż – paradygmat (przymiotnikowy) ograniczony do rodzaju żeńskiego</li>
<li>P – paradygmat (przymiotnikowy) ograniczony do rodzaju przymnogiego osob. (jeśli w paradygmacie przymiotnikowym brak oznaczenia,
domyślne – M)</li>
</ul>
<p>Ponadto po separatorze występują dłuższe ciągi znaków dla odmiany nietypowej, supletywnej lub dwuczłonowej, np.:</p>
<ul class="nopun">
<li>człowiek – wyjątek leksykalny (dla kilku leksemów)</li>
<li>ystok – wyjątek leksykalny (dla <em>Białystok</em>)</li>
<li>agłowa – wyjątek leksykalny (dla <em>białagłowa</em>)</li>
<li>latka – wyjątek leksykalny (dla <em>roczek</em>)</li>
<li>lata – wyjątek leksykalny (dla <em>rok</em>)</li>
<li>ystaw – wyjątek leksykalny (dla <em>Krasnystaw</em>)</li>
<li>rzecz – wyjątek leksykalny (dla <em>rzeczpospolita</em>)</li>
</ul>
<p>Do typu E należą wzory nie pasujące do żadnego z typów A–D. Oprócz wzoru E0, obejmującego rzeczowniki nieodmienne, dzielą się
one na dwie grupy.</p>
<p> Do pierwszej należą dwa wzory dla rzeczowników <em>plurale
tantum</em>, odległe od wszystkich wzorów pozostałych typów – zostały
oznaczone przez bezpośrednie wskazanie swoich reprezentantów (E+Niemcy, E+stwo)<a name="przypis4back" href="#przypis4"><sup>4</sup></a>.
(Rzeczowniki <em>plurale tantum</em> są na ogół traktowane jako rzeczowniki defektywne – nie mające, ze względu na rodzaj <em>p</em>,
form liczby pojedynczej).</p>
<p> Do drugiej grupy wchodzą wzory dla rzeczowników <em>singulare tantum</em> (są to jedyne takie rzeczowniki w języku polskim), o wykładnikach odmiany niepodobnych do rzeczowników wskazanych wyżej grup, nazywane tradycyjnie zaimkami rzeczownymi. Oznaczenia tych wzorów,
podobnie jak innych wzorów rzeczownikowych, składają się z dwu segmentów rozdzielonych separatorem +. Druga część jest
opcjonalna: podany jest w niej <em>explicite</em> postfiks (np. Eco+śkolwiek) lub prefiks (np. Ekt+ni); w pierwszej
części, po klasyfikatorze E, podany jest podstawowy alternant tematu (np. Ekto+kolwiek, Esio, Ewasze).</p>
<a name="ch3"></a><h3>3. Wzory zaimkowe</h3>
<p>
Stosownie do przyjętych w SGJP założeń jako odrębną grupę leksemów
potraktowano zaimki osobowe. Każdy z sześciu należących do
niej leksemów odmienia się według innego wzoru. Wzory
nazwano: Zmy, Zwy, Zty, Zja, Zsię, Zon. </p>
<a name="ch4"></a><h3>4. Wzory przymiotnikowe</h3>
<p>Systematyzacja wzorów przymiotnikowych opiera się na tych samych zasadach co
rzeczownikowych. Na pierwszym miejscu litera P wskazuje na
przymiotnik.</p>
<p>Na drugim miejscu w symbolu wzoru przymiotnikowego występuje
liczba z przedziału 0–4, wskazująca na sposób odmiany,
przede wszystkim uwarunkowany charakterem zakończenia tematu (zob.
Saloni 1992):</p>
<ul class="nopun">
<li>0 – leksem nieodmienny (np. <em>bordo</em>)</li>
<li>1 – temat na spółgłoskę miękką (np. <em>bielusi</em>)</li>
<li>2 – temat na spółgłoskę stwardniałą (np. <em>gorący</em>)</li>
<li>3 – temat na spółgłoskę tylnojęzykową (fonologicznie – /k/ i /g/, np. <em>egipski</em>)</li>
<li>4 – temat na spółgłoskę twardą (oprócz /k/ i /g/, np. <em>sławny</em>) [Tu zaliczono też ch – ze względu na reguły użycia <em>i</em>
zmiękczającego.]</li>
</ul>
<p>Po numerze grupy czasami podane jest zakończenie tematu
charakterystyczne dla danego wzoru – podobnie jak w wypadku
rzeczowników, zapisane jest ono w kolejności znaków
<em>a tergo</em> (kolejność zwykła jest zastosowana tylko w ujętych w nawias
postfiksach, np. <em>kolwiek</em><a name="przypis5back" href="#przypis5"><sup>5</sup></a>). Występują tutaj (oprócz innych liter, nie wymagających komentarza) następujące znaki:</p>
<ul class="nopun">
<li>e – litera <em>e</em> (tzw. <em>e</em>
wstawne, np. <em>pełen</em>)</li>
<li>iV – litera <em>i</em> występująca po literze samogłoskowej (we wzorze P1iV – <em>białoszyi</em>, <em>burżui</em>)</li>
</ul>
<p>Po podaniu informacji wskazujących na typ odmiany i zapis zakończenia omawianych wyrazów mogą pojawić się jeszcze następujące znaki:
</p>
<ul class="nopun">
<li>- – brak w mianowniku rodzaju męskiego (l. poj.) formy zakończonej literą samogłoskową (np. <em>żaden</em>)</li>
<li>+ – istnienie formy spółgłoskowej w mianowniku męskich (l. poj., np. <em>łaskaw</em> obok <em>łaskawy</em>)</li>
<li>++ – istnienie formy spółgłoskowej w mianowniku podrodzajów męskich i bierniku podrodzaju <em>m3</em> (l. poj.,
np. <em>mamin</em>)</li>
<li>! – forma hasłowa zakończona na spółgłoskę (chociaż za poprawną uznajemy też formę zakończoną samogłoską,
np. <em>wart</em> obok <em>warty</em>) </li>
<li>$ – występowanie form krótkich (np. <em>mego</em>) obok pełnych (np. <em>mojego</em>)</li>
<li>? – dana cecha wątpliwa (np. istnienie żeńskiej biernikowej formy l. poj. <em>tamtę</em>
w paradygmacie leksemu <em>tamten</em>)</li>
</ul>
<p>We właściwej funkcji w końcowej części symbolu wzoru występują
jeszcze dwie litery, które jednak odnoszą się do form specjalnych:</p>
<ul class="nopun">
<li>o – końcówka formy bazowej<a name="przypis6back" href="#przypis6"><sup>6</sup></a> 5' (np. <em>samo</em>
– w odróżnieniu od formy 5'': <em>same</em>)</li>
<li>ę – końcówka formy bazowej 8' (np. <em>tę</em> – w odróżnieniu od formy 8'': <em>tą</em>)</li>
</ul>
<p>Ponadto:</p>
<ul class="nopun">
<li>def – wskazuje na paradygmat defektywny (<em>rad</em> i <em>kontent</em>).</li>
<li>K – oznacza literę <em>k</em>, zachowaną w formie bazowej 9: <em>ki</em> (zamiast spodziewanego <em>cy</em>,
por. <em>jacy</em>)</li>
<li>(en) – zakończenie formy spółgłoskowej ze spółgłoską nietematyczną (np. <em>ten</em>)</li>
<li>(lz) – alternatywną formę 9 (<em>zmarźli</em> obok <em>zmarzli</em>) </li>
</ul>
<a name="ch5"></a><h3>5. Wzory liczebnikowe</h3>
<p>
System numeracji wzorów liczebnikowych jest oparty na podobnych zasadach –
z tą różnicą, że zamiast liter tematycznych wykorzystane są
skojarzenia znaczeniowe.</p>
<p>Po pierwszym znaku L (liczebnik), następuje litera określająca typ
fleksyjny liczebnika: </p>
<ul class="nopun">
<li>a – nieodmienny</li>
<li>b – odmienny tylko przez rodzaj (np. <em>półtora</em>)</li>
<li>c – wzbogacony typ odmiany liczebnikowej (jak <em>dwa</em>)</li>
<li>d – zasadniczy typ odmiany liczebnikowej (jak <em>pięć</em>)</li>
</ul>
<p>
Do tworzenia nazw wzorów dla rzeczowników głównych zostały użyte
liczby naturalne. Ściślej – w nazwie takiego wzoru na miejscach
trzecim i dalszych stoi najniższa liczba naturalna, której nazwa
odmienia się według tego wzoru, np.: Lc3, Ld5, Ld11, Ld20, Ld200
itd.</p>
<p>
Podobną
konwencję zastosowano do liczebników nazywających liczby w sposób
przybliżony, np.: Ld1P (<em>paręnaście</em>), LdW0 (<em>wieledziesiąt</em>);
nazwy czysto konwencjonalne to tylko: LdX (<em>ile</em>),
LdT (<em>tyle</em>), LdW (<em>wiele</em>).
Jeśli w formach leksemu występuje postfiks, jest on zapisywany po
znaku +, np.: LdX+ś, Ld2+kroć (<em>dwakroć</em>).</p>
<p>
Przy numerowaniu wzorów dla liczebników dwu pierwszych typów
zastosowano najprostsze techniki mnemotechniczne, np.: Lapół, Lbpółtora.</p>
<a name="ch6"></a><h3>6. Wzory czasownikowe</h3>
<p> Najtrudniejsze [por. rzeczowniki] było przedstawienie wzorów czasownikowych.
Wykorzystano tu doświadczenia Zygmunta Saloniego, który nad fleksją werbalną
pracował przez 35 lat – od momentu, gdy w roku 1981 przejął od Jana Tokarskiego rękopis
<em>Schematycznego indeksu polskich form wyrazowych </em> (Tokarski
1993).</p>
<p>Stwierdził wtedy, że pod względem adekwatności względem materiału lepsza od
późniejszej klasyfikacji Tokarskiego, z SJPDor. (1958),
wyróżniającej tylko 18 grup i podgrup koniugacyjnych (nie licząc
wyjątków), jest wcześniejsza – z książki <em>Czasowniki
polskie</em> (1951), wyróżniająca ich 49. Tą też operował on roboczo w
dalszych pracach. W celach popularyzatorskich jednak lepiej było
odwoływać się do klasyfikacji drugiej jako lepiej znanej (zob. np.
Saloni 2001). Właściwa analiza Saloniego szła w kierunku
uściślenia systematyzacji Tokarskiego i doprowadziła do
wyróżnienia 217 wzorów koniugacyjnych (zob. Saloni 2008). Symbole
tych wzorów, stanowiące uszczegółowienie symboli Tokarskiego,
były używane w wydaniu I i II SGJP. System ten miał tę wadę,
że był bardzo trudny do przyswojenia. Autor przyznaje, że gdy
widział symbol, rozumiał tylko jego początkową część, reszty –
bez przykładu – nie pamiętał.</p>
<p>Z tych powodów dla internetowej wersji SGJP postanowiono opracować
system symboli nawiązujących do oznaczeń z SJPDor. Jednak
konieczne było dokonanie czysto formalnych zmian. Niewygodne było
mianowicie użycie liczb rzymskich, które występują w SJPDor.
i późniejszych słownikach – występują w nich bowiem
litery alfabetu łacińskiego, co utrudnia automatyczne sortowanie
(standardowe jest układanie napisów według kolejności
alfabetycznej). Dlatego też trzy pierwsze znaki symbolu stanowią
(oprócz czterech wyjątków podanych na końcu niniejszego punktu):</p>
<ul class="nopun">
<li>V – ogólny symbol wzorów czasownikowych (tj. opartych o paradygmat
według trybów i czasów z syntetycznym bezokolicznikiem;
symbol ten nie jest stosowany do czasowników niewłaściwych
odmienianych analitycznie, jak <em>można</em>,
ani do wtórnych czasowników odprzymiotnikowych, jak <em>powinien</em>)</li>
<li>xx – dwucyfrowa liczba z przedziału 01–20 (liczby mniejsze od
10 zapisywane są z zerem na początku)</li>
</ul>
<p>
Oznaczenia 01–11 odpowiadają dużym grupom I–XI z SJPDor. (pominięte
są modyfikujące litery przy grupach V, VI, VII, VIII i X).
Pozostałe numery zostały wykorzystane dla czasowników „bez cyfry
[tj. numeru] grupy” w SJPDor., oczywiście odpowiednio
pogrupowanych. Jednak niektóre z tych czasowników, których odmiana
niewiele odbiega od któregoś z wzorów I–XI, mają
przyporządkowany odpowiedni niższy numer dwucyfrowy; specyfika tego
wzoru podawana jest w dalszej części oznaczenia (od czwartego
znaku).</p>
<p>
Ta część oznaczenia wzoru zawiera charakterystykę alternacji
występującej w należących do niego czasownikach, podanych –
w miarę możności za pomocą liter występujących w poszczególnych
formach. Rozpada się ona na dwa segmenty rozdzielone separatorem +
(drugi segment jest opcjonalny; występuje tylko wtedy, gdy zachodzi
potrzeba).</p>
<p>
W pierwszym
segmencie (obligatoryjnym) notowany jest przyrostek tematowy (według
Jana Tokarskiego), na ogół w dwu alternantach, przedzielonych
kreską pionową: praes:sg:3p i praet:sg:m:3p (jeśli oba alternanty są identyczne, notuje się
tylko jeden ciąg liter), np. symbol <em>V05nie|ną</em>
odpowiada podgrupie <em>Va</em>
w SJPDor., do której należy wiele leksemów (np. <em>ciągnąć</em>).
Zdarza się, że segment ten jest redundantny w stosunku do
wcześniejszej części oznaczenia, np. <em>V04uje|owa</em> – oznaczenie <em>IV</em>
w SJPDor. jednoznacznie wskazuje grupę, która nie
obejmuje żadnych odmianek czy podgrup, alternacja w niej jest
uniwersalna (np. <em>rachować</em>).
Zdarza się, że przyrostek tematowy podany w pierwszym
segmencie (ze względów poglądowych, dydaktycznych) z punktu
widzenia programu SGJP należy do trzonu fleksyjnego (tj. części
powtarzającej się we wszystkich formach leksemu), np. <em>V01a</em>
– litera <em>a</em>
jest obecna we wszystkich formach czasowników grupy <em>I</em>
(np. <em>chować</em>).
Zdarza się też, że w praet:sg:m:3p występuje zerowy
alternant przyrostka tematowego: w wypadkach takich po kresce |
nie notuje się żadnej litery, np. <em>V05nie|</em>
– symbol ten odpowiada głównemu wzorowi podgrupy <em>Vc</em>
z SJPDor. (np. <em>chudnąć</em>).
Na zasadzie wyjątku zastosowano – po kresce | – symbol 0 (zero)
– dla czasowników defektywnych (np. <em>gorzeć</em>
– <em>gorze</em>/<em>gore</em>).</p>
<p>
Drugi segment (po separatorze +) drugiej części wzoru czasownikowego
notowany jest w wypadkach, gdy wcześniejsze jego elementy nie
wystarczają do jego jednoznacznej identyfikacji. Notowany jest wtedy
jeszcze jeden alternant przyrostka tematowego lub, szerzej, tematu
czasownika, uznany za najbardziej charakterystyczny, np. symbol
<em>V05nie|ną+ń</em>
odpowiada podgrupie <em>Vb</em>
w SJPDor., różniącej się od<em>
Va</em>
formą rozkaźnika (<em>płyń</em>
w opozycji do <em>ciągnij</em>).
Starano się o to, aby forma notowana po + była najbardziej
charakterystyczna dla alternacji występujących w danym wzorze,
np. <em>V06si+szę</em>
(np. <em>kusić</em>).</p>
<p>
Systemu numerowania grup nie zastosowano do czterech leksemów nie mających
typowych wykładników koniugacyjnych, lecz przejęte z odmiany
przymiotnikowej. Odpowiadające im wzory składają się z dwu
segmentów: pierwszego VA i – po znaku + – formy męskiej danego
leksemu: VA+winien, VA+rad, VA+gotów, VA+kontent.</p>
<p> Czasowniki
nieodmienne syntetycznie (np. trzeba) oznaczono – paralelnie do
innych typów leksemów – symbolem V0.
</p>
<a name="ch7"></a><h3>7. Wzory przyimkowe</h3>
<p>
W SGJP uwzględniono także „odmianę” przyimków, tj.
zróżnicowanie form leksemów przyimkowych typu <em>z</em>/<em>ze</em>.
Przyimki, w których ono występuje, zostały w słowniku
oznaczone symbolem Re.
</p>
<a name="ch8"></a><h3>8. Po co to wszystko?</h3>
<p>
Zasadniczym
celem przedstawionego wyżej systemu oznaczeń było zbudowanie
hierarchii, która ułatwi zastosowania praktyczne. Możliwe powinno
być zarówno znalezienie właściwego oznaczenia dla leksemu nie
uwzględnionego w słowniku, jak i stworzenie nowego oznaczenia
dopasowanego do całości (do pewnego momentu zawierającego elementy
wprowadzone we wzorach istniejących).</p>
<p>
Mamy bowiem przeświadczenie, że SGJP może być z powodzeniem rozwijany
dla celów zarówno uczenia języka polskiego, jak i przetwarzania
tekstów w języku polskim.
</p>
<a name="ch9"></a><h3>9. Pozycje cytowane</h3>
<ul class="nopun">
<li> Gruszczyński W. (1989), <em>Fleksja
rzeczowników pospolitych we współczesnej polszczyźnie pisanej</em>,
Wrocław.</li>
<li>Gruszczyński W. (2001), <em>Rzeczowniki
w słowniku gramatycznym współczesnego języka polskiego</em>,
[w:] <em>Nie
bez znaczenia… Prace ofiarowane Profesorowi Zygmuntowi Saloniemu z
okazji jubileuszu 15 000 dni pracy naukowej</em>,
[red.:] W. Gruszczyński, U. Andrejewicz, M. Bańko, D. Kopcińska,
Białystok, s. 99–116.</li>
<li>Gruszczyński W., Saloni Z. (2006), <em>Notowanie
informacji o odmianie rzeczowników w projektowanym „Słowniku
gramatycznym języka polskiego”</em>.
[w:] I. Bobrowski, K. Kowalik (red.), <em>Od
fonemu do zdania. Prace dedykowane Profesorowi Romanowi Laskowskiemu</em>;
Kraków, s. 203–213.</li>
<li>Saloni Z. (1992), <em>Rygorystyczny
opis polskiej deklinacji przymiotnikowej</em>,
[w:] Zeszyty Naukowe Wydziału Humanistycznego Uniwersytetu
Gdańskiego. Prace Językoznawcze, t. 16, Gdańsk, s. 215–228.</li>
<li>Saloni Z. (2001), <em>Czasownik polski</em>,
Warszawa.</li>
<li>Saloni Z. (2008), <em>Les
modèles de conjugaison des verbes polonais.</em> [w:]
<em>Questions de linguistique slave. Études
offertes à Marguerite Guiraud-Weber</em>, réunies par R. Roudet et Ch. Zaremba.
Aix-en- Provence; s. 279–292.</li>
<li> SGJP
(2007): Saloni Z., Gruszczyński W., Woliński M., Wołosz R.,
<em>Słownik gramatyczny języka polskiego</em>. Warszawa. [płyta CD + broszura, s. 177].</li>
<li> SGJP (2012): Saloni Z., Woliński M., Wołosz R., Gruszczyński W., Skowrońska D.,<em>Słownik gramatyczny języka polskiego</em>.
Wydanie II, poprawione i uzupełnione Warszawa. [płyta CD + broszura, s. 177]. Warszawa [płyta CD + broszura, s.~179, 2 nlb.].</li>
<li>SJPDor. (1958–1969), <em>Słownik języka polskiego</em>, [red.:] W. Doroszewski, t. 1–11, Warszawa.</li>
<li>Skowrońska D. (2011): Makowska D., Formy deprecjatywne w „Słowniku
gramatycznym języka polskiego”. Stan obecny i postulaty, Polonica XXIX, s. 205-226. </li>
<li>
Tokarski J. (1951),<em>Czasowniki polskie</em>, Warszawa.</li>
<li>Tokarski J. (1958),<em>Formy fleksyjne</em>, [w:] SJPDor.,
t. 1, s. XLIX–LXXIV.</li>
<li>Tokarski J. (1973),<em>Fleksja polska</em>, Warszawa.</li>
<li>Tokarski J. (1993), <em>Schematyczny indeks a tergo polskich form wyrazowych</em>,
[red.:] Z. Saloni, wyd. 2 – 2002, Warszawa.</li>
</ul>
<h3>Przypisy</h3>
<div>
<p><a name="przypis1" href="#przypis1back"><sup>1</sup></a> Praca powstała w ramach projektu, który został sfinansowany ze środków
Narodowego Centrum Nauki przyznanych na podstawie decyzji numer
DEC-2011/01/B/HS2/04695.</p>
</div>
<div>
<p><a name="przypis2" href="#przypis2back"><sup>2</sup></a>
W poprzednich wydaniach SGJP cząstkę tę nazywaliśmy tematem
fleksyjnym.</p>
</div>
<div>
<p>
<a name="przypis3" href="#przypis3back"><sup>3</sup></a>
Człon symbolu wzoru po znaku + niekoniecznie musi odpowiadać faktycznym
właściwościom leksemu, który się według tego wzoru odmienia,
bo może się odnosić do innych leksemów. Na przykład wiele
wzorów typu żeńskiego (D) ma po znaku + symbol (ów), oznaczający
wyjątkową końcówkę dopełniacza liczby mnogiej. Rzecz jasna,
końcówka +ów nie występuje w rzeczownikach żeńskich (np.
<span class="leksem">fala</span>),
tylko w męskich (np. <span class="leksem">cieśla</span>) oba odmieniają się według tego samego wzoru: D1l+(ów).</p>
</div>
<div>
<p><a name="przypis4" href="#przypis4back"><sup>4</sup></a> Rzeczownik
<em>plurale tantum</em> <span class="leksem">Niemcy</span>
nie pasuje ani do żeńskiego typu D (ze względu na pl:nom), ani do
męskiego B (ze względu na pl:gen); rzeczowniki <em>plurale
tantum</em> wzoru E+stwo mają we wszystkich formach końcówki
charakterystyczne dla liczby pojedynczej.</p>
</div>
<div>
<p><a name="przypis5" href="#przypis5back"><sup>5</sup></a>
Wszystkie formy z postfiksem odpowiadają formom innego leksemy bez postfiksu.</p>
</div>
<div>
<p><a name="przypis6" href="#przypis6back"><sup>6</sup></a>
Koncepcja form bazowych wraz z odpowiadającymi im oznaczeniami
jest opisana we wstępie teoretycznym do SGJP.</p>
</div>
{% endblock %}