lista zjaw 3.tex
29.1 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
% \RequirePackage[hyphens]{url}
\documentclass[a4paper, 12pt]{article}
% \documentclass[preprint, a4paper, 11pt]{article}
\usepackage[T1]{fontenc}
\usepackage[english, polish]{babel}
\usepackage[utf8]{inputenc}
\usepackage{fullpage}
\usepackage{amsmath}
\usepackage{amsthm}
\theoremstyle{remark}
\newtheorem{test}{Test}
\usepackage[hidelinks]{hyperref}
% \urlstyle{sf}
\expandafter\def\expandafter\UrlBreaks\expandafter{\UrlBreaks% save the current one
\do\\~} % this stops urls from sticking out of the damn screen and the paper. I hate this arrggh.
\usepackage{tocloft}
\cftsetindents{section}{0pt}{2.25em}
\cftsetindents{subsection}{0pt}{2.25em}
\cftsetindents{subsubsection}{0pt}{2.25em}
\addtocontents{toc}{\cftpagenumbersoff{section}}
\usepackage{xcolor}
\newcommand{\eniam}{\textsc{Eniam}}
\newcommand{\experiencer}{\textsc{Experiencer}}
\newcommand{\agent}{\textsc{Agent}}
\newcommand{\theme}{\textsc{Theme}}
\frenchspacing
\title{
\normalsize
\setlength{\topsep}{0pt}
\noindent
Zleceniodawca: IPI PAN \hfill Dzieło do umowy z dnia: 2.11.2016 \\
Zleceniobiorca: Jakub Kozakoszczak \hfill Termin zakończenia pracy: 25.11.2016 \\
\rule{\linewidth}{2pt} \\[6pt]
\huge Lista zjawisk semantycznych \\ przeznaczonych do uwzględnienia \\ w reprezentacji semantycznej parsera \eniam \\[-2pt]}
\author{\Large Wojciech Jaworski, Jakub Kozakoszczak\\[6pt]
\hspace{-5pt}\rule{\linewidth}{2pt} }
\date{}
% \date{\normalsize Date Submitted}
\begin{document}
\maketitle
\vspace{-26pt}
\begin{description}
\setlength{\itemsep}{4pt}
\setlength{\parskip}{0pt}
\item[Zrealizowane w ramach projektu:] „CLARIN -- Polskie wspólne zasoby językowe i infrastruktura technologiczna”
\item[Tytuł pracy zamówionej:] ,,Opracowanie listy zjawisk semantycznych przeznaczonych do uwzględnienia w reprezentacji semantycznej generowanej przez parser kategorialny''
\item[Adres dzieła:] \url{http://wiki.nlp.ipipan.waw.pl/clarin/Parser\%20kategorialny?action=AttachFile\&do=view\&target=JK_zjawiska_semantyczne.pdf}
\item[Opracowanie dokumentu:] Jakub Kozakoszczak
\end{description}
\vspace{6pt}
\hrule
\vspace{-14pt}
\renewcommand\contentsname{\normalsize{}}
\tableofcontents
\vspace{20pt}
\hrule
\newpage
\section{Wstęp} % (fold)
{
\renewcommand\thesection{}
\renewcommand\thesubsection{}
\setcounter{subsection}{-1}
\subsection{Zakres i przeznaczenie listy} % (fold)
}
Lista zbiera zjawiska semantyczne, których spójne opisanie w ramach jednolitej implementowalnej reprezentacji znaczenia o szerokim pokryciu dla języka polskiego wymaga szczegółowych, głębszych badań.
Są to przede wszystkim zjawiska polegające na wprowadzaniu przez wyrażenia elementów znaczenia do zdań w sposób inny podstawowy, czyli przez zawężającą modyfikację znaczenia bezpośredniego nadrzędnika składniowego.
Ten podstawowy sposób nazywamy roboczo \emph{lokalnym wkładem znaczeniowym}.
Lista jest wstępnym rozpoznaniem, które posłuży jako mapa zadań w następnych etapach rozwoju kategorialnego parsera składniowo-semantycznego \eniam.
% section zakres_i_cel_listy (end)
%\chapter{Lista zjawisk semantycznych} % (fold)
{
\section{Lokalność i nielokalność składniowo-semantyczna}
\renewcommand\thesection{}
\renewcommand\thesubsection{}
\setcounter{subsection}{-1}
\subsection{Opis zjawiska} % (fold)
\label{sub:definicja_robocza1}
}
% subsection definicja_robocza (end)
Podzbiorem logiki pierwszego rzędu, który wystarcza do wyrażenia znakomitej większości wypowiedzeń w języku naturalnym, jest logika egzystencjalno-koniunkcyjna (logika $\exists\wedge$). Język reprezentacji znaczenia parsera \eniam{} jest bardziej złożony, bo wzbogacony między innymi o operator \textsc{dscr} wiążący zmienną z formułą oraz pozalogiczne predykaty relacyjne, jak \textsc{type} i \textsc{count} i role tematyczne, jak \agent{} i \theme{}. Istnieją jednak jednostki języka naturalnego, wśród nich kwantyfikatory, operatory logiczne i modyfikatory nieintersektywne, których znaczenie leksykalne (w sensie wkładu w znaczenie zdania) jest niewyrażalne w logice $\exists\wedge$ z operatorem \textsc{dscr}, np. dla języka polskiego
\begin{itemize}
\item każdy, prawie każdy, każdy z powyższych, co dziesiąty,
każdy \dots ma inny \dots, nawzajem, razem,
codziennie, nigdy, zawsze, tylko, jakiś, pewien, jedyny, oba, inny
nie tylko \dots lecz także
\end{itemize}
Jednostki te nazywać będziemy \emph{jednostkami o nielokalnym wkładzie składniowo-semantycznym} lub po prostu \emph{operatorami nielokalnymi}. Pozostałe jednostki mają \emph{lokalny wkład składniowo-semantyczny}.
Interesują nas następujące cechy operatorów nielokalnych:
\begin{itemize}
\item konstrukcje składniowe, w których występują,
\item semantyka, czyli wprowadzane zmienne i liczba argumentów,
\item odwzorowanie konstrukcji składniowych na semantykę.
\end{itemize}
Nie będziemy opatrywać operatorów nielokalnych pełnymi hasłami leksykalnymi, a jedynie zaznaczać ich wystąpienia w formach logicznych
w sposób taki, by potencjalne dodanie znaczenia leksykalnego nie wymagało dalszego zmieniania formy logicznej zdania.
Z uwagi na to, że operatory nielokalne wchodzą ze sobą w interakcje w zdaniu (np. mogą stać w różnej kolejności),
zadane przez nas odwzorowanie konstrukcji składniowych na formę logiczną nie będzie stanowić przepisu na jednoznaczną semantykę,
w szczególności nie będziemy na tym etapie rozwiązywać problemu niejednoznaczności zakresu operatorów nielokalnych.
Osobnym problemem jest reprezentacja nieciągłych operatorów nielokalnych,np. \emph{Każda strona ma inny kolor} i interakcji między operatorami nielokalnymi innych niż zagnieżdżanie się zakresów
np. w przypadku kwatyfikatorów rozgałęzionych w zdaniu Hintikki.
\textbf{Negację} traktujemy jako operator nielokalny mający jeden argument i nie wprowadzający zmiennej.
Spójniki ,,\textbf{jeśli \dots, to \dots}'' oraz~ ,,\textbf{jeśli \dots, \dots}'' użyte w znaczeniu logicznym uznajemy za operatory nielokalne.
% TODO for ENIAM:
% Uwaga zgodnie z formalizmem wprowadzonym w Walentym ,,jeśli'' wiąże zdanie podrzędne z orzeczeniem zdania nadrzędnego za pomocą
% roli tematycznej Condition. Trzeba będzie zbadać użycia roli Condition i określić czy są one uogólnienie intersektywne.
% Jeśli nie są trzeba zbadać w jaki sposób należy je przekształcić do postaci formuły logicznej.
% Rolę Manner też można traktować jako nielokalną.
\subsection{Zjawisko wyciągania kwantyfikatorów poza zakres operatora spowodowane koreferencją elementów argumentów operatora}
\begin{equation}
\text{Jeśli rolnik ma krowę, to ją doi}
\end{equation}
W powyższym przykładzie ,,jeśli'' traktujemy jako logiczną implikację, ,,rolnik'' i ,,krowa'' są kwantyfikowane egzystencjalnie, a
,,ją'' i ,,pro'' (podmiot domyślny czasownika ,,doi'') są kwantyfikowane koreferencyjnie ($\iota$).
Aby rozwiązać koreferencję trzeba przenieść powyższe 4 kwantyfikatory ponad implikację co powoduje
zamianę kwantyfikatorów ezgzystencjanych przy ,,rolniku'' i ,,krowie'' na uniwersalne.
Analogiczne zjawisko będzie występować przy wszystkich operatorach nielokalnych mających więcej niż jeden argument.
\section{Niejawne argumenty semantyczne} % (fold)
{
\renewcommand\thesection{}
\renewcommand\thesubsection{}
\setcounter{subsection}{-1}
\subsection{Opis zjawiska} % (fold)
\label{sub:definicja_robocza2}
}
Niezbędne jest rozpoznanie i oznaczenie argumentów niejawnych w leksemach i wypracowanie skutecznej koncepcji ich opisu i przetwarzania.
Za niejawne argumenty semantyczne uznajemy te argumenty, które są niezbędne do ustalenia znaczenia wyrazu mającego ten argument.
Przykłady występowania wyrażeń z różnymi argumentami niejawnymi:
\begin{itemize}
\item większy -- większy niż słoń \\ Znaczenia wyrazu ,,większy'' nie da się obliczyć bez argumentu ,,niż słoń''.
\item Biegnie. -- On biegnie. -- Jaś biegnie. \\
W pierwszym zdaniu inicjatora (\textsc{Initiator}) reprezentujemy oznaczając go niemym zaimmkiem (\textsc{pro}), w drugim jest on wyrażony za pomocą zaimka ,,on'', w trzecim jest wskazany jawnie jako ,,Jaś''.
Aby obliczyć znaczenie \textsc{pro} i ,,on'' potrzebna jest wartość koreferencyjnego lub deiktycznego argumentu.
\item Karol chce. -- Karol chce pracować.\\
Brakującego argumentu składniowego czasownika ,,chcieć'' nie traktujemy jako niejawnego argumentu semantycznego.
\end{itemize}
% subsection definicja_robocza (end)
\subsection{Lista niejawnych argumentów semantycznych} % (fold)
\label{niejawne}
Po wstępnej analizie przyjmujemy istnienie sześciu typów niejawnych argumentów semantycznych:
\begin{enumerate}
\item Okazjonalne \\ Np. \emph{tu}.
\item Deiktyczne\\ Np. \emph{taki}.
\item Porównawcze \\ Leksemy z tym argumentem mogą przyjmować porównawczy argument przyimkowy.
\item Porządkowe \\ Np. \emph{kolejny}.
\item Koreferencyjne \\ Np. \emph{on}.
\item Relacyjne \\ Aby określić znaczenie znaczenie przymiotników i liczebników z argumentem relacyjnym (\emph{duży}, \emph{sporo}) trzeba wiedzieć, jaki predykat jest modyfikowany przez dane słowo.
\label{relac}
\end{enumerate}
\section{Znaczenie relacji składniowych} % (fold)
\subsection{Uogólniona intersektywność} % (fold)
\label{uog_interektywnosc}
Ważną cechą semantyczną, która przysługuje nie wszystkim leksemom, a pozwala na reprezentowanie ich wkładu znaczeniowego jako zawężającego znaczenie szerszej frazy, jest \emph{intersektywność}.
Tradycyjnie rozumiana intersektywność przypisywana jest przymiotnikom i oznacza, że denotacja frazy rzeczownikowej z przymiotnikiem intersektywnym jest podzbiorem denotacji frazy bez niego.
\begin{equation}
\text{Widzę czarnego kota.} \rightarrow \text{Widzę kota.}
\end{equation}
Rozumienie to można uogólnić na przysłówki i mówić o przysłówkach intersektywnych. Zbadania wymaga, w jakich innych częściach mowy lub pozycjach składniowych da się mówić o podziale na wyrażenia nieintersektywne i intersektywne w sensie uogólnionym -- wyrażenia takie powinny spełniać większość lub wszystkie testy:
\begin{test}
Zaczynając od korzenia drzewa rozbioru składniowego dodajemy kolejne węzły i sprawdzamy, czy ze znaczenia drzewa rozszerzonego wynika znaczenie drzewa mniejszego. Jeśli tak, dodawane węzły są intersektywne w sensie uogólnionym.
\end{test}
\begin{test}
Zaczynamy od liści i ucinamy je po jednym, sprawdzając, czy znaczenie zdania staje się bardziej ogólne. Jeśli tak, ucinane węzły są intersektywne w sensie uogólnionym.
\end{test}
\begin{test}
Porównujemy typy semantyczne wyrażenia złożonego i tego samego wyrażenia bez jednego z podrzędników. Jeżeli pierwszy z tych typów jest podtypem drugiego, podrzędnik jest intersektywny w sensie uogólnionym.
\end{test}
\begin{equation}\label{biegnie}
\text{Jaś biegnie.} \rightarrow \text{Biegnie.}
\end{equation}
\begin{equation}\label{jablka}
\text{cztery jabłka} \subset \text{jabłka}
\end{equation}
\begin{equation}\label{fontanna}
\text{Mieszkam nieopodal fontanny.} \stackrel{?}{\rightarrow} \text{Mieszkam nieopodal.}
\end{equation}
Przykłady \ref{biegnie} i \ref{fontanna} ilustrują wynikanie zdań, przykład \ref{jablka} mówi o zawieraniu się denotacji.
Ostatni przykład pokazuje, że rozstrzygnięcia wymaga problem relacji znaczenia jednobrzmiących leksemów przysłówkowych i przyimkowych. Pożądaną opcją wymagającą zweryfikowania jest identyczność znaczeniowa wszystkich lub większości takich par \emph{modulo} argument niejawny przysłówka.
\subsection{Rozbiór składniowy w podejściu semantycznym}
Do wyliczenia reprezentacji semantycznej zdania potrzebne są dane wejściowe -- rozbiór składniowy w podejściu semantycznym. Otrzymanie takiego rozbioru wymaga przekształcenia bardziej niskopoziomowego rozbioru w podejściu morfoskładniowym z użyciem informacji o znaczeniu wzajemnych rzędników. Przekształcenie jest potrzebne, gdy bezpośredni podrzędnik węzła $n$ nie spełnia jego ograniczeń selekcyjnych, ale podrzędnik następnego rzędu (wnuczek $n$) je spełnia. Spełnianie ograniczeń selekcyjnych przez leksem polega na tym, że jego typ semantyczny jest podtypem jednego z typów wskazanych w ograniczeniach selekcyjnych. W takim przypadku podrzędnik pierwszego i drugiego rzędu są zamieniane miejscami w drzewie rozbioru.
Typowym przykładem zadania, w którym opisana wyżej procedura jest nietrywialna, jest rozpoznanie, czy wystąpienie przyimka przewidzianego w ramie składniowej nadrzędnego czasownika jest realizacją tej ramy, jak ,,w głowie'', czy jest to przyimek semantyczny, jak w wyrażeniu ,,w samolocie'' w przykładzie:
\begin{equation}
\text{\textbf{W samolocie} wielu osobom kręci się \textbf{w głowie}.}
\end{equation}
W rozwijanej dla parsera \eniam{} odmianie podejścia semantycznego
o tym, czy bezpośrednim podrzędnikiem czasownika jest przyimek czy rzeczownik,
decyduje ostatecznie to, czy preferencje selekcyjne argumentu ramy uzgadniają się z typem semantycznym rzeczownika czy frazy przyimkowej.
Podobny problem dotyczy liczebników i rzeczowników w użyciu pojemnikowym (patrz sekcja \ref{pojemniki})
\subsection{Zależność roli tematycznej od znaczenia rzędników}
Podrzędniki dzielimy na argumenty i modyfikatory rozumiane semantycznie. Rola tematyczna podrzędnika zależy za każdym razem od
jego typu zależności składniowej, a ponadto
\begin{itemize}
\item w przypadku argumentu -- od znaczenia nadrzędnika.
Przykładowo, odniesienie podmiotu czasownika \emph{czuć} to \experiencer{} zdarzenia, czasownika \emph{myśleć} -- to \agent{} zdarzenia, a jego dopełnienia -- to \theme{} zdarzenia.
\item w przypadku modyfikatora -- od jego znaczenia (podrzędnika).
Przykładem jest modyfikator rzeczownikowy w narzędniku. Taki modyfikator może wprowadzać role \textsc{Instrument}, \textsc{Time} lub \textsc{Manner} w zależności od jego znaczenia:
\end{itemize}
\begin{equation}
\text{Naprawiła szafę \textbf{młotkiem}.}
\end{equation}
\begin{equation}
\text{Naprawiła szafę \textbf{wieczorem}.}
\end{equation}
\begin{equation}
\text{Naprawiła szafę \textbf{własnym sposobem}.}
\end{equation}
Oddzielnej uwagi wymagają też rzeczownikowe frazy wolne w celowniku,
przymiotniki, które mają rolę tematyczną inną niż \textsc{Attribute}
i przysłówki, które mają rolę tematyczną inną niż \textsc{Manner}.
\section{Nieintersektywność}
Modyfikatory nieintersektywne mają nielokalny wkład znaczeniowy. Przykładami modyfikatorów nieintersektywnych są
\begin{itemize}
\item ,,były''
\begin{equation}
\text{były prezydent}
\end{equation}
\item ,,fałszywy''
\begin{equation}
\text{fałszywy brylant}
\end{equation}
\item ,,co najmniej''
\begin{equation}
\text{co najmniej cztery dni}
\end{equation}
\end{itemize}
\emph{Były} i \emph{fałszywy} są funktorami, które tworzą wraz ze znaczeniem nadrzędnika pojęcie na tyle zmodyfikowane, że jego denotacja nie musi lub nie może mieścić się w przecięciu oryginalnych denotacji.
Funktor \emph{co najmniej} bierze za argument nazwę liczby bądź miary i zwraca nowe określenie liczby bądź miary, które nie jest zawężeniem określenia oryginalnego.
%TODO \subsection{Nieintersektywność II typu}
% Modyfikuje aspekt znaczenia swojego podrzędnika, generując obiekt innego typu semantycznego niż podrzędnik.
% To, jaki to jest aspekt, jest zdeterminowane znaczeniem funktora.
% \textcolor{red}{(Obie rzeczy są naturalnym zachowaniem nadrzędnika.)}
% Leksem funktora może mieć kilka znaczeń dotyczących różnych aspektów.
% Przykłady:
% \begin{itemize}
% \item przysłówek ,,ledwo'' w znaczeniu czasowym
% \begin{equation}
% \text{Słońce ledwo wzeszło}
% \end{equation}
% \begin{equation}
% \text{Ledwo zabrał się do pracy, zadzwonił telefon.}
% \end{equation}
% \emph{Ledwo} traktujemy tu jak funktor biorący zdarzenie i generujący czas chwilę po nim. W funkcji
% spójnika podrzędnego, czas ten określa czas zdarzenia ze zdania nadrzędnego, w funkcji przysłówka
% czas ten określa czas zdarzenia wynikającego z kontekstu, co można wyrazić jako pro-zdarzenie.
% \item spójnik ,,gdy''
% \begin{equation}
% \text{Wszedł, gdy go wpuścili.}
% \end{equation}
% \emph{Gdy} bierze sytuację (zdarzenie) i generuje jej czas.
% \item przyimek ,,pod''
% \begin{equation}
% \text{pod stołem}
% \end{equation}
% Funktor biorący obiekt i zwracający miejsce oraz wskazujący, że jest to miejce, gdzie znajduje się referent nadrzędnika.
% \begin{equation}
% \text{pod stół}
% \end{equation}
% Funktor biorący obiekt i zwracający miejsce oraz wskazujący, że jest to miejce, do którego zmierza się referent nadrzędnika.
% \item ponieważ
% \begin{equation}
% \text{Pada, ponieważ spadło ciśnienie}
% \end{equation}
% Funktor biorący sytuację i generujący obiekt o typie semantycznym \textsf{CZEMU}.
% \end{itemize}
\section{Relacyjność}
{
\renewcommand\thesection{}
\renewcommand\thesubsection{}
\setcounter{subsection}{-1}
\subsection{Opis zjawiska} % (fold)
\label{sub:opis_zjawiska1}
}
Przez relacyjność modyfikatora rozumiemy tradycyjnie tę jego cechę, że jego znaczenie zależy w pewnym ustalonym zakresie od znaczenia jego nadrzędnika. Dogodnym sposobem jej reprezentowania jest relacyjny argument niejawny (punkt \ref{relac} na liście niejawnych argumentów w części \ref{niejawne}).
\begin{itemize}
\item ,,ledwo'' w znaczeniu `prawie nie'
\begin{equation}
\text{Ledwo zdał egzamin}.
\end{equation}
%TODO \textcolor{red}{Mamy tu funktor który modyfikuje pojęcie będące jego składniowym nadrzędnikiem (analogicznie jak leksem ,,były'').}
Funktor \emph{ledwo} ma domyślny argument -- referencyjny porządek, zależny od nadrzędnika.
\item niedużo
\begin{equation}
\text{niedużo mleka}
\end{equation}
\item dużo
\begin{equation}
\text{dużo złota}
\end{equation}
Te typowe przykłady przymiotników relacyjnych mają znaczenie jednoznacznie dodeterminowane znaczeniem nadrzędnika.
,,Dużo złota'' to inna ilość niż ,,dużo węgla''.
\item już
\begin{equation}
\text{już za daleko}
\end{equation}
\item jeszcze
\begin{equation}
\text{jeszcze we wtorek}
\end{equation}
\item aż
\begin{equation}
\text{aż cztery}
\end{equation}
Te funktory mają domyśny argument wskazujący skalę jako czasową, przestrzenną itp. ale niedostarczony przez sam nadrzędnik.
Nadrzędnik ogranicza ich znaczenie, niekoniecznie je determinując.
%TODO \color{red}{(Ew. skala jest jednoznacznie przypisana do znaczenia leksemu
% a ich wielość wynika z wielości znaczeń leksemu)
% }
\end{itemize}
\section{Przyrematyczność}
{
\renewcommand\thesection{}
\renewcommand\thesubsection{}
\setcounter{subsection}{-1}
\subsection{Opis zjawiska} % (fold)
\label{sub:opis_zjawiska2}
}
Przyrematyczne są te partykuły, które obejmują swoim zakresem zawsze remat zdania, choć może to być niewidoczne na poziomie morfoskładni i szyku, często swobodnego.
\begin{itemize}
\item chyba
\begin{equation}
\text{\textbf{Oslo} jest chyba stolicą Norwegii.}
\end{equation}
\begin{equation}
\text{Oslo jest chyba stolicą \textbf{Norwegii}.}
\end{equation}
\item także
\begin{equation}
\text{Pójdziemy także do kina.}
\end{equation}
\item również
\begin{equation}
\text{Pojedziemy również do Stanów.}
\end{equation}
\item też
\begin{equation}
\text{Polecimy też do Berlina.}
\end{equation}
\item nawet
\begin{equation}
\text{Popłyniemy nawet do Oslo.}
\end{equation}
\end{itemize}
\section{Operatory nieprawdomówne (\emph{nonveridical})}
{
\renewcommand\thesection{}
\renewcommand\thesubsection{}
\setcounter{subsection}{-1}
\subsection{Opis zjawiska} % (fold)
\label{sub:opis_zjawiska3}
}
Szereg wyrażeń języka można definiować jako funktory od argumentów zdaniowych, w tym przysłówki, partykuły i czasowniki przyjmujące dopełnienie zdaniowe. Kluczowym podziałem przy reprezentowaniu ich znaczenia jest to, czy prawdziwość frazy pociąga prawdziwość argumentu (\emph{veridicality}) czy nie (\emph{nonveridicality}).
Przykładem jest większość partykuł i wyrażeń przyimkowych wyrażających modalność epistemiczną, jak
\begin{itemize}
\item ,,chyba''
\begin{equation}
\text{Chyba idzie zima.}
\end{equation}
\item ,,pewnie''
\begin{equation}
\text{Pewnie spadnie śnieg.}
\end{equation}
\item ,,może''
\begin{equation}
\text{Może będzie przymrozek.}
\end{equation}
\item ,,być może''
\begin{equation}
\text{Być może spadnie grad.}
\end{equation}
%TODO \item \textcolor{red}{,,na pewno''}
% \begin{equation}
% \text{\textcolor{red}{Na pewno spadnie grad.}}
% \end{equation}
% \item \textcolor{red}{,,oczywiście ''}
% \begin{equation}
% \text{\textcolor{red}{Spadnie oczywiście grad.}}
% \end{equation}
\item ,,prawdopodobnie''
\begin{equation}
\text{Prawdopodobnie będzie ślisko.}
\end{equation}
\end{itemize}
które stanowią ocenę stopnia uzasadnienia sądu. \emph{Prawdopodobnie} może też być partykułą modalną aletyczną wyrażającą możliwość i w tym znaczeniu też jest operatorem nieprawdomównym.
Tryb rozkazujący także jest nieprawdomówny, choć zależy to dodatkowo od znaczenia czasownika: Ze zdania ,,Podaj mi sól'' wynika pragmatycznie, że teraz odbiorca nie podaje soli, ale ze zdania ,,Bądź punktualny'' nie wynika, że odbiorca punktualny nie jest.
\subsection{Niefaktywność} % (fold)
Najlepiej znanym podtypem nieprawdomówności jest niefaktywność, tradycyjnie przypisywana leksemom czasownikowym. W naszej analizie faktywność i niefaktywność przysługuje pozycji w ramie walencyjnej, co uwzględnia odmienne zachowanie podrzędników tego samego leksemu wprowadzanych przez różne spójniki podrzędne.
\begin{itemize}
\item ,,roić sobie, że\_''
\begin{equation}
\text{Anna roi sobie, że pada.}
\end{equation}
\item ,,chcieć, żeby\_''
\begin{equation}
\text{Anna chce, żeby nie padało.}
\end{equation}
\end{itemize}
Oddzielnej analizy wymaga prawdomówność spójników leksykalnych i faktywność pozycji wypełnionych przez frazy czasownikowe niefinitywne -- bezokolicznikowe, imiesłowowe, odsłownikowe, bezosobnikowe, którym nie przysługuje np. czas gramatyczny.
% subsection faktywność (end)
\section{Cechy składniowo-semantyczne jednostek nieopisanych w zasobach} % (fold)
{
\renewcommand\thesection{}
\renewcommand\thesubsection{}
\setcounter{subsection}{-1}
\subsection{Opis problemu} % (fold)
\label{sub:opis_problemu}
}
% subsection opis_problemu (end)
Słownik \emph{Walenty}, który jest podstawowym źródłem sformalizowanej informacji o cechach składniowo-semantycznych jednostek współczesnego języka polskiego, nie obejmuje niektórych klas gramatycznych lub obejmuje je w niedostatecznym stopniu.
Według wstępnego rozeznania wiele z brakujących leksemów rzeczownikowych, przymiotnikowych, przysłówkowych i przyimkowych wnosi wkład znaczeniowy lokalnie, a więc w sposób najbardziej podstawowy. Niezbędny jest jednak ich opis składniowo-semantyczny pozwalający przypisać im odpowiednią rolę tematyczną.
Dalsze potrzeby zasobowe obejmują typ semantyczny leksemów nieopisanych w Słowosieci.
\subsection{Lista cech składniowo-semantycznych} % (fold)
\label{sub:cechy_ala_Walenty}
% subsection cechy_ala_Walenty (end)
Docelowy opis cech składniowo-semantycznych obejmuje następujące cechy:
\begin{enumerate}
\item Rola tematyczna łącząca wyraz z nadrzędnikiem, jeśli leksem podrzędnika ma ją do siebie przypisaną oraz jest uogólnienie intersektywny
\item Struktura składniowa argumentów leksemu (rama składniowa), np. dla przyimka będzie to
\begin{enumerate}
\item Liczba argumentów jawnych przyimka (por. \emph{między\_a}, \emph{między\_i})
\item Okalającość przyimka (por. \emph{między\_a})
\item Pozycyjność przyimka (por. postpozycyjne \emph{(100 lat) temu})
\item Przypadek wymagany przez przyimek
\end{enumerate}
\item Preferencje selekcyjne i role tematyczne argumentów intersektywnych w sposób uogólniony
\item Typ semantyczny leksemu, jeśli leksem nie występuje w Słowosieci. Dla przyimków i spójników podrzędnych jest to typ semantyczny frazy, których są elementem głównym.
\end{enumerate}
\section{Oznaczanie miary i liczebności referenta} % (fold)
{
\renewcommand\thesection{}
\renewcommand\thesubsection{}
\setcounter{subsection}{-1}
\subsection{Opis zjawiska} % (fold)
\label{sub:opis_zjawiska4}
}
% subsection opis_zjawiska (end)
Szczególnej uwagi wymagają wyrażenia, których typem semantycznym jest \textsf{ILOŚĆ} dla wyrażeń policzalnych lub \textsf{MIARA} dla wyrażeń niepoliczalnych. Ich rolą tematyczną jest odpowiednio \textsc{count} lub \textsc{measure}.
\subsection{Użycie pojemnikowe} % (fold)
\label{pojemniki}
Użycie pojemnikowe rzeczownika to takie, w którym rzeczownik odnosi do miary referenta swojego podrzędnika rzeczownikowego w dopełniaczu w morfoskładniowym (niesemantycznym) podejściu do składni. Przykładem jest ,,łyżka'' w wyrażeniu ,,łyżka cukru''.
Żeby otrzymać rozkład zdania zawierającego rzeczowniki w użyciach pojemnikowych w składni semantycznej, jak Universal Dependencies, traktujemy pojemniki jak podrzędniki swoich tradycyjnych składniowych nadrzędników. Do tego celu niezbędne jest oznaczenie pojemników w języku polskim.
% subsubsection pojemniki (end)
\subsection{Podział liczebników ze względu na dokładność} % (fold)
Liczebniki niewłaściwe (\emph{trochę}, \emph{sporo}) i większość rzeczowników w użyciu oznaczającym miarę nie podaje dokładnej wartości wielkości, którą opisuje. Żeby reprezentować ich znaczenia, trzeba je podzielić ze względu na dokładność, opisać zakres niedokładności i zaproponować spójną koncepcję reprezentacji znaczeń niedokładnych.
% subsubsection podział_liczebników_ze_względu_na_dokładność (end)
\subsection{Miara referentów niepoliczalnych} % (fold)
Do zdefiniowania, które leksemy wprowadzają w języku polskim relację \textsc{Measure} (np. \emph{niedużo}), konieczne jest ich oznaczenie w zasobie typu słownikowego.
% subsubsection miara_referentów_niepoliczalnych (end)
\section{Niedenotatywne funkcje języka} % (fold)
{
\renewcommand\thesection{}
\renewcommand\thesubsection{}
\setcounter{subsection}{-1}
\subsection{Opis zjawiska} % (fold)
\label{sub:opis_zjawiska2}
}
% subsection opis_zjawiska (end)
% Pierwotna nazwa podrozdziału: Metatekstowość
Szczególnej uwagi wymagają wszystkie leksemy i konstrukcje pełniące funkcję fatyczną (\emph{halo}), konatywną (np. tryb rozkazujący), emotywną (np. ekspresywizmy) lub metatekstową (np. \emph{że tak powiem}).
Do opisu ostatniej należą złożone zagadnienia znaczenia spójników, wyrażeń przyrematycznych i przytematycznych.
Przykłady wyrażeń pełniących pierwotnie funkcję niedenotatywną:
\begin{itemize}
\item ,,halo''
\item ,,brawo''
\item ,,brr''
\item ,,miau''
\item ,,że tak powiem''
\end{itemize}
\subsection{Metatekstowość}
Wyrażenia metatekstowe, przede wszystkim partykuły i spójniki, odnoszą do fragmentu wypowiedzenia lub wyrażają komentarz na jego temat. Przykładem jest
\begin{itemize}
\item ,,więc''
\begin{equation}
\text{Padało, więc wyszliśmy tańczyć.}
\end{equation}
\end{itemize}
Spójnik \emph{więc} informuje, że zachodzi związek quasi-przyczynowy między odniesieniami koordynowanych członów.
\section{Podmiot epistemiczny}
Niektóre wyrażenia i kategorie gramatyczne odnoszą do stanów mentalnych osoby niekoniecznie tożsamej z nadawcą. Należą tu
\begin{itemize}
\item partykuły modalne
\begin{itemize}
\item ,,chyba''
\begin{equation}
\text{Piotr mówi, że chyba skończyli już układać.}
\end{equation}
\item ,,pewnie''
\begin{equation}
\text{Piotr mówi, że pewnie skończyli już układać.}
\end{equation}
W obu przykładach osoba referencyjna potwierdziłaby modyfikowany sąd, gdyby wiedziała, że pewna brakująca przesłanka jest prawdziwa, ale osoba tą nie jest nadawca zdania.
\end{itemize}
\item partykuły miriatywne
\begin{itemize}
\item ,,nawet''
\begin{equation}
\text{Anna narzekała, że nie przyszedł nawet przywitać się z rodzeństwem.}
\end{equation}
Modyfikowany sąd dziwi podmiot epistemiczny, który ponownie nie musi być tożsamy z nadawcą.
\end{itemize}
\item tryb rozkazujący, ponieważ wskazuje na intencje nadawcy
\item spójniki przeciwstawne i wprowadzające okoliczniki przyzwolenia
\begin{itemize}
\item ,,chociaż''
\begin{equation}
\text{Maria powiedziała, że wyszli tańczyć, chociać padał deszcz.}
\end{equation}
\item ,,ale''
\begin{equation}
\text{Maria powiedziała, że padał deszcz, ale oni tańczyli.}
\end{equation}
\item ,,a''
\begin{equation}
\text{Maria powiedziała, że padał deszcz, a oni tańczyli.}
\end{equation}
\end{itemize}
\end{itemize}
\end{document}