przyimki5.txt
8.68 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
W FIZYCE KORZYSTA się z modeli, o których wiadomo, że nie opisują wszystkiegoi sąna nie kontrkpryzykłady. My robimy to samo z semanrtyką języka: Tworzymy model, który nie opisuje wszystkich zjawisk, jakie występują w języku, a w założeniu ma opisywać to, co powszechnie występuje w tekstach języka polskiego. Model ten ma dwa poziomy. Jeden znich wskazuje podział przyimków na sensy i przypiuje im role tematyczne oraz preferencje slelekcyjne. Drugi z nich stanowi uzasadnienie poprawności podziału w pierwszym poprzez formalne zdefiniowanie sensów przyimków w założonej "ontologii". Pierwszy poziom jest bardziej użytkowy a drugi podajemodel rzeczywistości.
[JK] ZADANIE:
- Napisać latexowy dokument zawierający treśćtego pliku.
- Ma być rozszerzeniem dzieła robionego w grudniu.
- Wprowadzić rozdziały. Ma powstać przewodnik jak anotować przyimki - wsensiezrobić obliczeniowąwersję słownika języka polskiego dla przyimków -- taki Walenty dla przyimków.
- Półformalnedefinicje i tabelki pozostają "na sucho"
- Z reszty staram się zrobić ładną narrację
- Uzupełnij tekstoew.informacjez plikówprzyimki1.txt-4.txt , których brakuje w tym.
Zgodnie z założeniami z Clarin 1 mamy algorytm znaczeniowy i odniesienie.
Odniesieniami przyimków są relacje, np. jedna z możliwych relacji dla przyimka "blisko" jest zdefiniowana jako
blisko={(X,Y):dist(X,Y) <= e}, gdzie e=0.01 a dist jest to polimorficza metryką zdefiniowana jako: w przypadku, gdy:
- X i Y są punktami w przestrzeni liniowej jest to metryka Euklidesowa,
- X i Y są podzbiorami przestrzeni liniowej jest to metryka Hausdorffa nad metryką Euklidesową.
- X i Y parametryzowane przez czas dist(X,Y) = sup_t dist(X(t),Y(t))
W szczególności, gdy X i Y są liczbami dist(X,Y) = |X - Y|,
a gdy X i Y są interwałami dist(X,Y) = max{sup{inf{|x-y|:y \in Y}:x \in X},sup{inf{|x-y|:x \in X}:y \in Y} = max{|X.beg-Y.beg|,|X.end-Y.end|}
Algorytm znaczeniowy "blisko" zwraca true wtw. kiedy badane odniesienie R jest relacją definiowalną w postaci
R={(X,Y):dist(X,Y) <= e}, gdzie dist jest metryką, a e liczbą rzeczywistą większą od 0.
Przez B oznaczymy referencję podrzędnika przyimka.
Przez P oznaczymy referencję wyrażenia przyimkowego przestrzennego.
Przez R oznaczymy odniesienie przyimka.
Przez A oznaczymy referencję nadrzędnika wyrażenia przyimkowego.
W przypadku określeń czasu nadrzędnikiem przyimka jest zazwyczaj nazwa zdarzenia lub stanu.
W przypadku określeń czasu podrzędnikiem przyimka jest zazwyczaj nazwa przedziału czasowego albo nazwa zdarzenia.
Referencjami nazw przedziałów czasowych są interwały.
Referencjami nazw zdarzeń są zdarzenia.
Referencjami określeń wyrażeń przyimkowych będących określeniami czasu są interwały.
Przez .beg będziemy oznaczać początek interwału, przez .end koniec, a przez .len długość.
Przez .time będziemy oznaczać czas zdarzenia/stanu, przez .loc będziemy oznaczać parametryzowane przez czas miejsce zdarzenia/stanu/przedmiotu.
Role tematyczne definiujemy jako trójargumentowe relacje, których pierwszym argumentem jest odniesienie nadrzędnika przyimka, drugim jest odniesienie przyimka a trzecim odniesienie podrzędnika przyimka.
Loc(A,R,B) = exists P: forall t in A: A.loc(t) subset P(t) && R(P,B.loc)=1
LocGoal(A,R,B) = exists P: A(A.end) subset P(A.end) && not A(A.beg) subset P(A.beg) && R(P,B.loc)=1
LocSrc(A,R,B) = exists P: A(A.beg) subset P(A.beg) && not A(A.end) subset P(A.end) && R(P,B.loc)=1
Time(A,R,B) <==> R(A.time,B)=1
Time(A,R,B) <==> R(A.time,B.time)=1
Count(A,R,B) <==> R(A.count,B)=1
Order(A,R,B) <==> exists P: porządek indukowany przez algorytmy znaczeniowe A i B && R(A,B)=1
#Order(A,R,B) <==> exists P: A.order=porządek indukowany przez P && R(A,B)=1
Cond(A,R,B) <==> ustaw greater na zależności przyczynowo skutkowe && R(A,B)=1
Np. dla zdania "Strzał padł koło południa." mamy type(A,paść), type(R,koło_1), type(B,południe) oraz wiążącą je rolę tematyczną Time(A,R,B).
Zadanie opisania semantyki przyimków sprowadza się teraz do wskazania ich
- lemat i schemat składniowy,
- preferencje selekcyjne nałożone na nadrzędnik,
- preferencje selekcyjne nałożone na podrzędnik,
- rola tematyczna,
- sens przyimka - nazwa algorytmu znaczeniowego
- numer sensu z SJP
- przykład(y)
Przyjmujemy, że przyimki mogą mieć wiele sensów.
Oznaczamy je poprzez dodawanie do lematów przyimków kolejnych liczb naturalnych.
Sensy różnych przimków mogą być identyczne. Mają wtedy ten sam algorytm znaczeniowy.
Algorytme znaczeniowe przyimków te definiujemy tak, by były niezależne od ról tematycznych.
Oprócz tego potrzebujemy wskazać sensy identyczne oraz zdefiniować poszczególne algorytmy znaczeniowe.
koło_1=blisko_1=około_1=niedaleko_1=opodal_1=pod_2=obok_1
blisko_1(R)=true <==> R jest relacją definiowalną w postaci
R={(X,Y):dist(X,Y) <= e}, gdzie dist jest metryką, a e liczbą rzeczywistą większą od 0.
koło:gen ? CZAS Time koło_1 2 Koło szóstej już kasłała i miała gorączkę.
koło:gen ? CZAS Time koło_1 2 Strzał padł koło jedenastej minuty meczu.
koło:gen ? CZAS Time koło_1 2 Zadzwoniła koło szóstej.
koło:gen ? CZAS Time koło_1 2 Wyzdrowiała koło niedzieli.
około:gen ? CZAS Time około_1
blisko:gen ? PRZEDMIOT FIZYCZNY Loc blisko_1 a Mieszka blisko stacji metra.
koło:gen ? PRZEDMIOT FIZYCZNY Loc koło_1 1 Usiądź koło mnie.
niedaleko:gen ? PRZEDMIOT FIZYCZNY Loc niedaleko_1 Mieszkali niedaleko parku.
opodal:gen ? PRZEDMIOT FIZYCZNY Loc opodal_1 Konie pasły się opodal lasu.
pod:inst ? PRZEDMIOT FIZYCZNY Loc pod_2 3 Spotkajmy się pod pomnikiem.
obok:gen ? PRZEDMIOT FIZYCZNY Loc obok_1 1 Położył łyżkę obok talerza. Usiadła obok syna. (tu by się przydało dodać kierunek bliskości)
pod:acc ? PRZEDMIOT FIZYCZNY LocGoal pod_2 3 Idziemy pod pomnik.
koło:gen ? LICZBA Count koło_1 Ma koło pięciu lat.
blisko:gen ? ? ? blisko_1 Obracał się blisko prezesa
w_1=do_1=z_1=podczas_1
"subset"(X,Y) jest uogólnieniem zawierania zbiorów zdefiniowanym jako: w przypadku, gdy:
- X i Y są punktami w przestrzeni liniowej "subset"(X,Y) <==> X \subset otoczka_wypukła(Y)
- X i Y są parametryzowane przez czas "subset"(X,Y) <==> forall t: X(t) \subset otoczka_wypukła(Y(t))
[JK]: Dodaj słowną glosę do tej najważniejszej części powyżej (wszędzie)
w_1(R)=true <==> R jest definiowalne w postaci forall R{(X,Y): subset(X,Y)}
podczas:gen ? CZAS Time podczas_1
w:loc ? PRZEDMIOT FIZYCZNY Loc w_1 1 Kot śpi w szafie. Usiadł w fotelu.
w:acc ? PRZEDMIOT FIZYCZNY LocGoal w_1 2,4 Rankiem wyruszyli w góry. Piorun uderzył w stodołę.
do:gen ? PRZEDMIOT FIZYCZNY LocGoal do_1 3 Kot wszedł do szafy. Skoczył do wody.
z:gen ? PRZEDMIOT FIZYCZNY LocSrc z_1 1b Wyszedł z banku.
po:loc ? ZDARZENIE Time po_1 6 Po doktoracie podjęła pracę w liceum.
po:loc ? ZDARZENIE Time po_1 6 Po doktoracie wciąż pracowała w liceum.
po:loc ? CZAS Time po_1 6 Zdrzemnął się po piątej.
po:loc ? PRZEDMIOT FIZYCZNY Loc po_1 3 Kot chodził po biurku. Zimą dzieci ślizgały się po zamarzniętym jeziorze.
#od_1(R) <==> R jest definiowalne w postaci forall X,Y: R(X,Y)=1 wtw X jest polem wektorowym wychodzącym z przedmiotu Y
#od:gen ? ? LocSrc/Dir? od_1 1b Zimny wiatr wiał od morza.
#od:gen ? ? Order od_1 2 Ręczniki leżą na drugiej półce od dołu.
pod_1(R)=true <==> R jest definiowalne w postaci
{(X,Y)\in MIEJSCE x MIEJSCE : X.height < Y.height} - to trzeba opisać jako rzutowanie na pionowych osiach
cup {(X,Y)\in R x R: X < Y}
cup {(X,Y): lesser(X,Y)}, gdzie greater to zdefiniowany kontekstowo ostry porządek
jeśli X i Y są parametryzowane przez czas R={(X,Y): forall t: (X(t),Y(t)) in R}
[JK] Znajdź inny przyimek, w którym znaczenie liczbowe da się pokazać sensownie, a nie przez idiom "ma pod osiemdziesiątkę".
[JK] DOPOWIEDŹ WOJTKA: Kontekstzawiera symbole globalne, czyli widoczne dla każdej definicji i każdego algorytmu znaczeniowego. Wartościowania tych symboli są definiowane w trakcie przetwarzania wypowiedzi przez komputer.
pod:acc ? ? LocGoal pod_1 1,2 Woda wlewała się pod wannę. Dziecko schowało się pod kołdrę.
pod:acc ? ? Count pod_1 14 Ojciec miał już wtedy pod osiemdziesiątkę.
pod:inst ? ? Loc pod_1 1 Kot spał pod biurkiem.
pod:inst ? ? Order pod_1 16 Pod wiceministrem było pięciu dyrektorów departamentu.
pod:inst ? ? Cond pod_1 8,17 Drzwi otworzyły się pod naporem tłumu. Kazano mu opuścić lokal pod groźbą eksmisji.
[JK] Chodzi o "pod" oznaczające bycie przełożonym w pracy. Ta hierarchia jest dla nas ciekawa, bo nie jest dana eksplicytnie, a kontekstowo. Chcemy wprost zwrócić uwagę na ten mechanizm, że go stosujemy: Wyrocznia dostarcza typ porządku (zasadę porządkującą) - wtym przypadku skalę rang.