Commit d99b8f2939c6c24c91b39939ea70d388c5efe089

Authored by Wojciech Jaworski
1 parent 16ab7479

poprawki w modelu

morphology/doc/model.pdf
No preview for this file type
morphology/doc/model.tex
@@ -17,7 +17,7 @@ @@ -17,7 +17,7 @@
17 \newcommand{\fsuf}{{\it fsuf}} 17 \newcommand{\fsuf}{{\it fsuf}}
18 \newcommand{\lsuf}{{\it lsuf}} 18 \newcommand{\lsuf}{{\it lsuf}}
19 19
20 -\title{Model probabilistyczny guessera dla języka polskiego} 20 +\title{Model probabilistyczny fleksji języka polskiego}
21 \author{Wojciech Jaworski} 21 \author{Wojciech Jaworski}
22 %\date{} 22 %\date{}
23 23
@@ -59,13 +59,13 @@ Problem tu jest taki, że lista frekwencyjna jest zbyt mała by precyzyjnie okre @@ -59,13 +59,13 @@ Problem tu jest taki, że lista frekwencyjna jest zbyt mała by precyzyjnie okre
59 $P(\fsuf)$ jest prawdopodobieństwem tego, że do języka należy słowo o zadanym sufixie. 59 $P(\fsuf)$ jest prawdopodobieństwem tego, że do języka należy słowo o zadanym sufixie.
60 Można je oszacować za pomocą listy frekwencyjnej. 60 Można je oszacować za pomocą listy frekwencyjnej.
61 61
62 -Zakładamy, że \interp jest niezależne od \lsuf, pod warunkiem określonego \cat  
63 -$P(\lsuf,\cat,\interp)=P(\lsuf,\cat)P(\interp|\lsuf,\cat)=P(\lsuf,\cat)P(\interp|\cat)$ 62 +Zakładamy, że \interp{} jest niezależne od \lsuf, pod warunkiem określonego \cat
  63 +\[P(\lsuf,\cat,\interp)=P(\lsuf,\cat)P(\interp|\lsuf,\cat)=P(\lsuf,\cat)P(\interp|\cat)\]
64 64
65 $P(\lsuf,\cat)$ i $P(\interp|\cat)$ można oszacować na podstawie listy frekwencyjnej. 65 $P(\lsuf,\cat)$ i $P(\interp|\cat)$ można oszacować na podstawie listy frekwencyjnej.
66 66
67 $P(\fsuf|\lsuf,\cat,\interp)$ wynosi 0, gdy nie ma reguły postaci (\fsuf,\lsuf,\cat,\interp); 67 $P(\fsuf|\lsuf,\cat,\interp)$ wynosi 0, gdy nie ma reguły postaci (\fsuf,\lsuf,\cat,\interp);
68 -1, gdy jest dokładnie jedna reguła z (\lsuf,\cat,\interp), a gdy jest ich więcej trzeba 68 +1, gdy jest dokładnie jedna reguła z (\fsuf,\lsuf,\cat,\interp), a gdy jest ich więcej trzeba
69 oszacować z listy frekwencyjnej. 69 oszacować z listy frekwencyjnej.
70 70
71 Pytanie 4: Czy powyższe przybliżenie jest poprawne, jak często jest więcej niż jedna reguła i ile wynoszą wówczas p-stwa? 71 Pytanie 4: Czy powyższe przybliżenie jest poprawne, jak często jest więcej niż jedna reguła i ile wynoszą wówczas p-stwa?