Commit d99b8f2939c6c24c91b39939ea70d388c5efe089
1 parent
16ab7479
poprawki w modelu
Showing
2 changed files
with
4 additions
and
4 deletions
morphology/doc/model.pdf
No preview for this file type
morphology/doc/model.tex
... | ... | @@ -17,7 +17,7 @@ |
17 | 17 | \newcommand{\fsuf}{{\it fsuf}} |
18 | 18 | \newcommand{\lsuf}{{\it lsuf}} |
19 | 19 | |
20 | -\title{Model probabilistyczny guessera dla języka polskiego} | |
20 | +\title{Model probabilistyczny fleksji języka polskiego} | |
21 | 21 | \author{Wojciech Jaworski} |
22 | 22 | %\date{} |
23 | 23 | |
... | ... | @@ -59,13 +59,13 @@ Problem tu jest taki, że lista frekwencyjna jest zbyt mała by precyzyjnie okre |
59 | 59 | $P(\fsuf)$ jest prawdopodobieństwem tego, że do języka należy słowo o zadanym sufixie. |
60 | 60 | Można je oszacować za pomocą listy frekwencyjnej. |
61 | 61 | |
62 | -Zakładamy, że \interp jest niezależne od \lsuf, pod warunkiem określonego \cat | |
63 | -$P(\lsuf,\cat,\interp)=P(\lsuf,\cat)P(\interp|\lsuf,\cat)=P(\lsuf,\cat)P(\interp|\cat)$ | |
62 | +Zakładamy, że \interp{} jest niezależne od \lsuf, pod warunkiem określonego \cat | |
63 | +\[P(\lsuf,\cat,\interp)=P(\lsuf,\cat)P(\interp|\lsuf,\cat)=P(\lsuf,\cat)P(\interp|\cat)\] | |
64 | 64 | |
65 | 65 | $P(\lsuf,\cat)$ i $P(\interp|\cat)$ można oszacować na podstawie listy frekwencyjnej. |
66 | 66 | |
67 | 67 | $P(\fsuf|\lsuf,\cat,\interp)$ wynosi 0, gdy nie ma reguły postaci (\fsuf,\lsuf,\cat,\interp); |
68 | -1, gdy jest dokładnie jedna reguła z (\lsuf,\cat,\interp), a gdy jest ich więcej trzeba | |
68 | +1, gdy jest dokładnie jedna reguła z (\fsuf,\lsuf,\cat,\interp), a gdy jest ich więcej trzeba | |
69 | 69 | oszacować z listy frekwencyjnej. |
70 | 70 | |
71 | 71 | Pytanie 4: Czy powyższe przybliżenie jest poprawne, jak często jest więcej niż jedna reguła i ile wynoszą wówczas p-stwa? |
... | ... |