base_LU_kryteria_doboru.txt
1.43 KB
### JK: Jakie kryteria stosowałem przy przesiewaniu subst:
Zostawiałem:
- SYTUACJE
- rzeczowniki mające wiele wspólnego znaczeniowo z czasownikami, w szczególności odnoszące do sytuacji / stanów rzeczy, wprowadzające typowe dla czasownika role tematyczne, choćby modyfikatory czasu i miejsca
- NOŚNIKI TREŚCI PROPOZYCJONALNEJ
- nazwy komunikatów / bytów językowych / informacji przyjmujące podrzędniki "o", "że", "żeby"
- nazwy zjawisk podobnych do komunikacji, bo mających propozycjonalną treść, np. "wątpliwość(, że...)"
- MIARA, ILOŚĆ, LICZBA
- pojemniki i rzeczowniki miary, jak "wysokość", "powierzchnia", "długość", "cząstka", rzeczowniki implikujące kolejność lub porządek ("etap", "poprzednik")
- nazwy miar (niekonsekwentnie, bo przypomniały mi się w trakcie), np. "moment"
- UKRYTE ZMIENNE
- rzeczowniki okazjonalne, jak "dzisiaj"
- rzeczowniki z ważnymi ukrytymi zmiennymi, które często będą niewyrażone na powierzchni, jak "konkurencja", "reszta", "rodak"
- METAJĘZYK
- metatekstowe, jak "konieczność", "możliwość", "nieprawda"
- nazwy ważnych klas ontologicznych (typów obiektów) w naszej ontologii, jak "cecha", "miejsce", "rodzaj", ponieważ mogą koreferować z innymi częściami mowy odnoszącymi do obiektów tego typu, por. *"Był zielony i ta cecha rzucała się w oczy."*
Usuwałem:
- rzeczowniki o formie synkretycznej z gerundium, np. "włamanie"