diff --git a/LCGlexicon/ENIAM_LCGlexicon.ml b/LCGlexicon/ENIAM_LCGlexicon.ml index 9681ca4..3dd0f0f 100644 --- a/LCGlexicon/ENIAM_LCGlexicon.ml +++ b/LCGlexicon/ENIAM_LCGlexicon.ml @@ -152,59 +152,6 @@ let make_quantification e rules = let syntax = if bracket then ENIAM_LCGtypes.Bracket(true,true,syntax) else ENIAM_LCGtypes.Bracket(false,false,syntax) in cats,syntax,semantics) -(* let translate_negation = function - (Negation:negation) -> ["neg"] - | Aff -> ["aff"] - | NegationUndef -> ["aff";"neg"] - | NegationNA -> [] - - let translate_aspect = function - (Aspect s:aspect) -> [s] - | AspectUndef -> ["imperf";"perf"] - | AspectNA -> [] - - let translate_case = function - (Case s:case) -> [s] - | CaseUndef -> all_cases - | _ -> failwith "translate_case" - - let translate_nsem = function - Common s -> [s] - | Time -> ["time"] - - - let define_valence_selectors = function - DefaultAtrs(m,r,o,neg,p,a) -> failwith "apply_valence_selectors" - | EmptyAtrs m -> [] - | NounAtrs(m,nsyn,nsem) -> [Nsyn,Eq,[nsyn];Nsem,Eq,translate_nsem nsem] - | AdjAtrs(m,c,adjsyn(*,adjsem,typ*)) -> [Case,Eq,translate_case c] - | PersAtrs(m,le,neg,mo,t,au,a) -> [Negation,Eq,translate_negation neg;Mood,Eq,[mo];Tense,Eq,[t];Aspect,Eq,translate_aspect a] - | GerAtrs(m,le,neg,a) -> [Negation,Eq,translate_negation neg;Aspect,Eq,translate_aspect a] - | NonPersAtrs(m,le,role,role_attr,neg,a) -> [Negation,Eq,translate_negation neg;Aspect,Eq,translate_aspect a] - | ComprepAtrs _ -> failwith "apply_valence_selectors" *) - -(* FIXME: argumenty X *) - -(* let render_schema schema = - Xlist.map schema (function - {morfs=[Multi args]} as s -> LCGrenderer.dir_of_dir s.dir, Maybe(Plus(Xlist.map args LCGrenderer.make_arg_phrase)) - | s -> LCGrenderer.dir_of_dir s.dir, Plus(Xlist.map s.morfs (LCGrenderer.make_arg []))) *) - -(* let assign_valence valence rules = - Xlist.fold rules [] (fun l (cats,(bracket,quant,syntax,semantics),weight) -> - Printf.printf "%s |valence|=%d\n" cats.lemma (Xlist.size valence); - if LCGrenderer.count_avar "schema" syntax > 0 then - Xlist.fold valence l (fun l -> function - Frame(attr,schema) -> - (try - let selectors = define_valence_selectors attr in - let cats = apply_selectors cats selectors in - (cats,(bracket,quant,substitute_schema "schema" (render_schema schema) syntax,semantics),weight) :: l - with Not_found -> l) - | _ -> l) - else (cats,(bracket,quant,syntax,semantics),weight) :: l) *) - -(* FIXME: problem z atrybutami przy zamianie kolejności rzędników *) let make_node id orth lemma pos syntax weight cat_list is_raised = let attrs = Xlist.fold cat_list [] (fun attrs -> function | Lemma -> attrs @@ -260,7 +207,6 @@ let make_term id orth rules = let semantics = ENIAM_LCGrenderer.make_raised_term node outer_node syntax in ENIAM_LCGrenderer.simplify (syntax,semantics) | _ -> failwith "make_term: ni") -(*cats,bracket,quant,syntax,Dot*) let create_entries rules id orth cats valence = Xlist.fold cats [] (fun l cats -> @@ -278,26 +224,3 @@ let create_entries rules id orth cats valence = let rules = make_term id orth rules in (* print_endline "create_entries 5"; *) rules @ l) - (* -(* FIXME: poprawić i dodać moduł testujący *) -module OrderedIntInt = struct - type t = int * int - let compare = compare -end - -module IntIntSet = Xset.Make(OrderedIntInt) - - -let create (paths,last) tokens lex_sems = - (* uni_weight := 0.; *) - let chart = LCGchart.make last in - let chart = Xlist.fold paths chart (fun chart (id,lnode,rnode) -> - let token = ExtArray.get tokens id in - let lex_sem = ExtArray.get lex_sems id in - (* if t.weight < -0.9 || Xlist.mem t.attrs "notvalidated proper" || Xlist.mem t.attrs "lemmatized as lowercase" then chart else *) - let chart = LCGchart.add_inc chart lnode rnode (Tensor[Atom ("[" ^ token.ENIAMtokenizerTypes.orth ^ "]")], Dot) 0 in - LCGchart.add_inc_list chart lnode rnode (create_entries (*tokens lex_sems*) id (token:ENIAMtokenizerTypes.token_record) lex_sem (*false*)) 0) in - let set = Xlist.fold paths IntIntSet.empty (fun set (_,lnode,rnode) -> IntIntSet.add set (lnode,rnode)) in - let chart = IntIntSet.fold set chart (fun chart (i,j) -> LCGchart.make_unique chart i j) in - chart -*) diff --git a/LCGlexicon/ENIAM_LCGlexiconTypes.ml b/LCGlexicon/ENIAM_LCGlexiconTypes.ml index ee97a8f..886423f 100644 --- a/LCGlexicon/ENIAM_LCGlexiconTypes.ml +++ b/LCGlexicon/ENIAM_LCGlexiconTypes.ml @@ -77,21 +77,17 @@ let empty_cats = {lemma=""; pos=""; pos2=""; cat=[]; nsyn=[]; nsem=[]; } -let resource_path = - try Sys.getenv "ENIAM_RESOURCE_PATH" - with Not_found -> "/usr/share/eniam" - -(* FIXME: poprawić katalog *) -(*let subst_uncountable_lexemes_filename = resource_path ^ "/lexSemantics/subst_uncountable.dat" - let subst_uncountable_lexemes_filename2 = resource_path ^ "/lexSemantics/subst_uncountable_stare.dat" - let subst_container_lexemes_filename = resource_path ^ "/lexSemantics/subst_container.dat" - let subst_numeral_lexemes_filename = resource_path ^ "/lexSemantics/subst_numeral.dat" - let subst_time_lexemes_filename = resource_path ^ "/lexSemantics/subst_time.dat"*) -let subst_uncountable_lexemes_filename = resource_path ^ "/Walenty/subst_uncountable.dat" -let subst_uncountable_lexemes_filename2 = resource_path ^ "/Walenty/subst_uncountable_stare.dat" -let subst_container_lexemes_filename = resource_path ^ "/Walenty/subst_container.dat" -let subst_numeral_lexemes_filename = resource_path ^ "/Walenty/subst_numeral.dat" -let subst_time_lexemes_filename = resource_path ^ "/Walenty/subst_time.dat" - -let proper_names_filename = resource_path ^ "/lexSemantics/proper_names_sgjp_polimorf.tab" -let proper_names_filename2 = resource_path ^ "/lexSemantics/proper_names.tab" +let resource_path = ref + (try Sys.getenv "ENIAM_RESOURCE_PATH" + with Not_found -> "/usr/share/eniam") + +let rules_filename = ref (!resource_path ^ "/LCGlexicon//lexicon-pl.dic") + +let subst_uncountable_lexemes_filename = ref (!resource_path ^ "/LCGlexicon/subst_uncountable.dat") +let subst_uncountable_lexemes_filename2 = ref (!resource_path ^ "/LCGlexicon/subst_uncountable_stare.dat") +let subst_container_lexemes_filename = ref (!resource_path ^ "/LCGlexicon/subst_container.dat") +let subst_numeral_lexemes_filename = ref (!resource_path ^ "/LCGlexicon/subst_numeral.dat") +let subst_time_lexemes_filename = ref (!resource_path ^ "/LCGlexicon/subst_time.dat") + +(*let proper_names_filename = resource_path ^ "/lexSemantics/proper_names_sgjp_polimorf.tab" + let proper_names_filename2 = resource_path ^ "/lexSemantics/proper_names.tab"*) diff --git a/LCGlexicon/ENIAMcategoriesPL.ml b/LCGlexicon/ENIAMcategoriesPL.ml index 7268cba..1707fb8 100644 --- a/LCGlexicon/ENIAMcategoriesPL.ml +++ b/LCGlexicon/ENIAMcategoriesPL.ml @@ -73,11 +73,11 @@ let split_voc cases = "voc" -> cases, "voc" :: voc | s -> s :: cases, voc) -let subst_uncountable_lexemes = StringSet.of_list (File.load_lines subst_uncountable_lexemes_filename) -let subst_uncountable_lexemes2 = StringSet.of_list (File.load_lines subst_uncountable_lexemes_filename2) -let subst_container_lexemes = StringSet.of_list (File.load_lines subst_container_lexemes_filename) -let subst_numeral_lexemes = StringSet.of_list (File.load_lines subst_numeral_lexemes_filename) -let subst_time_lexemes = StringSet.of_list (File.load_lines subst_time_lexemes_filename) +let subst_uncountable_lexemes = StringSet.of_list (File.load_lines !subst_uncountable_lexemes_filename) +let subst_uncountable_lexemes2 = StringSet.of_list (File.load_lines !subst_uncountable_lexemes_filename2) +let subst_container_lexemes = StringSet.of_list (File.load_lines !subst_container_lexemes_filename) +let subst_numeral_lexemes = StringSet.of_list (File.load_lines !subst_numeral_lexemes_filename) +let subst_time_lexemes = StringSet.of_list (File.load_lines !subst_time_lexemes_filename) let subst_pronoun_lexemes = StringSet.of_list ["co"; "kto"; "cokolwiek"; "ktokolwiek"; "nic"; "nikt"; "coś"; "ktoś"; "to"] let adj_pronoun_lexemes = StringSet.of_list ["czyj"; "jaki"; "który"; "jakiś"; "ten"; "taki"] diff --git a/LCGlexicon/README b/LCGlexicon/README index aa4bc3f..1323c51 100644 --- a/LCGlexicon/README +++ b/LCGlexicon/README @@ -7,7 +7,8 @@ Install ------- ENIAM_LCGlexicon requires OCaml version 4.02.3 compiler -together with Xlib library version 3.1 or later. +together with Xlib library version 3.2 or later +and ENIAM_LCGparser library version 1.0. In order to install type: @@ -20,6 +21,12 @@ In order to test library type: make test ./test +In order to print lexicon as pdf file type: +make print_lexicon +./print_lexicon + +Both test and print_lexicon require pdflatex installed. + By default ENIAM_LCGlexicon looks for resources in /usr/share/eniam directory. However this behaviour may be changed by setting end exporting ENIAM_RESOURCE_PATH environment variable. @@ -29,12 +36,6 @@ Credits Copyright © 2016 Wojciech Jaworski <wjaworski atSPAMfree mimuw dot edu dot pl> Copyright © 2016 Institute of Computer Science Polish Academy of Sciences -The library uses the following licensed resources: - -NKJP1M: the manually annotated 1-million word subcorpus sampled -from texts of a subset of the National Corpus of Polish. -version 1.2 - Licence ------- diff --git a/LCGlexicon/TODO b/LCGlexicon/TODO index 9c9d0fc..8cb0c72 100644 --- a/LCGlexicon/TODO +++ b/LCGlexicon/TODO @@ -1,5 +1,90 @@ -- unumber jako atrybut "Można było" - brakuje uzgodnienia rodzaju przymiotnika w przypadku predykatywnym, i ogólnie kontroli składniowej - dodać do wyświetlania leksykonu informacje o bracetach i semantyce + +- dodać wykrywanie nazw własnych albo i nie +- dodać generowanie adjunctów +- dodać parsowanie walencji + +- dodać informację o błędach + +(* let translate_negation = function + (Negation:negation) -> ["neg"] + | Aff -> ["aff"] + | NegationUndef -> ["aff";"neg"] + | NegationNA -> [] + + let translate_aspect = function + (Aspect s:aspect) -> [s] + | AspectUndef -> ["imperf";"perf"] + | AspectNA -> [] + + let translate_case = function + (Case s:case) -> [s] + | CaseUndef -> all_cases + | _ -> failwith "translate_case" + + let translate_nsem = function + Common s -> [s] + | Time -> ["time"] + + + let define_valence_selectors = function + DefaultAtrs(m,r,o,neg,p,a) -> failwith "apply_valence_selectors" + | EmptyAtrs m -> [] + | NounAtrs(m,nsyn,nsem) -> [Nsyn,Eq,[nsyn];Nsem,Eq,translate_nsem nsem] + | AdjAtrs(m,c,adjsyn(*,adjsem,typ*)) -> [Case,Eq,translate_case c] + | PersAtrs(m,le,neg,mo,t,au,a) -> [Negation,Eq,translate_negation neg;Mood,Eq,[mo];Tense,Eq,[t];Aspect,Eq,translate_aspect a] + | GerAtrs(m,le,neg,a) -> [Negation,Eq,translate_negation neg;Aspect,Eq,translate_aspect a] + | NonPersAtrs(m,le,role,role_attr,neg,a) -> [Negation,Eq,translate_negation neg;Aspect,Eq,translate_aspect a] + | ComprepAtrs _ -> failwith "apply_valence_selectors" *) + +(* FIXME: argumenty X *) + +(* let render_schema schema = + Xlist.map schema (function + {morfs=[Multi args]} as s -> LCGrenderer.dir_of_dir s.dir, Maybe(Plus(Xlist.map args LCGrenderer.make_arg_phrase)) + | s -> LCGrenderer.dir_of_dir s.dir, Plus(Xlist.map s.morfs (LCGrenderer.make_arg []))) *) + +(* let assign_valence valence rules = + Xlist.fold rules [] (fun l (cats,(bracket,quant,syntax,semantics),weight) -> + Printf.printf "%s |valence|=%d\n" cats.lemma (Xlist.size valence); + if LCGrenderer.count_avar "schema" syntax > 0 then + Xlist.fold valence l (fun l -> function + Frame(attr,schema) -> + (try + let selectors = define_valence_selectors attr in + let cats = apply_selectors cats selectors in + (cats,(bracket,quant,substitute_schema "schema" (render_schema schema) syntax,semantics),weight) :: l + with Not_found -> l) + | _ -> l) + else (cats,(bracket,quant,syntax,semantics),weight) :: l) *) + +(* FIXME: problem z atrybutami przy zamianie kolejności rzędników *) + + (* +(* FIXME: poprawić i dodać moduł testujący *) +module OrderedIntInt = struct + type t = int * int + let compare = compare +end + +module IntIntSet = Xset.Make(OrderedIntInt) + + +let create (paths,last) tokens lex_sems = + (* uni_weight := 0.; *) + let chart = LCGchart.make last in + let chart = Xlist.fold paths chart (fun chart (id,lnode,rnode) -> + let token = ExtArray.get tokens id in + let lex_sem = ExtArray.get lex_sems id in + (* if t.weight < -0.9 || Xlist.mem t.attrs "notvalidated proper" || Xlist.mem t.attrs "lemmatized as lowercase" then chart else *) + let chart = LCGchart.add_inc chart lnode rnode (Tensor[Atom ("[" ^ token.ENIAMtokenizerTypes.orth ^ "]")], Dot) 0 in + LCGchart.add_inc_list chart lnode rnode (create_entries (*tokens lex_sems*) id (token:ENIAMtokenizerTypes.token_record) lex_sem (*false*)) 0) in + let set = Xlist.fold paths IntIntSet.empty (fun set (_,lnode,rnode) -> IntIntSet.add set (lnode,rnode)) in + let chart = IntIntSet.fold set chart (fun chart (i,j) -> LCGchart.make_unique chart i j) in + chart +*) + +- usunąć QuotSem itp. diff --git a/LCGlexicon/eniam-lcg-lexicon-1.0.tar.bz2 b/LCGlexicon/eniam-lcg-lexicon-1.0.tar.bz2 new file mode 100644 index 0000000..5ed68b7 --- /dev/null +++ b/LCGlexicon/eniam-lcg-lexicon-1.0.tar.bz2 diff --git a/LCGlexicon/makefile b/LCGlexicon/makefile index be7501f..4d234f4 100755 --- a/LCGlexicon/makefile +++ b/LCGlexicon/makefile @@ -3,33 +3,35 @@ OCAMLOPT=ocamlopt OCAMLDEP=ocamldep INCLUDES=-I +xml-light -I +xlib -I +zip -I +bz2 -I +eniam OCAMLFLAGS=$(INCLUDES) -g -OCAMLOPTFLAGS=$(INCLUDES) unix.cmxa xml-light.cmxa str.cmxa nums.cmxa zip.cmxa bz2.cmxa xlib.cmxa eniam-lcg-parser.cmxa -#OCAMLOPTFLAGS=$(INCLUDES) unix.cmxa xml-light.cmxa str.cmxa nums.cmxa zip.cmxa bz2.cmxa xlib.cmxa eniam-lcg-parser.cmxa eniam-lcg-grammar-pl.cmxa +OCAMLOPTFLAGS=$(INCLUDES) unix.cmxa xml-light.cmxa str.cmxa nums.cmxa zip.cmxa bz2.cmxa xlib.cmxa eniam-lcg-parser.cmxa eniam-lcg-lexicon.cmxa INSTALLDIR=`ocamlc -where`/eniam SOURCES= ENIAM_LCGlexiconTypes.ml ENIAMcategoriesPL.ml ENIAM_LCGlexiconParser.ml ENIAM_LCGlexicon.ml -all: eniam-lcg-grammar-pl.cma eniam-lcg-grammar-pl.cmxa +all: eniam-lcg-lexicon.cma eniam-lcg-lexicon.cmxa install: all mkdir -p $(INSTALLDIR) - cp eniam-lcg-grammar-pl.cmxa eniam-lcg-grammar-pl.a eniam-lcg-grammar-pl.cma $(INSTALLDIR) + cp eniam-lcg-lexicon.cmxa eniam-lcg-lexicon.a eniam-lcg-lexicon.cma $(INSTALLDIR) cp ENIAM_LCGlexiconTypes.cmi ENIAMcategoriesPL.cmi ENIAM_LCGlexiconParser.cmi ENIAM_LCGlexicon.cmi $(INSTALLDIR) cp ENIAM_LCGlexiconTypes.cmx ENIAMcategoriesPL.cmx ENIAM_LCGlexiconParser.cmx ENIAM_LCGlexicon.cmx $(INSTALLDIR) + mkdir -p /usr/share/eniam/LCGlexicon + cp resources/* /usr/share/eniam/LCGlexicon -eniam-lcg-grammar-pl.cma: $(SOURCES) - ocamlc -linkall -a -o eniam-lcg-grammar-pl.cma $(OCAMLFLAGS) $^ -eniam-lcg-grammar-pl.cmxa: $(SOURCES) - ocamlopt -linkall -a -o eniam-lcg-grammar-pl.cmxa $(INCLUDES) $^ +eniam-lcg-lexicon.cma: $(SOURCES) + ocamlc -linkall -a -o eniam-lcg-lexicon.cma $(OCAMLFLAGS) $^ -test: test.ml $(SOURCES) +eniam-lcg-lexicon.cmxa: $(SOURCES) + ocamlopt -linkall -a -o eniam-lcg-lexicon.cmxa $(INCLUDES) $^ + +test: test.ml mkdir -p results - $(OCAMLOPT) -o test $(OCAMLOPTFLAGS) $(SOURCES) test.ml + $(OCAMLOPT) -o test $(OCAMLOPTFLAGS) test.ml -print_lexicon: ENIAM_LCGlexiconLatexOf.ml $(SOURCES) +print_lexicon: ENIAM_LCGlexiconLatexOf.ml mkdir -p results - $(OCAMLOPT) -o print_lexicon $(OCAMLOPTFLAGS) $(SOURCES) ENIAM_LCGlexiconLatexOf.ml + $(OCAMLOPT) -o print_lexicon $(OCAMLOPTFLAGS) ENIAM_LCGlexiconLatexOf.ml .SUFFIXES: .mll .mly .ml .mli .cmo .cmi .cmx diff --git a/LCGlexicon/resources/subst_container.dat b/LCGlexicon/resources/subst_container.dat new file mode 100644 index 0000000..0b84d89 --- /dev/null +++ b/LCGlexicon/resources/subst_container.dat @@ -0,0 +1,490 @@ +alfabet +ampułka +arkusz +armia +arsenał +atom +bagaż +bajt +bak +balia +balon +banda +bańka +basen +batalion +bateria +beczka +bela +bezlik +bezmiar +bidon +biliony +blacha +blok +bochen +bractwo +brulion +bryła +bryłka +bryt +buch +bukiet +bukłak +burza +butelka +całość +cech +centuria +centymetr +chlust +chmara +chmura +chochla +ciąg +cień +ciężarówka +ciżba +cysterna +czapa +czara +cząsteczka +cząstka +czereda +część +czołówka +ćma +ćwiartka +dawka +deszcz +dodatek +dostatek +dostawa +dzban +dziesiątki +egzemplarz +enklawa +fala +fałda +filiżanka +flota +folder +fontanna +forma +formuła +fragment +fura +furmanka +fury +galon +gałka +gama +gamy +garnek +garsteczka +garstka +garstka +garść +gąsior +gąszcz +gęstwa +głębia +główka +gniazdo +godzina +góra +grad +gram +granulki +gromada +gromadka +gruda +grudka +grupa +gryz +grządka +grzęda +gwar +hałastra +hałda +hałdy +haust +horda +hurma +ilość +iskierka +jednostka +kałuża +kanka +kapeczka +kapitał +kapka +kapsułka +karafka +karawana +karton +kaskada +kawalkada +kawał +kawałeczek +kawałek +kąseczek +kąsek +keg +kępa +kęs +kielich +kieliszeczek +kieliszek +kilogram +kilometr +kiść +klan +klasa +klisza +klomb +klub +klucz +kłąb +kłębek +kobierzec +kocioł +kohorta +kolba +kolejka +kolekcja +kolonia +komplet +konewka +konstelacja +kontener +kopa +kopczyk +kopiec +korowód +korzec +kostka +kosz +krata +krocie +kromka +kropelka +kropla +kruszyna +krzak +krzta +krztyna +krzyna +krzynka +księga +kubek +kufel +kula +kulka +kultura +kupa +kwarta +kwiat +lampka +las +laska +lawa +legion +legiony +liczba +liga +lista +litania +litr +loża +ładunek +łan +łańcuch +ławica +łopata +łyżeczka +łyżka +magazynek +masa +metr +mgiełka +miarka +miednica +mieszanka +miliardy +milion +miliony +minuta +miot +miriady +miska +mniejszość +moc +morga +morze +motek +naczynie +naparstek +naręcze +nawał +nawała +nić +nieskończoność +obfitość +obłok +obszar +ocean +ochłap +ociupina +ociupinka +odcinek +oddział +odrobina +odrobinka +ogrom +okaz +okres +okruch +okruszyna +opad +opakowanie +osiedle +otchłań +oznaki +paczka +pajda +pakiet +paleta +panteon +para +pas +pasmo +peleton +pęcherz +pęczek +pęk +pęto +piramida +plama +plaster +plejada +plik +plika +pliki +płat +po trochu +podmuch +pojemnik +pokłady +pole +połeć +połetek +połówka +porcja +powierzchnia +powódź +półlitrówka +promień +pryzma +przedział +przyczepa +przydział +przykład +przypadek +pudełko +pudło +pukiel +pułk +puszka +rąbek +regiment +roje +rok +rolka +rondel +rożek +rój +rulon +ryza +rząd +rządek +rzeka +sadzawka +sagan +salaterka +sektor +sekunda +setki +sfora +sieć +skarbiec +skiba +skopek +skraweczek +skrawek +skrzynka +słoik +słup +smuga +snopek +snopy +spłacheć +spodek +stadko +stado +stek +sterta +sterty +stopa +stos +stóg +strąk +strumień +suma +syfon +symfonia +sytuacja +szafa +szczapa +szczątek +szczątki +szczęty +szczypta +szereg +szklanka +szmat +sznur +sztaba +sztuka +szufla +tabliczka +tabun +tabuny +taca +taczka +tafla +talerz +talia +teczka +termos +tłok +tłum +tłumy +tom +tona +tony +toń +torebka +trocha +trupa +tryliony +tubka +tydzień +tygiel +tysiące +ulewa +ułamki +ułomek +wagon +walizka +warkocz +warstwa +wataha +waza +wiadro +wianek +wiązka +wieki +wielość +wieniec +większość +wodospad +woreczek +worek +wuchta +wypadek +wywrotka +zagon +zaspa +ząbek +zbiegowisko +zbiornik +zbiorowisko +zbiór +zbytek +zdroje +zespół +zestaw +zgraja +zgrzewka +ziarnko +ziarno +zwitek +ździebko +źdźbło +arsenały +centary +chyrba +do chuja +do diaska +eskadry +furę +garstkę +gwałt +halajstra +halasteria +hujma +hurba +hyrba +jele +karwasz +kawalec +kawałczak +koszty +krapka +krzyneczka +kubły +malunio +malusienieczko +malutenieczko +millennium +nacisk +nawałność +niesiła +ociep +ociepka +od choinki +od choroby +od kija +opór +państwa +parada +po brzegi +prószynka +roisko +siłę +siłu +skarwasisko +szczypka +szmatek +szpłacheć +szpulka +sztuk +trzoda +w pinechę +wuchte +zwój +akt +asortyment +atlas +ciut +dziesiątka +dźwięk +epoka +kształt +manipuła +mnóstwo +mrowie +rodzaj +rozdział +gmach diff --git a/LCGlexicon/resources/subst_numeral.dat b/LCGlexicon/resources/subst_numeral.dat new file mode 100644 index 0000000..c123767 --- /dev/null +++ b/LCGlexicon/resources/subst_numeral.dat @@ -0,0 +1,150 @@ +część +ile +ile bądź +ilekolwiek +ileś +kilka +kilkadziesiąt +kilkanaście +kilkaset +n +naście +niewiele +parę +parędziesiąt +paręnaście +paręset +paru +sto +wiele +wieleset +x +y +bez liku +bez miary +bezlik +ciut +ciut ciut +co nieco +co niemiara +do cholery +do czorta +do diabła +do licha +dosyć +dość +dużo +dziesiątki +ful +full +gro +gros +huk +kawał +kilogram +krzynę +kupa +kupę +malusieńko +malusio +maluśko +maluteńko +malutko +mało +masę +miesiąc +miliard +milion +miliony +miriady +mnóstwo +moc +mrowie +multum +na pęczki +nadto +ni hu hu +nieco +niedużo +niemało +nieskończoność +od cholerki +od cholery +od chuja +od czorta +od diabła +od diaska +od groma +od licha +od pierona +od pyty +od pyty +od skurwysyna +od zajebania +od zarąbania +od zarypania +od zatrzęsienia +od zbója +odrobinę +odrobinkę +ogrom +pełno +po chuju +po zbóju +pod dostatkiem +ponad miarę +ponad normę +pół +procent +przymało +setki +siła +skolko ugodno +sporo +szereg +tela +trocha +trochę +trochu +troszeczkę +troszeczku +troszeńkę +troszeńku +troszkę +troszku +trylion +tyci +tyci tyci +tyci-tyci +tyle +tyle samo +tylu +tysiąc +tysiące +w bród +w cholerę +w chuj +w ciul +w diabły +w huj +w huk +w pierony +w pizdę +w pizdu +w pytę +w trzy dupy +wiela +większość +wuchta +zanadto +zatrzęsienie +bogactwo +ciupeczkę +ciupeńkę +ciupkę +grono +kilo +ociupineczkę +ociupinę +ociupinkę +odrobineczkę diff --git a/LCGlexicon/resources/subst_time.dat b/LCGlexicon/resources/subst_time.dat new file mode 100644 index 0000000..65624ad --- /dev/null +++ b/LCGlexicon/resources/subst_time.dat @@ -0,0 +1,34 @@ +poniedziałek +wtorek +środa +czwartek +piątek +sobota +niedziela +styczeń +luty +marzec +kwiecień +maj +czerwiec +lipiec +sierpień +wrzesień +październik +listopad +grudzień +zima +jutro +pojutrze +wiek +rok +miesiąc +tydzień +godzina +dzień +czas +okres +moment +pora +przyszłość +rano \ No newline at end of file diff --git a/LCGlexicon/resources/subst_uncountable.dat b/LCGlexicon/resources/subst_uncountable.dat new file mode 100644 index 0000000..e03e248 --- /dev/null +++ b/LCGlexicon/resources/subst_uncountable.dat @@ -0,0 +1,1036 @@ +agar +agnostycyzm +akompaniament +aksamit +aktywizm +alkaloid +alkohol +alkoholizm +alt +ałun +amarant +aminokwas +amok +amoniak +anabolizm +anemon +animalizm +animusz +antyestetyzm +antyk +antykamerykanizm +antykomunizm +antysemityzm +apetyt +aplauz +argon +armaniak +arsen +arszenik +arytzm +ascetyzm +asfalt +asortyment +aspartam +ateizm +atrament +autentyzm +autorytaryzm +awans +azbest +azot +ażur +bagaż +bajzel +balet +bałagan +bambus +barbiturany +barok +bazalt +behawioryzm +bełkot +benzopiren +beryl +beszamel +beton +bezład +bezrząd +bezsens +bezwład +beż +big-beat +bigos +bilon +bimber +biogaz +biseksualizm +biznes +blask +blichtr +blues +błękit +błonnik +boczek +boks +ból +brak +brąz +brokat +brom +bruk +buddyzm +budulec +budżet +bursztyn +busz +butan +byt +cement +centralizm +cez +chaos +chleb +chlor +chlorofil +chłam +chłodnik +chłód +chmiel +cholesterol +chrom +chrust +cień +ciężar +comber +cukier +cyjanek +cynamon +cynizm +cynk +czad +czar +czas +cząber +czosnek +dech +deficyt +dekadentyzm +demontaż +denaturat +deszcz +detergent +dług +dobrobyt +dobytek +dochód +doping +dramatyzm +dreszcz +drób +druk +drybling +dualizm +dubbing +dwutlenek +dym +dymorfizm +dynamit +dysonans +dystans +dżem +dżin +dżins +ebonit +egocentryzm +egoizm +ekshibicjonizm +eksport +ekspresjonizm +ekumenizm +ekwipunek +entuzjazm +erotyzm +erzac +etanol +etatyzm +eternit +etos +etylen +fanatyzm +farsz +fart +faryzeizm +faszyzm +fechtunek +fenol +ferment +fiolet +fluid +fluor +fosfor +freon +fundamentalizm +funk +fuzel +galimatias +gaz +gips +glicerol +gluten +gniew +gnój +golf +gotyk +grad +granit +groch +grog +gruz +grys +gulasz +gwar +hałas +handel +haracz +hart +haszysz +hazard +hedonizm +hel +heroizm +hinduizm +hip-hop +holocaust +homoseksualizm +honor +huk +humanizm +humor +idealizm +impas +imperializm +impet +intelekt +interes +interwencjonalizm +intuicjonizm +iq +irracjonalizm +jad +jazgot +jazz +jęczmień +jod +jogurt +kadm +kajmak +kał +kamień +kapitalizm +kapitał +kapuśniak +kardamon +karoten +kaszel +katar +kawior +kefir +ketchup +kicz +kisiel +kit +klej +kler +kminek +kobalt +koktajl +kolagen +kolektywizm +koloid +komfort +kompot +komunizm +koncentrat +kondensat +konformizm +koniak +konkubinat +konsensus +konsumpcjonizm +kontakt +kortyzol +koszt +kraul +kreacjonizm +krem +krylen +krypton +krytycyzm +krzem +krzyk +ksylen +kult +kunszt +kurczak +kurz +kwarc +kwas +lakier +leasing +leninizm +lęg +lęk +liberalizm +lifting +liryzm +lit +los +lód +lukier +luksus +luminal +luz +łój +ług +magnez +mahoń +majątek +majeranek +majestat +majonez +makaron +makijaż +mangan +marketing +marmur +masochizm +materializm +materiał +mazut +mentol +mesjanizm +metabolizm +metal +metan +metanol +męt +miał +mimetyzm +miód +mistycyzm +mocz +modernizm +moher +monofiletyzm +monumentalizm +mord +mosiądz +mozół +mróz +muł +mus +nabiał +nacjonalizm +nadmiar +nadzór +namysł +napalm +napływ +napój +narcyzm +narkotyk +narybek +narzut +naskórek +nawóz +nazizm +negatywizm +negliż +nektar +neon +nepotyzm +niedobór +niedorozwój +niedosyt +nierząd +niesmak +nikiel +nonkonformizm +nonsens +obornik +obrok +odwet +offset +ogień +ogół +ogrom +olej +ołów +opad +opal +opał +oportunizm +opór +optymizm +oręż +osad +oset +ostrokrzew +owies +ozon +pacyfizm +papier +paracetamol +partykularyzm +pasztet +paternalizm +patos +patriotyzm +pech +pesymizm +pęczak +piach +pic +pieprz +plastik +plastyka +platyna +plazma +pleśń +pluralizm +pluton +płacz +płciowość +płótno +płynność +płytkość +pobłażliwość +pociecha +poczucie +podatek +podatność +podczerwień +poddaństwo +podejrzliwość +podłość +podmiotowość +podpucha +podpuszczka +podwójność +podziemie +podziw +poetyckość +poetyka +poetyzacja +poezja +pogaństwo +pogarda +pogłowie +pogoda +pogoń +pokarm +pokora +pokrycie +polar +policja +polio +polityka +polon +polot +polskość +południe +pomada +pomoc +pomysłowość +pomyślość +pomyślunek +poncz +poparcie +popcorn +popiół +popłoch +poprawność +popularyzacja +populizm +popyt +poradnictwo +porcelana +pornografia +portfolio +porządek +posłuch +posmak +pospólstwo +postęp +postmodernizm +pościel +pot +potas +potencjał +potęga +potomstwo +potworność +poufałość +poufność +powab +powaga +powierzchowność +powietrze +powściągliwość +pozerstwo +pożytek +pożytek +praca +pracowitość +pragmatyzm +praktycyzm +prasa +prawdopodobieństwo +prawość +prąd +precyzja +predyspozycja +premedytacja +prestiż +prężność +problematyczność +problematyka +proch +produkcja +profanacja +profesjonalizm +prolaktyna +prometeizm +propaganda +propan +proso +prostactwo +prostota +protekcjonizm +proza +próchnica +próżnia +próżność +pruderia +prymitywność +prywata +prywatność +prywatyzacja +przebojowość +przeciążenie +przeciętniactwo +przeciwwaga +przedsiębiorczość +przejrzystość +przekora +przekupstwo +przemoc +przemysł +przemyślność +przemyt +przenikliwość +przesada +przesył +przeszłość +prześwit +przetwórstwo +przewaga +przewrotność +przezorność +przezroczystość +przychód +przychylność +przypadkowość +przyroda +przyrodoznawstwo +przyrost +przyszłość +przytomność +pseudo +psychoanaliza +psychodelia +psychoterapia +pszenica +ptactwo +publicystyka +publiczność +puch +puder +punk +pustka +pycha +pył +pyszność +raban +rabarbar +racjonalizacja +racjonalizm +rad +radiofonia +radykalizm +rajgras +rano +rasizm +realizm +realność +reanimacja +reggae +reglamentacja +rejwach +rekolekcja +rekreacja +relaks +religianctwo +reminescencja +renacjonalizacja +repertuar +respekt +restrukturyzacja +reszta +retoryka +reżyseria +rękodzieło +robactwo +robota +rock +rola +rolnictwo +romatyzm +ropa +rosa +rosół +roślinność +rozbójstwo +rozdzielczość +rozgardiasz +rozgłos +rozmaitość +rozmaryn +rozpacz +rozpierducha +rozpusta +rozpuszczalnik +rozrzut +rozsądek +roztropność +roztwór +rozum +rozwaga +rozwlekłość +rozwój +równoległość +równość +równowaga +równoważność +róż +różnorodność +różność +rtęć +ruch +ruchomość +rum +rumor +rutyna +rycerstwo +ryk +rytmika +ryzykanctwo +ryzyko +ryż +rzadkość +rzeczowość +rzeczywistość +rzepak +rzetelność +sacharoza +sacrum +sadło +sadyzm +sadza +sadź +salami +saletra +salmonella +salsa +samodyscyplina +samodzielność +samokontrola +samoobrona +samopoczucie +samorządność +samotność +samowiedza +samozaparcie +sarkazm +satrapia +satysfakcja +scenografia +schab +schizofrenia +secesja +seks +seksapil +seksualność +seledyn +selekcja +selen +sen +sens +sentyment +ser +serdeczność +serotonina +serwatka +serwilizm +siano +siara +siarczan +siarka +siatkówka +sieczka +siekanina +sierść +siku +silikon +skała +sknerstwo +skrobia +skromność +skrucha +skrupulatność +skuteczność +słabizna +słabość +sława +słodkość +słodycz +słodzik +słoma +słonina +słowiańskość +słownictwo +słowotwórstwo +słód +słuszność +służalstwo +służba +smakowitość +smalec +smog +smród +smutek +snobizm +socjalizm +soda +sofistyka +soja +sok +solanina +solanka +solaryzacja +solidarność +solidność +sopran +sos +sosna +sowietyzm +sód +sól +spadź +specjalność +spectrum +sperma +spirytus +splendor +spokój +spolegliwość +spontaniczność +sport +spostrzegawczość +spójnia +spójność +spółdzielczość +sprawiedliwość +sprawność +sprośność +spryt +sprzedaż +spuścizna +srebro +stabilizacja +stanowczość +staranność +starszyzna +stężenie +stilo +strach +stres +strukturalizm +styczność +subiektywność +substancja +subtelność +surowiec +surowość +surówka +suspens +susz +suwerenność +swing +swoboda +swoistość +syf +symbioza +symetria +sympatia +synergia +systematyczność +szacunek +szaleństwo +szampan +szampon +szantaż +szarlataneria +szarość +szczerość +szczęście +szczęśliwość +szermierka +szerokość +szkło +szlachetność +szlam +szmal +szmelc +szok +szpan +sztorm +sztruks +sztuczność +szum +szuter +szybkość +szynka +ślina +ślubność +śluz +śmiałość +śmiech +śmieszność +śmietana +śnieg +śrut +świadomość +światło +świeżość +świętość +tabaka +tajemniczość +tajność +tal +talk +tałatajstwo +taniec +tarcie +tatarszczyzna +teatralność +technika +teina +tekst +temperament +tempura +tendencyjność +tenis +termodynamika +terroryzm +testosteron +tężyzna +tkanina +tkliwość +tlen +tłok +tłuszcz +tłuszcza +tokaj +tolerancja +toluen +torf +torsja +totalitaryzm +towar +tożsamość +tragizm +transseksualizm +trawa +trema +tresura +troskliwość +trotyl +trucizna +trud +trunek +trwałość +trypofan +tryumf +trzcina +tupet +turpizm +turystyka +tusz +twardość +tymianek +tynk +tytan +tytoń +ubaw +ubóstwo +uciążliwość +uczciwość +uczuciowość +udział +udźwig +ufność +ultrafiolet +ułomność +umiar +umowność +upał +upór +uran +urobek +uroda +urok +uszczypliwość +uważność +uznaniowość +uzus +waga +waleczność +waluta +wandalizm +wapno +wapń +wariancja +wata +wazelina +wdzięczność +wdzięk +werniks +wesołość +węch +węgiel +wętrzność +whisky +wiatr +wiedza +wieloznaczność +wieprzowina +wierzba +większość +wigor +wilgoć +wilgotność +wino +witalność +wkład +władztwo +włókno +woda +wodolejstwo +wodorotlenek +wodór +wola +wolfram +woluntaryzm +wołowina +wonność +wosk +wóda +wprawa +wrażliwość +wrogość +wschód +wspólność +współbrać +współczesność +współpraca +wstręt +wstrzemięźliwość +wstyd +wstydliwość +wściekłość +wydajność +wydzielina +wygodnictwo +wykładzina +wynalazczość +wyniosłość +wyobraźnia +wypoczynek +wyrazistość +wyrozumiałość +wysiłek +wytrwałość +wytrzymałość +wyższość +wzajemność +względność +zachód +zachwyt +zaciekłość +zaciętość +zadęcie +zaduma +zajadłość +zalewa +zamęt +zapał +zaradność +zarośl +zarozumialstwo +zasadność +zasięg +zawiść +zawziętość +zażyłość +zboże +zbyt +zdrowie +zgiełk +zgodność +zielsko +zimno +zioło +zjadliwość +złom +złość +złośliwość +złoto +złudność +zmarzlina +zmysłowość +zmyślność +znakomitość +znój +zuchwałość +zysk +żal +żałośność +żar +żarliwość +żelastwo +żętyca +żołnierstwo +żółć +żużel +żwir +życzeniowość +żydostwo +żyto +żywica +żywiec +żywność +żywotność +kuskus +masło \ No newline at end of file diff --git a/LCGlexicon/resources/subst_uncountable_stare.dat b/LCGlexicon/resources/subst_uncountable_stare.dat new file mode 100644 index 0000000..b64b932 --- /dev/null +++ b/LCGlexicon/resources/subst_uncountable_stare.dat @@ -0,0 +1,704 @@ +abecadło +abstrakcja +adekwatność +admiracja +adrenalina +afektacja +agresja +agresywność +akceptacja +akrobatyka +aktorstwo +aktualność +alogiczność +aluminium +amatorszczyzna +ambra +amfetamina +amoralność +amunicja +amygdalina +amigdalina +analityka +analiza +animacja +antymateria +aparatura +apatia +apologetyka +aranżacja +archeologia +architektura +argumentacja +arogancja +arystokracja +arytmetyka +astronomia +asymilacja +atmosfera +atrakcyjność +autentyczność +autocasco +autoironia +autokefalia +autokracja +automatyka +autonomia +autorefleksja +autoreklama +awangarda +baczenie +bakteriemia +bałaganiarstwo +bałwochwalstwo +beletrystyka +bestialstwo +bezczelność +bezduszność +bezeceństwo +bezinteresowność +bezmyślność +beznadzieja +bezpieczeństwo +bezprawie +bezradność +bezrobocie +beztroska +bezwzględność +białko +bibliografia +bieda +biedota +bieganina +bielizna +bigoteria +biologia +biomasa +biopaliwo +biotyna +biurokracja +biżuteria +blacha +bliskość +błoto +błyskotliwość +boazeria +bogactwo +bohaterskość +bohaterstwo +boleść +bonifikata +boskość +barakoróbstwo +brawura +brednia +broń +brutalność +brylantyna +bryndza +brzydota +buczyna +budowa +bułgarskość +burza +bydło +bylejakość +cebula +celebracja +celuloza +cenność +centroprawica +centrum +ceramika +Cerkiew +cenzura +chałtura +chamstwo +chaoryczność +charyzma +chciejstwo +chciwość +chełpliwość +chemia +chęć +chirurgia +cholina +chorobliwość +Christie +chronologia +chrześcijaństwo +chrypka +chuligaństwo +chwała +ciało +ciałko +ciasto +ciecz +ciekawość +cielesność +ciemnota +cierpienie +cierpliwość +ciężkość +cola +coś +cosik +cudaczność +cudowność +curry +cwaniactwo +cywilizacja +czarnuszka +czekolada +czeladź +czerń +czerwień +częstotliwość +człowieczeństwo +czujność +czułość +czystość +czytelność +dbałość +dbanie +decyzyjność +degeneracja +delikatność +demokracja +denominacja +deprawacja +desperacja +deszczówka +determinacja +dezaprobata +dezinformacja +dezynwoltura +diagnostyka +dłubanina +dobroć +dobrotliwość +dociekliwość +doczesność +dojrzałość +dokładność +dokumentacja +dola +domieszka +dominacja +domyślność +donacja +donośność +doradztwo +doskonałość +dosłowność +dostojeństwo +dostojność +doświadczenie +dowolność +dramaturgia +draństwo +drapieżność +drewno +drobnica +duchowieństwo +duchowość +duma +dydaktyka +dyletanctwo +dynamika +dyplomacja +dyscyplina +dysharmonia +dyskrecja +dyspozycja +dyspozycyjność +dystrybucja +dziadostwo +działalność +dziatwa +dzicz +dziczyzna +dzieciarnia +dzieciństwo +dzielność +dziennikarstwo +dziewczęcość +dziewiczość +dzikość +dziwność +edukacja +efekciarstwo +ego +egzaltacja +egzotyka +ekologia +ekonomia +ekscytacja +eksperiencja +ekspresja +ekstrawagancja +ekwilibrystyka +elastyczność +emergencja +emfaza +emisja +empatia +empiria +erotyka +eseistyka +estetyka +estyma +etyka +etymologia +euforia +fachowość +fałszywość +fantastyka +fantasy +fasadowość +fascynacja +fasola +fasolka +fatyga +fauna +feta +fikcja +filozofia +finezja +fizjologia +fizyka +flamenco +flora +folia +forsa +fruktoza +frustracja +frywolność +furia +gacie +gadulstwo +gapiostwo +garderoba +gastronomia +gawiedź +gaza +genealogia +genetyka +geometria +gestapo +gęstość +gęś +gimnastyka +glokoproteina +glina +gloria +glukozamina +głupota +gnojowica +godność +golizna +golonka +gorączka +gorczyca +gorliwość +goryczka +gorzałka +gościnność +gotowizna +gotowość +gotówka +gówno +grafika +grafomania +grafomaństwo +gramatyka +grochówka +grosiwo +groteska +groza +grubiaństwo +gruźlica +gryka +grzeczność +guślarstwo +gwałtowność +gujańskość +guma +habilitacja +hańba +harmonia +hemiceluloza +hemoglobina +herbata +heroina +higiena +hipokryzja +histeria +historia +hołota +hossa +hucpa +humanistyka +igliwie +ignorancja +ikra +iluzja +impertynencja +improwizacja +indoktrynacja +indygo +inercja +inflacja +informatyka +innowacyjność +instrumentarium +insulina +intarsja +inteligencja +intensywność +intymność +inwencja +ironia +irytacja +izolacja +jajecznica +jakość +jałowość +jarzębina +jasność +jawa +jawność +jazda +jednomyślność +jedność +jedynowładztwo +jedzenie +jedzonko +jesień +jucha +kaczka +kadzidło +kakao +kalectwo +kamfora +kapucha +kapusta +karierowiczostwo +karma +kartografia +kasza +katharsis +kazeina +kieszonkowe +klientela +kobiecość +kofeina +kokaina +komedianctwo +komercja +komunikacja +koncentracja +kondolencje +kondycja +konfetti +konina +konkretność +konkurencja +konstruktywność +konsumpcja +koordynacja +kolapina +kora +korupcja +kosmetyka +kostrzewa +kosztowność +kosztowności +kosmogonia +koszykówka +kozaczyzna +kranówa +krążenie +kreatyna +kreatywność +kreda +krepa +krew +krętactwo +kruchość +kruszywo +krytyka +krzątanina +krzemionka +krzepa +kształcenie +kuglarstwo +kukurydza +kurtuazja +laba +laktoza +larum +lecytyna +lekceważenie +lekkomyślność +lekkość +lenistwo +liczebność +lignina +liryka +literatura +litografia +litość +lizyna +logiczność +logika +logistyka +lokalność +ludność +ludowość +ludyczność +ludzkość +lycra +ładność +łagodność +łajdactwo +łajno +łaskawość +łączność +magenta +magia +magnum +majętność +makulatura +malarskość +malarstwo +malowniczość +małość +mamuna +mana +maniera +maniery +manipulacja +marchewka +marihuana +marmolada +marnotrawstwo +masło +maść +matematyka +materia +matma +maź +mądrość +mąka +mdłość +mdłości +mechanika +medycyna +melancholia +melatonina +merytoryczność +metafizyka +metka +męskość +męstwo +mgła +miara +miedź +mienie +mięcho +miękkość +mięsiwo +mięsko +mięso +mięta +mikroflora +milczenie +miłosierdzie +minoderia +miłość +miodność +mistyka +mityczność +mizeria +mleczko +mleko +młodzież +mobilność +monarchia +monotonia +moralność +morfina +morze +motywacja +mowa +murzyńskość +muzyka +muzyczka +mydło +nachalność +nacjonalizacja +nadgorliwość +nadwaga +nadzwyczajność +naftalina +nagość +naiwność +namaszczenie +narkomania +nasienie +naśladownictwo +naturalność +nauka +nawigacja +nerwowość +nerwówa +nerwówka +nicość +nieczułość +niedbalstwo +niedbałość +niedelikatność +niedogodność +niedojrzałość +niedokładność +nieodwaga +niefajność +niefrasobliwość +niegospodarność +niegodziwość +niejednorodność +nielojalność +niemoralność +nienawiść +nieodpowiedzialność +niepewność +niepodległość +nieporadność +nieprawdziwość +nieprawość +nieprecyzyjność +nieracjonalność +nierzetelność +niesamowitość +nieskromność +niesłuszność +niesporawiedliwość +niesprawność +nieszczerość +nieśmiałość +nieświadomość +nietolerancja +nieuczciwość +nieudolność +nieufność +nieukontentowanie +nieumiejętność +nieuwaga +niewiara +niewierność +niewinność +niewłaściwość +niewola +niewypłacalność +niezadowolenie +niezależność +niezawisłość +niezborność +niezdolność +niezgodność +niezwykłość +nieżyczliwość +nikczemność +nikotyna +nonsensowność +nonszalancja +normalność +nostalgia +nośność +nowoczesność +nowomowa +nuda +obcość +obiektywność +obieralność +obfitość +obsługa +oburzenie +obuwie +obycie +ochra +ochrona +ociężałość +oddanie +odkrywczość +odmienność +odporność +odpowiedzialność +odrębność +odstępne +odwaga +odzienie +odzież +ofensywność +ofiarność +oglądalność +ogłada +ogólnikowość +ogólność +ogranie +ohyda +określoność +okrucieństwo +oksytocyna +oliwa +opamiętanie +opancerzenie +oparcie +operatywność +opieka +opiekuńczość +opieszałość +opium +optyka +ortografia +oryginalność +osłoda +osocze +ostentacja +ostrożność +oszołomstwo +oświetlenie +otucha +otwartość +ożywienie +padlina +paliwo +pamięć +panika +papryka +papu +parchatość +partyjniactwo +pasta +pasza +pazerność +pedagogika +pedofilia +pensjonarskość +pepsi +pepsyna +pewność +piana +pianistyka +pieczeń +pieczołowitość +pieczywo +pielęgnacja +pietruszka +pikanteria +piwko +piwo +pizza +piżmo +plastelina diff --git a/LCGlexicon/test.ml b/LCGlexicon/test.ml index 1666012..a93a479 100644 --- a/LCGlexicon/test.ml +++ b/LCGlexicon/test.ml @@ -20,10 +20,11 @@ open ENIAM_LCGlexiconTypes open ENIAM_LCGtypes -let rules = ENIAM_LCGlexicon.make_rules "resources/lexicon-pl.dic" +let rules = ENIAM_LCGlexicon.make_rules (!ENIAM_LCGlexiconTypes.rules_filename) +(* let rules = ENIAM_LCGlexicon.make_rules "resources/lexicon-pl.dic" *) let examples = [ - (*"kot",[ + "kot",[ 1, 0, 1, "","<sentence>","interp", [],false; 2, 1, 2, "","<clause>","interp", [],false; 3, 2, 3, "Ala","Ala","subst", [["sg"];["nom"];["f"]],true; @@ -42,8 +43,8 @@ let examples = [ 7, 4, 5, "kota","kota","subst", [["sg"];["nom"];["f"]],false; 8, 5, 6, "","</clause>","interp", [],false; 9, 6, 7, ".","</sentence>","interp", [],false; - ],7;*) - (* "jaki",[ + ],7; + "jaki",[ 1, 0, 1, "","<sentence>","interp", [],false; 2, 1, 2, "","<clause>","interp", [],false; 3, 2, 3, "Jakiego","jaki","adj", [["sg"];["gen";"acc"];["m1";"m2"];["pos"]],false; @@ -53,8 +54,8 @@ let examples = [ 7, 6, 7, "?","?","interp", [],false; 8, 7, 8, "","</clause>","interp", [],false; 9, 8, 9, ".","</sentence>","interp", [],false; - ],9; *) - (*"kot_i_pies",[ + ],9; + "kot_i_pies",[ 1, 0, 1, "","<sentence>","interp", [],false; 2, 1, 2, "","<clause>","interp", [],false; 3, 2, 3, "Ala","Ala","subst", [["sg"];["nom"];["f"]],true; @@ -64,7 +65,7 @@ let examples = [ 7, 6, 7, "psa","pies","subst", [["sg"];["gen";"acc"];["m2"]],false; 8, 7, 8, "","</clause>","interp", [],false; 9, 8, 9, ".","</sentence>","interp", [],false; - ],9;*) + ],9; "kotx",[ 1, 0, 1, "","<sentence>","interp", [],false; 2, 1, 2, "","<clause>","interp", [],false; diff --git a/LCGparser/README b/LCGparser/README index f79ff3f..9f63515 100644 --- a/LCGparser/README +++ b/LCGparser/README @@ -20,17 +20,13 @@ In order to test library type: make test ./test +test requires pdflatex installed. + Credits ------- Copyright © 2016 Wojciech Jaworski <wjaworski atSPAMfree mimuw dot edu dot pl> Copyright © 2016 Institute of Computer Science Polish Academy of Sciences -The library uses the following licensed resources: - -NKJP1M: the manually annotated 1-million word subcorpus sampled -from texts of a subset of the National Corpus of Polish. -version 1.2 - Licence ------- diff --git a/LCGparser/eniam-lcg-parser-1.0.tar.bz2 b/LCGparser/eniam-lcg-parser-1.0.tar.bz2 new file mode 100644 index 0000000..781708b --- /dev/null +++ b/LCGparser/eniam-lcg-parser-1.0.tar.bz2 diff --git a/morphology2/README b/morphology2/README index a049e80..bedd0b1 100644 --- a/morphology2/README +++ b/morphology2/README @@ -1,4 +1,4 @@ -ENIAMmorphology Version 1.0 : +ENIAMmorphology Version 1.1 : ----------------------- ENIAMmorphology is a library that provides a morphological analyser @@ -8,7 +8,7 @@ Install ------- ENIAMmorphology requires OCaml version 4.02.3 compiler -together with Xlib library version 3.1 or later. +together with Xlib library version 3.2 or later. In order to install type: diff --git a/morphology2/eniam-morphology-1.1.tar.bz2 b/morphology2/eniam-morphology-1.1.tar.bz2 new file mode 100644 index 0000000..f0f4c8e --- /dev/null +++ b/morphology2/eniam-morphology-1.1.tar.bz2 diff --git a/subsyntax/README b/subsyntax/README index 2c1205d..54a6f2a 100644 --- a/subsyntax/README +++ b/subsyntax/README @@ -1,4 +1,4 @@ -ENIAMsubsyntax Version 1.0 : +ENIAMsubsyntax Version 1.1 : ----------------------- ENIAMsubsyntax is a library that @@ -10,8 +10,8 @@ Install ------- ENIAMsubsyntax requires OCaml version 4.02.3 compiler -together with Xlib library version 3.1 or later, -ENIAMtokenizer library version 1.0 and ENIAMmorphology library version 1.0. +together with Xlib library version 3.2 or later, +ENIAMtokenizer library version 1.1 and ENIAMmorphology library version 1.1. In order to install type: @@ -24,6 +24,13 @@ In order to test library type: make test ./test +In order to compile a command line interface to the library type: +make interface + +./interface --help provides information on command line options. + +Both test and interface require graphviz installed. + By default ENIAMsubsyntax looks for resources in /usr/share/eniam directory. However this behaviour may be changed by setting end exporting ENIAM_RESOURCE_PATH environment variable. diff --git a/subsyntax/eniam-subsyntax-1.1.tar.bz2 b/subsyntax/eniam-subsyntax-1.1.tar.bz2 new file mode 100644 index 0000000..be99402 --- /dev/null +++ b/subsyntax/eniam-subsyntax-1.1.tar.bz2 diff --git a/tokenizer/README b/tokenizer/README index 3df3663..51af5c7 100644 --- a/tokenizer/README +++ b/tokenizer/README @@ -1,4 +1,4 @@ -ENIAMtokenizer Version 1.0 : +ENIAMtokenizer Version 1.1 : ----------------------- ENIAMtokenizer is a library that provides a tokenizer for Polish. @@ -7,7 +7,7 @@ Install ------- ENIAMtokenizer requires OCaml version 4.02.3 compiler -together with Xlib library version 3.1 or later. +together with Xlib library version 3.2 or later. In order to install type: diff --git a/tokenizer/eniam-tokenizer-1.1.tar.bz2 b/tokenizer/eniam-tokenizer-1.1.tar.bz2 new file mode 100644 index 0000000..202e2c8 --- /dev/null +++ b/tokenizer/eniam-tokenizer-1.1.tar.bz2