usunięcie pola 'cats' ze struktury danych

Wojciech Jaworski
1 parent 95c86f11
Showing 12 changed files with 137 additions and 29 deletions
exec/makefile
lexSemantics/ENIAMadjuncts.ml
lexSemantics/ENIAMlexSemantics.ml
lexSemantics/ENIAMlexSemanticsHTMLof.ml
lexSemantics/ENIAMlexSemanticsStringOf.ml
lexSemantics/ENIAMlexSemanticsTypes.ml
lexSemantics/ENIAMvalence.ml
lexSemantics/ENIAMwalRenderer.ml
lexSemantics/ENIAMwalStringOf.ml
lexSemantics/ENIAMwalTypes.ml
lexSemantics/README
lexSemantics/interface.ml
@@ -32,11 +32,14 @@ eniam-exec.cmxa: $(SOURCES)
 	ocamlopt -linkall -a -o eniam-exec.cmxa $(INCLUDES) $^
  
 parser: $(SOURCES) parser.ml
-	$(OCAMLOPT) -o parser $(OCAMLOPTFLAGS) $(SOURCES) parser.ml
+	$(OCAMLOPT) -o parser $(OCAMLOPTFLAGS) $^
+
+domparser: $(SOURCES) domparser.ml
+	$(OCAMLOPT) -o domparser $(OCAMLOPTFLAGS) eniam-domainLexSemantics.cmxa $^
  
 semparser: $(SOURCES) semparser.ml
 	mkdir -p results
-	$(OCAMLOPT) -o semparser $(OCAMLOPTFLAGS) $(SOURCES) semparser.ml
+	$(OCAMLOPT) -o semparser $(OCAMLOPTFLAGS) $^
  
 webInterface: ENIAMexecTypes.ml ENIAMvisualization.ml webInterface.ml
 	$(OCAMLOPT) -o parser3.cgi $(OCAMLOPTFLAGS) $^
@@ -253,19 +253,19 @@ let simplify_schemata lexemes pos pos2 lemma schemata =
               "{" ^ String.concat ";" (PhraseSet.fold morfs [] (fun l m -> ENIAMwalStringOf.phrase m :: l)) ^ "}")))); *)
       schemata
  
-let add_adjuncts preps compreps compars pos2 (selectors,schema) =
+let add_adjuncts preps compreps compars pos2 (selectors,cat,schema) =
   let compreps = Xlist.rev_map compreps ENIAMwalRenderer.render_comprep in
   let prepnps = Xlist.rev_map preps (fun (prep,cases) -> ENIAMwalRenderer.render_prepnp prep cases) in
   let prepadjps = Xlist.rev_map preps (fun (prep,cases) -> ENIAMwalRenderer.render_prepadjp prep cases) in
   let compars = Xlist.rev_map compars ENIAMwalRenderer.render_compar in
   match pos2 with
-    "verb" -> [selectors,schema @ ENIAMwalRenderer.verb_adjuncts_simp @ prepnps @ prepadjps @ compreps @ compars]
+    "verb" -> [selectors,cat,schema @ ENIAMwalRenderer.verb_adjuncts_simp @ prepnps @ prepadjps @ compreps @ compars]
   | "noun" -> [
-      [Nsyn,Eq,["proper"]] @ selectors,ENIAMwalRenderer.proper_noun_adjuncts_simp @ prepnps @ compreps @ compars;
-      [Nsyn,Eq,["common"];Nsem,Eq,["measure"]] @ selectors,ENIAMwalRenderer.measure_noun_adjuncts_simp @ prepnps @ compreps @ compars;
-      [Nsyn,Eq,["common"];Nsem,Neq,["measure"]] @ selectors,ENIAMwalRenderer.common_noun_adjuncts_simp @ prepnps @ compreps @ compars]
-  | "adj" -> [selectors,schema @ ENIAMwalRenderer.adj_adjuncts_simp @ compars]
-  | "adv" -> [selectors,schema @ ENIAMwalRenderer.adv_adjuncts_simp @ compars]
+      [Nsyn,Eq,["proper"]] @ selectors,cat,ENIAMwalRenderer.proper_noun_adjuncts_simp @ prepnps @ compreps @ compars;
+      [Nsyn,Eq,["common"];Nsem,Eq,["measure"]] @ selectors,cat,ENIAMwalRenderer.measure_noun_adjuncts_simp @ prepnps @ compreps @ compars;
+      [Nsyn,Eq,["common"];Nsem,Neq,["measure"]] @ selectors,cat,ENIAMwalRenderer.common_noun_adjuncts_simp @ prepnps @ compreps @ compars]
+  | "adj" -> [selectors,cat,schema @ ENIAMwalRenderer.adj_adjuncts_simp @ compars]
+  | "adv" -> [selectors,cat,schema @ ENIAMwalRenderer.adv_adjuncts_simp @ compars]
   | _ -> []
  
 open ENIAMlexSemanticsTypes
@@ -302,7 +302,7 @@ let assign_valence tokens lex_sems group =
       let schemata = ENIAMadjuncts.simplify_schemata lexemes pos pos2 lemma schemata1 in
       (* Printf.printf "C %s |schemata|=%d\n" lemma (Xlist.size schemata); *)
       let schemata = Xlist.rev_map schemata (fun (selectors,schema) ->
-          selectors,ENIAMwalRenderer.render_simple_schema schema) in
+          selectors,["X"],ENIAMwalRenderer.render_simple_schema schema) in
       let schemata = List.flatten (Xlist.rev_map schemata (ENIAMadjuncts.add_adjuncts preps compreps compars pos2)) in
       (* Printf.printf "D %s |schemata|=%d\n" lemma (Xlist.size schemata); *)
       let entries = List.flatten (Xlist.rev_map entries (ENIAMvalence.transform_lex_entry pos lemma)) in
@@ -343,7 +343,7 @@ let assign_valence tokens lex_sems group =
       let connected = Xlist.rev_map connected mark_nosem in
       (* let connected = List.flatten (Xlist.rev_map connected (set_context lemma pos)) in *)
       (* Printf.printf "K %s |connected|=%d\n" lemma (Xlist.size connected); *)
-      ExtArray.set lex_sems id {(ExtArray.get lex_sems id) with
+      ExtArray.set lex_sems id {(*(ExtArray.get lex_sems id) with*)
                                 schemata=schemata; lex_entries=entries; frames=connected})
  
 (* TODO:
@@ -356,8 +356,6 @@ let assign_valence tokens lex_sems group =
    - scalanie frames
 *)
  
-
-
 (*
 let assign_valence tokens lex_sems group =
   let lexemes = Xlist.fold group StringMap.empty (fun lexemes id ->
@@ -60,8 +60,8 @@ let html_of_lex_sems tokens lex_sems =
     let core = Printf.sprintf "%3d %s %s" id orth lemma  in
     let lex_entries = Xlist.map t.lex_entries (fun (selectors,s) ->
         "&emsp;&emsp;[" ^ ENIAMcategoriesPL.string_of_selectors selectors ^ "] " ^ ENIAM_LCGstringOf.grammar_symbol 0 s) in
-    let schemata = Xlist.map t.schemata (fun (selectors,l) ->
-        "&emsp;&emsp;[" ^ ENIAMcategoriesPL.string_of_selectors selectors ^ "] {" ^ String.concat ", " (Xlist.map l (fun (d,s) ->
+    let schemata = Xlist.map t.schemata (fun (selectors,cat,l) ->
+        "&emsp;&emsp;[" ^ ENIAMcategoriesPL.string_of_selectors selectors ^ "]" ^ String.concat "," cat ^ "{" ^ String.concat ", " (Xlist.map l (fun (d,s) ->
             ENIAM_LCGstringOf.direction d ^ ENIAM_LCGstringOf.grammar_symbol 0 s)) ^ "}") in
     (* let frames = Xlist.map t.frames (fun (selectors,meanings,schema) -> FIXME
         "&emsp;&emsp;[" ^ ENIAMcategoriesPL.string_of_selectors selectors ^ "] {" ^ ENIAMwalStringOf.schema schema ^ "} " ^
@@ -40,8 +40,8 @@ let string_of_lex_sems tokens lex_sems =
     let core = Printf.sprintf "%3d %s %s" id orth lemma  in
     let lex_entries = Xlist.map t.lex_entries (fun (selectors,s) ->
         "&[" ^ ENIAMcategoriesPL.string_of_selectors selectors ^ "] " ^ ENIAM_LCGstringOf.grammar_symbol 0 s) in
-    let schemata = Xlist.map t.schemata (fun (selectors,l) ->
-        "[" ^ ENIAMcategoriesPL.string_of_selectors selectors ^ "] {" ^ String.concat "," (Xlist.map l (fun (d,s) ->
+    let schemata = Xlist.map t.schemata (fun (selectors,cat,l) ->
+        "[" ^ ENIAMcategoriesPL.string_of_selectors selectors ^ "]" ^ String.concat "," cat ^ "{" ^ String.concat "," (Xlist.map l (fun (d,s) ->
             ENIAM_LCGstringOf.direction d ^ ENIAM_LCGstringOf.grammar_symbol 0 s)) ^ "}") in
     let frames = Xlist.map t.frames (fun f ->
         "*" ^ arole f ^ "[" ^ ENIAMcategoriesPL.string_of_selectors f.selectors ^ "] {" ^ ENIAMwalStringOf.schema f.positions ^ "} " ^
@@ -40,15 +40,16 @@ let empty_frame = {selectors=[]; meanings=[]; positions=[]; arole=&quot;&quot;; arole_attr
  
 type lex_sem = {
   schemata: ((ENIAM_LCGlexiconTypes.selector * ENIAM_LCGlexiconTypes.selector_relation * string list) list *
+             string list * (* sensy *)
              (ENIAM_LCGtypes.direction * ENIAM_LCGtypes.grammar_symbol) list) list;
   lex_entries: ((ENIAM_LCGlexiconTypes.selector * ENIAM_LCGlexiconTypes.selector_relation * string list) list *
                 ENIAM_LCGtypes.grammar_symbol) list;
   frames: frame list;
-  cats: (string * string list) list;
+  (* cats: (string * string list) list; *)
   }
  
 let empty_lex_sem = {
-  schemata=[]; lex_entries=[]; frames=[]; cats=["X",["X"]]}
+  schemata=[]; lex_entries=[]; frames=[]; (*cats=["X",["X"]]*)}
  
 let hipero_threshold = 3
 let unknown_meaning_weight = -1.
@@ -59,3 +60,5 @@ let syn_filename = resource_path ^ &quot;/plWordnet/syn.tab&quot;
  
 let predef_filename = resource_path ^ "/lexSemantics/predef_prefs.tab"
 let proper_classes_filename = resource_path ^ "/lexSemantics/proper_classes.tab"
+
+let proj_filename = ENIAMwalTypes.data_path ^ "/projections.tab"
@@ -76,6 +76,7 @@ let transform_np_phrase lemma = function
     NP(Case case) -> [NP(Case case)(*;NumP(Case case)*)]
   | NP(CaseAgr) -> [NP(CaseAgr)(*;NumP(CaseAgr)*)]
   | NCP(Case c,ctype,comp) -> [NCP(Case c,ctype,comp)]
+  | NP(CaseUndef) -> [NP(CaseUndef)(*;NumP(Case case)*)]
   | AdjP(Case _) as morf -> [morf] (* tylko 'zagłada adjp(postp)' *)
   | AdjP(CaseAgr) -> [AdjP(AllAgr)]
   | AdjP(Str) -> [AdjP(AllAgr)] (* chyba błąd walentego, tylko 'barwa', 'bieda', 'głód', 'kolor', 'nędza', 'śmierć', 'usta' *)
@@ -247,7 +248,7 @@ let transform_pers_subj_phrase lemma negation mood = function (* FIXME: prepnp(n
   | CP(ctype,comp) as morf -> [morf]
   | InfP _ as morf -> [morf]
   | Or as morf -> [morf]
-    (* | Pro -> [ProNG] *)
+  | Pro -> [ProNG]
   | Null -> [Null]
   | morf -> failwith ("transform_pers_subj_phrase: " ^ lemma ^ " " ^ ENIAMwalStringOf.phrase morf)
  
@@ -291,6 +292,7 @@ let transform_pers_phrase lemma negation mood = function
   | NP(Str) -> List.flatten (Xlist.map (transform_str mood negation) (fun case -> [NP case(*;NumP(case)*)]))
   | NP(Part) -> [NP(Case "gen")] @ (if mood = "gerundial" then [] else [NP(Case "acc")(*;NumP(Case "gen");NumP(Case "acc")*)])
   | NP(Case case) -> [NP(Case case)(*;NumP(Case case)*)]
+  | NP(CaseUndef) -> [NP(CaseUndef)(*;NumP(Case case)*)]
   | NCP(Str,ctype,comp) -> List.flatten (Xlist.map (transform_str mood negation) (fun case -> [NCP(case,ctype,comp)]))
   | NCP(Part,ctype,comp) -> List.flatten (Xlist.map (transform_str mood negation) (fun case -> [NCP(case,ctype,comp)]))
   | NCP(Case case,ctype,comp) -> [NCP(Case case,ctype,comp)]
@@ -171,6 +171,69 @@ let render_phrase = function
     | E (PrepNCP(prep,Case case,CompTypeUndef,CompUndef)) -> Tensor[Atom "prepncp"; Atom prep; Atom case; Top; Top]
     | phrase -> failwith ("render_phrase: " ^ ENIAMwalStringOf.phrase phrase)
  
+let render_phrase_cat cat = function
+      NP(Case case) -> Tensor[Atom "np"; Atom cat; Top; Atom case; Top; Top]
+    | NP NomAgr -> Tensor[Atom "np"; Atom cat; AVar "number"; Atom "nom"; AVar "gender"; AVar "person"]
+(*    | NP GenAgr -> Tensor[Atom "np"; Atom cat; AVar "number"; Atom "gen"; AVar "gender"; AVar "person"]
+      | NP AllAgr -> Tensor[Atom "np"; Atom cat; AVar "number"; AVar "case"; AVar "gender"; AVar "person"]*)
+    | NP CaseAgr -> Tensor[Atom "np"; Atom cat; Top; AVar "case"; Top; Top]
+    | NP CaseUndef -> Tensor[Atom "np"; Atom cat; Top; Top; Top; Top]
+    | PrepNP("",CaseUndef) -> Tensor[Atom "prepnp"; Atom cat; Top; Top]
+    | PrepNP("_",CaseUndef) -> Tensor[Atom "prepnp"; Atom cat; Top; Top]
+    | PrepNP(prep,Case case) -> Tensor[Atom "prepnp"; Atom cat; Atom prep; Atom case]
+    | AdjP(Case case) -> Tensor[Atom "adjp"; Atom cat; Top; Atom case; Top]
+(*      | AdjP NomAgr -> Tensor[Atom "adjp"; AVar "number"; Atom "nom"; AVar "gender"]*)
+    | AdjP AllAgr -> Tensor[Atom "adjp"; Atom cat; AVar "number"; AVar "case"; AVar "gender"]
+(*    | AdjP CaseAgr -> Tensor[Atom "adjp"; Top; AVar "case"; Top]
+      | PrepAdjP("",CaseUndef) -> Tensor[Atom "prepnp"; Top; Top]*)
+    | PrepAdjP(prep,Case case) -> Tensor[Atom "prepadjp"; Atom cat; Atom prep; Atom case]
+    (* | NumP(Case case) -> Tensor[Atom "nump"; Top; Atom case; Top; Top]
+    | NumP NomAgr -> Tensor[Atom "nump"; AVar "number"; Atom "nom"; AVar "gender"; AVar "person"]
+    | NumP CaseAgr -> Tensor[Atom "nump"; Top; AVar "case"; Top; Top]
+    | NumP CaseUndef -> Tensor[Atom "nump"; Top; Top; Top; Top]
+    | PrepNumP(_,"",CaseUndef) -> Tensor[Atom "prepnp"; Top; Top]
+    | PrepNumP(_,prep,Case case) -> Tensor[Atom "prepnump"; Atom prep; Atom case] *)
+(*      | ComprepNP("") -> Tensor[Atom "comprepnp"; Top]*)
+    | ComprepNP(prep) -> Tensor[Atom "comprepnp"; Atom cat; Atom prep]
+    | ComparP(prep,Case case) -> Tensor[Atom "compar"; Atom cat; Atom prep; Atom case]
+    (* | ComparPP(_,prep) -> Tensor[Atom "comparpp"; Atom prep] *)
+    (* | IP -> Tensor[Atom "ip";Top;Top;Top] *)
+    | CP (ctype,Comp comp) -> Tensor[Atom "cp"; Atom cat; arg_of_ctype ctype; Atom comp]
+    (*    | CP (ctype,CompUndef) -> Tensor[Atom "cp"; arg_of_ctype ctype; Top]*)
+    | NCP(Case case,ctype,Comp comp) -> Tensor[Atom "ncp"; Atom cat; Top; Atom case; Top; Top; arg_of_ctype ctype; Atom comp]
+    | NCP(Case case,CompTypeUndef,CompUndef) -> Tensor[Atom "ncp"; Atom cat; Top; Atom case; Top; Top; Top; Top]
+    | NCP(NomAgr,ctype,Comp comp) -> Tensor[Atom "ncp"; Atom cat; AVar "number"; Atom "nom"; AVar "gender"; AVar "person"; arg_of_ctype ctype; Atom comp]
+    | NCP(NomAgr,CompTypeUndef,CompUndef) -> Tensor[Atom "ncp"; Atom cat; AVar "number"; Atom "nom"; AVar "gender"; AVar "person"; Top; Top]
+    | PrepNCP(prep,Case case,ctype,Comp comp) -> Tensor[Atom "prepncp"; Atom cat; Atom prep; Atom case; arg_of_ctype ctype; Atom comp]
+    | PrepNCP(prep,Case case,CompTypeUndef,CompUndef) -> Tensor[Atom "prepncp"; Atom cat; Atom prep; Atom case; Top; Top]
+    | InfP(Aspect aspect) -> Tensor[Atom "infp"; Atom cat; Atom aspect]
+    | InfP AspectUndef -> Tensor[Atom "infp"; Atom cat; Top]
+    (* | PadvP -> Tensor[Atom "padvp"] *)
+    | AdvP "misc" -> Tensor[Atom "advp"; Atom cat; Top] (* FIXME: a może Atom "mod" zamiast Top *)
+    | AdvP mode -> Tensor[Atom "advp"; Atom cat; Atom mode]
+    (* | PrepP -> Tensor[Atom "prepp";Top]
+    | Prep("",CaseAgr) -> Tensor[Atom "prep"; Top; AVar "case"]
+    | Prep("",CaseUAgr) -> Tensor[Atom "prep"; Top; AVar "ucase"]
+    | Num(AllAgr,Acm acm) -> Tensor[Atom "num"; AVar "number"; AVar "case"; AVar "gender"; AVar "person"; Atom acm]
+    | Measure(AllUAgr) -> Tensor[Atom "measure"; AVar "unumber"; AVar "ucase"; AVar "ugender"; AVar "uperson"] *)
+            (*    | Qub -> Tensor[Atom "qub"]*)
+    (* | Inclusion -> Tensor[Atom "inclusion"]
+    | Adja -> Tensor[Atom "adja"]
+    | Aglt -> Tensor[Atom "aglt"; AVar "number"; AVar "person"]
+    | AuxPast -> Tensor[Atom "aux-past"; AVar "number"; AVar "gender"; AVar "person"]
+    | AuxFut -> Tensor[Atom "aux-fut"; AVar "number"; AVar "gender"; AVar "person"]
+    | AuxImp -> Tensor[Atom "aux-imp"]
+    | Pro -> One
+        | ProNG -> One *)
+    | E (CP(CompTypeUndef,CompUndef)) -> Tensor[Atom "cp"; Atom cat; Top; Top]
+    | E (NCP(NomAgr,CompTypeUndef,CompUndef)) -> Tensor[Atom "ncp"; Atom cat; AVar "number"; Atom "nom"; AVar "gender"; AVar "person"; Top; Top]
+    | E (NP(NomAgr)) -> Tensor[Atom "np"; Atom cat; AVar "number"; Atom "nom"; AVar "gender"; AVar "person"]
+    | E (PrepNP(prep,Case case)) -> Tensor[Atom "prepnp"; Atom cat; Atom prep; Atom case]
+    | E (NP(Case case)) -> Tensor[Atom "np"; Atom cat; Top; Atom case; Top; Top]
+    | E (NCP(Case case,CompTypeUndef,CompUndef)) -> Tensor[Atom "ncp"; Atom cat; Top; Atom case; Top; Top; Top; Top]
+    | E (PrepNCP(prep,Case case,CompTypeUndef,CompUndef)) -> Tensor[Atom "prepncp"; Atom cat; Atom prep; Atom case; Top; Top]
+    | phrase -> failwith ("render_phrase: " ^ ENIAMwalStringOf.phrase phrase)
+
 let render_morf = function
     | Null -> One
     (* | X -> Tensor[Atom "X"]
@@ -179,6 +242,24 @@ let render_morf = function
     | SimpleLexArg(lex,pos) -> Tensor([Atom "lex";Atom lex] @ render_pos pos)
     | phrase -> render_phrase phrase
  
+let render_morf_cat cats = function
+    | Null -> [One]
+    | Pro -> [One]
+    | ProNG -> [One]
+    | FixedP lex -> [Tensor[Atom "fixed"; Atom lex]]
+    | Or -> [Tensor[Atom "or"]]
+    | E Or -> [Tensor[Atom "or"]]
+    (* | X -> Tensor[Atom "X"]
+       | Lex lex -> Tensor[Atom lex] *)
+    | LexArg(id,lex,pos) -> [Tensor([Atom "lex";Atom (string_of_int id);Atom lex] @ render_pos pos)]
+    | SimpleLexArg(lex,pos) -> [Tensor([Atom "lex";Atom lex] @ render_pos pos)]
+    | phrase -> Xlist.map cats (fun cat -> render_phrase_cat cat phrase)
+
+let extract_sel_prefs sel_prefs =
+  Xlist.map sel_prefs (function
+      Predef s -> s
+    | _ -> failwith "extract_sel_prefs")
+
 let render_schema schema =
   Xlist.map schema (fun p ->
       match Xlist.map p.morfs render_morf with
@@ -186,6 +267,13 @@ let render_schema schema =
       | [s] -> Both,s
       | l -> Both,Plus l)
  
+let render_schema_cat schema =
+  Xlist.map schema (fun p ->
+      match List.flatten (Xlist.map p.morfs (render_morf_cat (extract_sel_prefs p.sel_prefs))) with
+        [] -> failwith "render_schema"
+      | [s] -> Both,s
+      | l -> Both,Plus l)
+
 let render_simple_schema schema =
   Xlist.map schema (fun morfs ->
       Both,Plus(One :: Xlist.map morfs render_morf))
@@ -194,6 +282,10 @@ let render_connected_schema schema =
   Xlist.map schema (fun p ->
       {p with morfs=Xlist.map p.morfs (fun morf -> LCG (render_morf morf))})
  
+let render_connected_schema_cat schema =
+  Xlist.map schema (fun p ->
+      {p with morfs=Xlist.map (List.flatten (Xlist.map p.morfs (render_morf_cat (extract_sel_prefs p.sel_prefs)))) (fun morf -> LCG morf)})
+
 (* FIXME: tu trzeba by dodać zwykłe reguły dla czasowników dotyczące ich negacji, aglutynatu itp. *)
 let render_lex_entry = function
     SimpleLexEntry(lemma,pos) -> Tensor([Atom "lex";Atom lemma] @ render_pos_entry pos)
@@ -138,12 +138,13 @@ let rec phrase = function
   | PrepNCP(prep,c,ct,co) -> "prepncp(" ^ prep ^ "," ^ case c ^ "," ^ comp_type ct ^ "," ^ comp co ^ ")"
   | InfP(a) -> "infp(" ^ aspect a (*^ req r*) ^ ")"
   | AdvP(m) -> "advp(" ^ m ^ ")"
+  | ColonP -> "colonp"
   | FixedP s -> "fixed(" ^ s ^ ")"
   (* | Num(c,a) -> "num(" ^ case c ^ "," ^ acm a ^ ")" *)
   | Or -> "or"
   | Qub -> "qub"
-  (* | Pro -> "pro"
-  | ProNG -> "prong" *)
+  | Pro -> "pro"
+  | ProNG -> "prong"
   | Null -> "null"
   (* | GerP c -> "gerp(" ^ case c ^ ")"
   | PrepGerP(prep,c) -> "prepgerp(" ^ prep ^ "," ^ case c ^ ")"
@@ -74,14 +74,15 @@ type phrase =
   | PrepNCP of string * case * comp_type * comp
   | InfP of aspect
   | AdvP of string
+  | ColonP
   | FixedP of string
   (* | Num of case * acm *)
   | Or
   (* | Refl
   | Recip *)
   | Qub
-  (* | Pro
-  | ProNG *)
+  | Pro
+  | ProNG
   | Null
   (* | GerP of case
   | PrepGerP of string * case
@@ -165,8 +166,14 @@ let resource_path =
     if Sys.file_exists "resources" then "resources" else
     failwith "resource directory does not exists"
  
+let data_path =
+  try Sys.getenv "ENIAM_USER_DATA_PATH"
+  with Not_found -> "data"
+
 let phrases_filename = resource_path ^ "/Walenty/phrases.tab"
 let entries_filename = resource_path ^ "/Walenty/entries.tab"
 let schemata_filename = resource_path ^ "/Walenty/schemata.tab"
 let connected_filename = resource_path ^ "/Walenty/connected.tab"
 let meanings_filename = resource_path ^ "/Walenty/meanings.tab"
+
+let user_valence_filename = data_path ^ "/valence.dic"
-ENIAMsemValence Version 1.0 :
+ENIAMlexSemantics Version 1.0 :
 -----------------------
  
-ENIAMsemValence is a library that assigns tokens with lexicosemantic information.
+ENIAMlexSemantics is a library that assigns tokens with lexicosemantic information.
 It assigns thematic roles, word senses, valence and other semantic information to tokens.
  
 Install
 -------
  
-ENIAMsemValence requires OCaml version 4.02.3 compiler
+ENIAMlexSemantics requires OCaml version 4.02.3 compiler
 together with Xlib library version 3.1 or later,
 ENIAMtokenizer library version 1.0, ENIAMmorphology library version 1.0
 and ENIAMsubsyntax library version 1.0.
@@ -16,14 +16,14 @@ In order to install type:
  
 make install
  
-by default, ENIAMsemValence is installed in the 'ocamlc -where'/eniam directory.
+by default, ENIAMlexSemantics is installed in the 'ocamlc -where'/eniam directory.
 you can change it by editing the Makefile.
  
 In order to test library type:
 make test
 ./test
  
-By default ENIAMsemValence looks for resources in /usr/share/eniam directory.
+By default ENIAMlexSemantics looks for resources in /usr/share/eniam directory.
 However this behaviour may be changed by setting end exporting ENIAM_RESOURCE_PATH
 environment variable.
  
@@ -34,6 +34,8 @@ let spec_list = [
   "-x", Arg.Unit (fun () -> output:=Xml), "Output as XML";
   "-m", Arg.Unit (fun () -> output:=Marsh), "Output as marshalled Ocaml data structure";
   "-h", Arg.Unit (fun () -> output:=Html), "Output as HTML";
+  "--strong-disamb", Arg.Unit (fun () -> ENIAMsubsyntaxTypes.strong_disambiguate_flag:=true), "Perform strong disambiguation";
+  "--no-strong-disamb", Arg.Unit (fun () -> ENIAMsubsyntaxTypes.strong_disambiguate_flag:=false), "Do not perform strong disambiguation (default)";
   "--dep_parser", Arg.Unit (fun () ->
     ENIAMpreIntegration.concraft_enabled := true;
     ENIAMpreIntegration.mate_parser_enabled := true;