nump - wersja bez atrów

Tomasz Bartosiak
1 parent 9df46228
Showing 1 changed file with 65 additions and 1 deletions
semantics/phraseology_generator.py
@@ -32,6 +32,9 @@ def lexicalisation(argument, subj, base, negativity, reference=None):
     elif lexicalisation_type == 'advp': #advp(type), degree, adverb, atr
         advps = get_advps(get_degree(attributes[1]), get_words(attributes[2]), attributes[3])
         return (advps, [base])
+    elif lexicalisation_type == 'nump': # nump(case), num, noun, atr
+        numps = get_numps(get_case(lexicalisation_parameters[0], subj, negativity, reference), get_words(attributes[1]), get_words(attributes[2]), attributes[3])
+        return (numps, get_verb(base, 'pl', subj))
     else:
         return ([], [])
     return ([], [])
@@ -89,6 +92,8 @@ def get_number(attribute, is_subj, reference=None):
             number = u'_'
         else:
             number = tag.split(':')[1]
+    elif number == u'agr' and reference is None:
+        number = u'sg'
     return number
  
 def get_gender(attribute, reference=None):
@@ -104,6 +109,8 @@ def get_gender(attribute, reference=None):
             gender = u'_'
         else:
             gender = tag.split(':')[3]
+    elif gender == u'agr' and reference is None:
+        gender = 'm1'
     return gender
  
 def get_degree(attribute):
@@ -139,7 +146,6 @@ def get_nps(cases, number, nouns, atr):
     return dependents(atr, result)
  
 def get_prepnps(prep, cases, number, nouns, _atr):
-    # ala["ma"] = kot
     nps = get_nps(cases, number, nouns, _atr)
     return [prep + ' ' + np for np in nps]
  
@@ -232,6 +238,64 @@ def get_advps(degree, adverbs, atr):
         result += options
     return dependents(atr, result)
  
+def get_numps(cases, numerals, nouns, atr):
+    results = []
+    nums = []
+    for numeral in numerals:
+        options = [(interp.orth, interp.getTag(MORFEUSZ2)) for interp in MORFEUSZ2.generate(numeral.encode('utf8'))]
+        filtered = []
+        for option in options:
+            (orth, tag) = option
+            if u'num:' in tag:
+                filtered.append(option)
+        options = filtered
+        options_temp = []
+        for case in cases:
+            if case != u'_':
+                filtered = []
+                for option in options:
+                    (orth, tag) = option
+                    if u':' + case + u':' in tag or ':' + case + '.' in tag or '.' + case + '.' in tag:
+                        filtered.append(option)
+                options_temp += filtered
+            else:
+                options_temp += options
+        nums = options_temp
+        if len(nums) == 0:
+            return []
+        for (num_orth, num_tag) in nums:
+            rec = num_tag.split(':')[4]
+            for noun in nouns:
+                options = [(interp.orth, interp.getTag(MORFEUSZ2)) for interp in MORFEUSZ2.generate(noun.encode('utf8')) if 'subst:' in interp.getTag(MORFEUSZ2)]
+                filtered = []
+                for option in options:
+                    (orth, tag) = option
+                    if u':pl:' in tag:
+                        filtered.append(option)
+                options = filtered
+                if rec == 'rec':
+                    c = ['gen']
+                else:
+                    c = cases
+                options_temp = []
+                for case in c:
+                    if case != u'_':
+                        filtered = []
+                        for option in options:
+                            (orth, tag) = option
+                            if u':' + case + u':' in tag or ':' + case + '.' in tag or '.' + case + '.' in tag:
+                                filtered.append(option)
+                        options_temp += filtered
+                    else:
+                        options_temp += options
+                options = options_temp
+                for (orth, tag) in options:
+                    gender = tag.split(':')[3]
+                    if u':' + gender + u':' in num_tag or ':' + gender + '.' in num_tag or '.' + gender + '.' in num_tag:
+                        results.append(num_orth + ' ' + orth)
+            
+    return results #ignoring ambiguos atr for numps
+
  
 def get_verb(inf, number, is_subj):
     if not is_subj: