Minor fixes.

Bartłomiej Nitoń
1 parent 4a097c4f
Showing 5 changed files with 24 additions and 26 deletions
conf.py
corneferencer/entities.py
corneferencer/resolvers/resolve.py
corneferencer/resolvers/vectors.py
corneferencer/utils.py
@@ -20,4 +20,4 @@ W2V_MODEL_PATH = os.path.join(os.path.dirname(__file__), &#39;models&#39;, W2V_MODEL_NAM
 W2V_MODEL = Word2Vec.load(W2V_MODEL_PATH)
  
 NEURAL_MODEL_PATH = os.path.join(os.path.dirname(__file__), 'models', NEURAL_MODEL_NAME)
-NEURAL_MODEL = initialize_neural_model(NUMBER_OF_FEATURES)
+NEURAL_MODEL = initialize_neural_model(NUMBER_OF_FEATURES, NEURAL_MODEL_PATH)
@@ -22,6 +22,7 @@ class Mention:
                  start_in_words, end_in_words):
         self.id = mnt_id
         self.set = ''
+        self.old_set = ''
         self.text = text
         self.lemmatized_text = lemmatized_text
         self.words = words
+import numpy
+
 from conf import NEURAL_MODEL, THRESHOLD
-from corneferencer.resolvers.vectors import create_pair_vector
+from corneferencer.resolvers.vectors import get_pair_vector
  
  
 # incremental resolve algorithm
 def incremental(text):
-    last_set_id = 1
+    last_set_id = 0
     for i, ana in enumerate(text.mentions):
         if i > 0:
             best_prediction = 0.0
             best_ante = None
-            for ante in text.mentions[:i:-1]:
-                pair_vec = create_pair_vector(ante, ana)
-                prediction = NEURAL_MODEL.predict(pair_vec)
-                accuracy = prediction[0]
-                if accuracy > THRESHOLD and accuracy > best_prediction:
-                    best_prediction = accuracy
+            for ante in text.mentions[:i]:
+                pair_vec = get_pair_vector(ante, ana)
+                sample = numpy.asarray([pair_vec], dtype=numpy.float32)
+                prediction = NEURAL_MODEL.predict(sample)[0]
+                if prediction > THRESHOLD and prediction >= best_prediction:
+                    best_prediction = prediction
                     best_ante = ante
             if best_ante is not None:
                 if best_ante.set:
@@ -29,7 +31,7 @@ def incremental(text):
 # entity based resolve algorithm
 def entity_based(text):
     sets = []
-    last_set_id = 1
+    last_set_id = 0
     for i, ana in enumerate(text.mentions):
         if i > 0:
             best_fit = get_best_set(sets, ana)
@@ -64,13 +66,13 @@ def get_best_set(sets, ana):
  
  
 def predict_set(mentions, ana):
-    accuracy_sum = 0.0
+    prediction_sum = 0.0
     for mnt in mentions:
-        pair_vec = create_pair_vector(mnt, ana)
-        prediction = NEURAL_MODEL.predict(pair_vec)
-        accuracy = prediction[0]
-        accuracy_sum += accuracy
-    return accuracy_sum / float(len(mentions))
+        pair_vec = get_pair_vector(mnt, ana)
+        sample = numpy.asarray([pair_vec], dtype=numpy.float32)
+        prediction = NEURAL_MODEL.predict(sample)[0]
+        prediction_sum += prediction
+    return prediction_sum / float(len(mentions))
  
  
 def remove_singletons(sets):
-import numpy
-
 from corneferencer.resolvers import features
  
-# input_1 to have shape (None, 1126) but got array with shape (1126, 1)
-def create_pair_vector(ante, ana):
+
+def get_pair_vector(ante, ana):
     vec = []
-    # ante_features = get_mention_features(ante)
-    # vec.extend(ante_features)
-    # ana_features = get_mention_features(ana)
-    # vec.extend(ana_features)
     vec.extend(ante.features)
     vec.extend(ana.features)
     pair_features = get_pair_features(ante, ana)
     vec.extend(pair_features)
-    return numpy.asarray([vec], dtype=numpy.float32)
+    return vec
  
  
 def get_mention_features(mention):
@@ -10,7 +10,7 @@ def eprint(*args, **kwargs):
     print(*args, file=sys.stderr, **kwargs)
  
  
-def initialize_neural_model(number_of_features):
+def initialize_neural_model(number_of_features, path_to_model):
     inputs = Input(shape=(number_of_features,))
     output_from_1st_layer = Dense(1000, activation='relu')(inputs)
     output_from_1st_layer = Dropout(0.5)(output_from_1st_layer)
@@ -22,4 +22,5 @@ def initialize_neural_model(number_of_features):
  
     model = Model(inputs, output)
     model.compile(optimizer='Adam', loss='binary_crossentropy', metrics=['accuracy'])
+    model.load_weights(path_to_model)
     return model