Slightly different neural network model.

Bartłomiej Nitoń
1 parent 0d8e647d
Showing 3 changed files with 12 additions and 10 deletions
conf.py
corneferencer/resolvers/features.py
corneferencer/utils.py
@@ -6,7 +6,6 @@ from gensim.models.word2vec import Word2Vec
  
  
 CONTEXT = 5
-# THRESHOLD = 0.001
 RANDOM_WORD_VECTORS = True
 W2V_SIZE = 50
 W2V_MODEL_NAME = 'w2v_allwiki_nkjpfull_50.model'
@@ -14,7 +13,7 @@ W2V_MODEL_NAME = &#39;w2v_allwiki_nkjpfull_50.model&#39;
 # simple or siamese
 NEURAL_MODEL_ARCHITECTURE = 'simple'
 NUMBER_OF_FEATURES = 1190
-NEURAL_MODEL_NAME = 'model_1190_features.h5'
+NEURAL_MODEL_NAME = 'model_with_singletons.h5'
  
 FREQ_LIST_NAME = 'base.lst'
 LEMMA2SYNONYMS_NAME = 'lemma2synonyms.map'
@@ -174,14 +174,14 @@ def distances_vec(ante, ana):
     words_dist = [0] * 11
     words_bucket = 0
     if mnts_intersect != 1:
-        words_bucket = get_distance_bucket(ana.start_in_words - ante.end_in_words - 1)
+        words_bucket = get_distance_bucket(ana.start_in_words - ante.end_in_words)
     words_dist[words_bucket] = 1
     vec.extend(words_dist)
  
     mentions_dist = [0] * 11
     mentions_bucket = 0
     if mnts_intersect != 1:
-        mentions_bucket = get_distance_bucket(ana.position_in_mentions - ante.position_in_mentions - 1)
+        mentions_bucket = get_distance_bucket(ana.position_in_mentions - ante.position_in_mentions)
     if words_bucket == 10:
         mentions_bucket = 10
     mentions_dist[mentions_bucket] = 1
@@ -27,17 +27,20 @@ def initialize_neural_model(architecture, number_of_features, path_to_model):
 def initialize_simple_model(number_of_features, path_to_model):
     inputs = Input(shape=(number_of_features,))
  
-    output_from_1st_layer = Dense(1000, activation='relu')(inputs)
-    output_from_1st_layer = Dropout(0.2)(output_from_1st_layer)
+    output_from_1st_layer = Dense(500)(inputs)
     output_from_1st_layer = BatchNormalization()(output_from_1st_layer)
+    output_from_1st_layer = Activation('relu')(output_from_1st_layer)
+    output_from_1st_layer = Dropout(0.2)(output_from_1st_layer)
  
-    output_from_2nd_layer = Dense(500, activation='relu')(output_from_1st_layer)
-    output_from_2nd_layer = Dropout(0.2)(output_from_2nd_layer)
+    output_from_2nd_layer = Dense(200)(output_from_1st_layer)
     output_from_2nd_layer = BatchNormalization()(output_from_2nd_layer)
+    output_from_2nd_layer = Activation('relu')(output_from_2nd_layer)
+    output_from_2nd_layer = Dropout(0.2)(output_from_2nd_layer)
  
-    output_from_3rd_layer = Dense(300, activation='relu')(output_from_2nd_layer)
-    output_from_3rd_layer = Dropout(0.2)(output_from_3rd_layer)
+    output_from_3rd_layer = Dense(100)(output_from_2nd_layer)
     output_from_3rd_layer = BatchNormalization()(output_from_3rd_layer)
+    output_from_3rd_layer = Activation('relu')(output_from_3rd_layer)
+    output_from_3rd_layer = Dropout(0.2)(output_from_3rd_layer)
  
     output = Dense(1, activation='sigmoid')(output_from_3rd_layer)