update embeddings_rnn.py

d473b6ca · geni · eb0c57c1 · d473b6ca
Commit d473b6ca authored Jul 04, 2018 by geni
Showing with 14 additions and 12 deletions
embeddings_RNN.py
--- a/embeddings_RNN.py
+++ b/embeddings_RNN.py
@@ -12,7 +12,7 @@ from nltk.tokenize.casual import TweetTokenizer
 import numpy as np
 from keras.preprocessing.sequence import pad_sequences
 from keras.models import Sequential
-from keras.layers import Dense, LSTM, Embedding, Bidirectional, Conv1D, GlobalAveragePooling1D, MaxPooling1D, Dropout, Activation, Flatten
+from keras.layers import Dense, LSTM, Embedding, Bidirectional, Conv1D, GlobalAveragePooling1D, MaxPooling1D, Dropout, Activation, Flatten, GlobalMaxPooling1D
 from mpl_toolkits.axes_grid1.axes_size import Padded
 from keras.utils import np_utils
 from sklearn import metrics
@@ -127,7 +127,7 @@ def classification_embedings_rnn(tweets_train, tweets_train_labels_numeric, twee
    corpus_train_index = fit_transform_vocabulary(tweets_train)
    corpus_dev_index = fit_transform_vocabulary(tweets_dev)

-    max_len_input = 30
+    max_len_input = 27
               
    train_features_pad = sequence.pad_sequences(corpus_train_index, maxlen=max_len_input, padding="post", truncating="post", value = 0)
    padded_docs_dev = sequence.pad_sequences(corpus_dev_index, maxlen=max_len_input, padding="post", truncating="post", value = 0)
@@ -157,14 +157,15 @@ def classification_embedings_rnn(tweets_train, tweets_train_labels_numeric, twee
    model.add(e)
    #number of features:_32 each vector of 200 dim is converted to a vector of 32 dim
    
-    model.add(LSTM(128, return_sequences=True))
-    #model.add(Bidirectional(LSTM(128, return_sequences=True)))
-    
-    model.add(Dense(64, activation='relu', kernel_initializer=glorot_uniform(seed=RANDOM_SEED), activity_regularizer=regularizers.l2(0.0001)))
-    model.add(Dropout(0.25))
-    model.add(Flatten())
-    model.add(Dense(32, activation='relu', kernel_initializer=glorot_uniform(seed=RANDOM_SEED), activity_regularizer=regularizers.l2(0.0001)))
+    #model.add(LSTM(128, return_sequences=True))
+    model.add(Bidirectional(LSTM(128, return_sequences=True)))
+    model.add(Dense(128, activation='relu', kernel_initializer=glorot_uniform(seed=RANDOM_SEED), activity_regularizer=regularizers.l2(0.0001)))
    model.add(Dropout(0.5))
+    model.add(Dense(32, activation='relu', kernel_initializer=glorot_uniform(seed=RANDOM_SEED), activity_regularizer=regularizers.l2(0.001)))
+    model.add(GlobalMaxPooling1D())
+    #model.add(Dropout(0.25))
+    #model.add(Dense(16, activation='relu', kernel_initializer=glorot_uniform(seed=RANDOM_SEED), activity_regularizer=regularizers.l2(0.001)))
+    #model.add(Dropout(0.5))
    model.add(Dense(len(CLASSES), activation='softmax'))
    
    # summarize the model
@@ -175,10 +176,11 @@ def classification_embedings_rnn(tweets_train, tweets_train_labels_numeric, twee
    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['acc'])
    print("Training the model...")
    
-    earlyStopping = EarlyStopping('loss', patience=5, mode='min')
+    earlyStopping = EarlyStopping('loss', patience=3, mode='min')
    
-    model.fit(train_features_pad, tweets_train_labels_numeric, batch_size=32, epochs=50, verbose=1, validation_data=(train_features_pad,tweets_train_labels_numeric), callbacks=[earlyStopping])
-    loss, accuracy = model.evaluate(train_features_pad, tweets_train_labels_numeric, batch_size=32, verbose=1)
+#    model.fit(train_features_pad, tweets_train_labels_numeric, batch_size=32, epochs=50, verbose=1, validation_data=(train_features_pad,tweets_train_labels_numeric), callbacks=[earlyStopping])
+    model.fit(train_features_pad, tweets_train_labels_numeric, batch_size=64, epochs=30, verbose=1, callbacks=[earlyStopping])
+    loss, accuracy = model.evaluate(train_features_pad, tweets_train_labels_numeric, batch_size=64, verbose=1)
    print('Accuracy trainning: %f' % (accuracy*100))
    
    #prediction