From 7f99ce4805e5ccb042c741b1380f16ea70cd25d1 Mon Sep 17 00:00:00 2001 From: SebastianCB Date: Sat, 3 Dec 2022 21:10:52 -0500 Subject: [PATCH] Feat: Added solution to errors --- app.py | 21 +++++++++++---------- preprocessing_service.py | 25 ++++++++++++++----------- 2 files changed, 25 insertions(+), 21 deletions(-) diff --git a/app.py b/app.py index 64565fd..5e31f5d 100644 --- a/app.py +++ b/app.py @@ -6,16 +6,17 @@ w2v = ModelWord2Vec() clf = joblib.load('./models/logistic_regression.pkl') -# Escribe un comentario triste y largo #comentario = "Me quiero suicidar este día no puede ser peor que el de ayer mi padre me odio y mi madre no me quiere ver" -comentario = "Hoy me siento feliz debido a que fue mi grado. La exposición salio todo y bien y me siento querido por mi familia" +comentario = "Me quiero suicidar este día no puede ser peor que el de ayer mi padre me odio y mi madre no me quiere ver" # Preprocesado del comentario comentario_procesado = pp.preprocesamiento_con_ortografia(comentario) -# Obtener la similitud de coseno entre el comentario y -# Cada una de las respuestas del inventario de depresión de BECK (BDI-II) -cosine_similarity_beck = w2v.get_cosine_similarity_BECK(comentario_procesado) -# Obtener la respuesta por item basandose en la similitud de coseno -results_beck = w2v.get_result_beck(cosine_similarity_beck) -print("El comentario lleno el inventario BECK de esta manera:", results_beck) - -print('Predicción:', clf.predict([results_beck])) +if comentario_procesado == "": + print("El comentario despúes del procesamiento no cuenta con la suficiente información para continuar con la impresión diagnostica") +else: + #Obtener la similitud de coseno entre el comentario y + #Cada una de las respuestas del inventario de depresión de BECK (BDI-II) + cosine_similarity_beck = w2v.get_cosine_similarity_BECK(comentario_procesado) + # Obtener la respuesta por item basandose en la similitud de coseno + results_beck = w2v.get_result_beck(cosine_similarity_beck) + print("El comentario lleno el inventario BECK de esta manera:", results_beck) + print('Predicción:', clf.predict([results_beck])) diff --git a/preprocessing_service.py b/preprocessing_service.py index 98993bc..cf8552c 100644 --- a/preprocessing_service.py +++ b/preprocessing_service.py @@ -44,17 +44,20 @@ def preprocesamiento_con_ortografia(self, texto): """ # Eliminar etiquetas y hashtags - texto = self.eliminar_etiquetados(texto) - texto = self.eliminar_emojis(texto) - texto = self.eliminacion_data_inutil(texto) - texto = self.correccion_ortografica(texto) - texto = self.normalizar(texto) - texto = texto.split(" ") - texto = self.lematizacion(texto) - texto = " ".join(texto) - texto = self.stop_words(texto) - texto = self.eliminar_duplicados(texto) - return texto + try: + texto = self.eliminar_etiquetados(texto) + texto = self.eliminar_emojis(texto) + texto = self.eliminacion_data_inutil(texto) + texto = self.correccion_ortografica(texto) + texto = self.normalizar(texto) + texto = texto.split(" ") + texto = self.lematizacion(texto) + texto = " ".join(texto) + texto = self.stop_words(texto) + texto = self.eliminar_duplicados(texto) + return texto + except: + return "" def preprocesamiento_sin_ortografia(self, texto):