From c8ffdab68a98dd27eeb068cf8e9f54533682bddb Mon Sep 17 00:00:00 2001
From: SebastianCB <sebastian.carrillob01@gmail.com>
Date: Sun, 4 Dec 2022 11:59:45 -0500
Subject: [PATCH] Feat: Updated documentation

---
 app.py                    |  2 +-
 model_word2vec_service.py | 61 +++++++++++++++++++++++++++++----------
 2 files changed, 47 insertions(+), 16 deletions(-)

diff --git a/app.py b/app.py
index 4040dd9..5e31f5d 100644
--- a/app.py
+++ b/app.py
@@ -7,7 +7,7 @@
 clf = joblib.load('./models/logistic_regression.pkl')
 
 #comentario = "Me quiero suicidar este día no puede ser peor que el de ayer mi padre me odio y mi madre no me quiere ver"
-comentario = "Hoy juega Chelsea vs Barcelona y me siento emocionado"
+comentario = "Me quiero suicidar este día no puede ser peor que el de ayer mi padre me odio y mi madre no me quiere ver"
 # Preprocesado del comentario
 comentario_procesado = pp.preprocesamiento_con_ortografia(comentario)
 if comentario_procesado == "":
diff --git a/model_word2vec_service.py b/model_word2vec_service.py
index 9e8838a..6750f96 100644
--- a/model_word2vec_service.py
+++ b/model_word2vec_service.py
@@ -6,11 +6,15 @@ class ModelWord2Vec:
 
   def __init__(self):
     """
-    La función toma una lista de palabras y devuelve una lista de vectores.
+    Esta función carga el modelo Word2Vec de depresión.
     """
     self.model = Word2Vec.load('./depresion.model')
 
   def get_beck(self):
+    """
+    Abre el archivo JSON de los items del BECK vectorizados, lo lee y devuelve los datos del archivo JSON en un diccionario de Python
+    :return: Un diccionario de diccionarios.
+    """
     beck_data_preprocessing = {}
     try:
         if open('./JSON/items_preprocessing.json', 'r'):
@@ -19,19 +23,19 @@ def get_beck(self):
     except Exception as e:
       print(f'Error: {e}')
     return beck_data_preprocessing
+
   def get_model(self):
     """
-    me devuelve el modelo
-    :return: El modelo está siendo devuelto.
+    Retorna el Word Embedding.
+    :return: modelo Word2Vec de depresión.
     """
     return self.model
   
   def add_corpus(self, corpus):
     """
-    > La función toma un corpus (una lista de palabras) y lo agrega al modelo
+    > La función toma un corpus como entrada, lo agrega al modelo existente y guarda el modelo actualizado.
     
-    :param corpus: El corpus es una lista de listas. Cada lista es un documento. Cada documento es una
-    lista de palabras
+    :param corpus: El corpus es una lista de listas. Cada lista es un documento. Cada documento es una lista de palabras
     """
     corpus = [corpus]
     self.model.build_vocab(corpus, update=True)
@@ -39,26 +43,26 @@ def add_corpus(self, corpus):
 
   def save_model(self):
     """
-    Esta funcion guarda el modelo
+    Toma el modelo, y lo guarda como un archivo llamado 'depresion.model'
     """
     self.model.save('depresion.model')
 
   def get_cosine_similarity(self, corpus_a, corpus_b):
     """
-    La función toma dos cadenas como entrada y devuelve la distancia del coseno entre las dos cadenas.
+    > La función toma dos listas de palabras como entrada y devuelve la similitud del coseno entre las dos listas
     
-    :param corpus_a: El primer corpus a comparar
-    :param corpus_b: El corpus para comparar con el corpus_a corpus
-    :return: La distancia del coseno entre los dos corpus.
+    :param corpus_a: una lista de palabras
+    :param corpus_b: El corpus con el que comparar
+    :return: La similitud del coseno entre los dos documentos.
     """
     return self.model.wv.n_similarity(corpus_a, corpus_b)
 
   def get_word_vectors(self, corpus):
     """
-    > La función toma una list de palabras como entrada y devuelve el vector de 250D para esa palabra
+    Devuelve los vectores de palabras para las palabras del corpus.
     
-    :param word: La palabra cuya representación vectorial desea obtener
-    :return: La palabra vector para la palabra.
+    :param corpus: El corpus es la lista de palabras para las que desea obtener los vectores
+    :return: Los vectores de palabras para cada palabra en el corpus.
     """
     array_result = []
     for word in corpus:
@@ -69,6 +73,12 @@ def get_word_vectors(self, corpus):
     return array_result
 
   def get_cosine_similarity_BECK(self, corpus):
+    """
+    Esta función toma un corpus y devuelve una lista de similitudes de coseno entre el corpus y cada uno de los resultador del inventario de depresión de BECK (BDI-II) 90 resultados.
+    
+    :param corpus: el texto que desea comparar con el corpus BECK
+    :return: Una lista de similitudes de coseno entre el corpus y los datos de BECK.
+    """
     self.add_corpus(corpus)
     beck = self.get_beck()
     data = []
@@ -76,10 +86,15 @@ def get_cosine_similarity_BECK(self, corpus):
       for result in beck[item].keys():
         similarity = self.get_cosine_similarity(corpus, beck[item][result]["data"])
         data.append(similarity)
-    
     return data    
 
   def get_result_beck(self, cosine_similarities):
+    """
+    Toma las similitudes del coseno y devuelve los resultados de la encuesta llenada en una lista plana.
+    
+    :param cosine_similarities: las similitudes de coseno entre la consulta y los documentos
+    :return: Los resultados se devuelven como una lista de listas.
+    """
     results = []
     primera_parte = cosine_similarities[:60]  # 4 respuestas
     segunda_parte = cosine_similarities[60:67]  # 7 respuestas
@@ -95,6 +110,12 @@ def get_result_beck(self, cosine_similarities):
     return results_flat
 
   def getMaxBeck4Items(self, array):
+    """
+    Toma una matriz de números y devuelve una matriz del índice del número más grande en cada grupo de 4
+    
+    :param array: la matriz de números a procesar
+    :return: El índice del valor máximo en cada grupo de 4 elementos.
+    """
     results = []
     for index in range(0, len(array), 4):
       item = array[index: index + 4]
@@ -108,6 +129,12 @@ def getMaxBeck4Items(self, array):
     return results
 
   def getMaxBeck7Items(self, array):
+    """
+    Toma una matriz de números y devuelve una matriz de números.
+    
+    :param array: el conjunto de resultados del inventario de depresión de beck
+    :return: el valor máximo de cada grupo de 7 artículos.
+    """
     results_beck = [0, 1, 1, 2, 2, 3, 3]
     results = []
     for index in range(0, len(array), 7):
@@ -122,4 +149,8 @@ def getMaxBeck7Items(self, array):
     return results
 
   def getVector250(self):
+    """
+    Devuelve una lista de 250 ceros.
+    :return: Una lista de 250 ceros.
+    """
     return list(np.zeros(250))