Skip to content

🥈 Second Place Solution - Public Leaderboard Top 3 - 0.86639 | Clasificación de preguntas de clientes | Escuela de Ciencias Informáticas 2020. Universidad de Buenos Aires y Banco Santander.

Notifications You must be signed in to change notification settings

jeffersonlicet/santander-questions-classification

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Santander Questions Classification 2020 - Second Place

🏅 TOP 3 - 0.86639

Exploración de datos y explicación de la solución:

https://github.com/jeffersonlicet/santander-questions-classification/blob/master/Informe.ipynb

Solución:

Indicaciones para entrenar los modelos:

Se adjuntan 4 archivos:

  • LSTM_GRU_0_86.ipynb Notebook con todo el código para entrenar los modelos basados en LSTM y GRU
  • BERT_0_86.ipynb Notebook con todo el código para entrenar el modelo basado en BERT
  • Informe.ipynb Notebook con el informe y el análisis de datos.
  • assemble.py Script que ensambla las predicciones de los 3 modelo y genera un archivo listo para ser enviado a la competencia.

1: Entrenar los modelos:

Correr los notebooks preferiblemente en paralelo y utilizando Google Colaboratory.

  • LSTM_GRU_0_86.ipynb con GPU Activado
  • BERT_0_86.ipynb con TPU Activado

2: Descargar los archivos

Una vez finalizado el entrenamiento, que toma algo más de una hora, ambos notebooks van a intentar descargar archivos, en caso de que no posean permisos para descargarlos por parte del browser puede intentar descargarlos manualmente.

3: Ensamblar la solución

Archivos que deben estar descargados y en el mismo directorio:

  • test_ids.npy Contiene los ids de los casos de testing
  • labels.npy Contiene los nombres de las clases mapeadas a indices
  • bert.npy Contiene la distribución de probabilidad calculada usando BERT
  • lstm.npy Contiene la distribución de probabilidad calculada usando LSTM
  • gru.npy Contiene la distribución de probabilidad calculada usando GRU

Con los archivos en el mismo directorio que el archivo assemble.py que se encuentra adjuntado realizar lo siguiete:

pip install numpy

y luego

python assemble.py

Finalmente se va a generar un archivo llamado submission.csv con las predicciones correspondientes.

Gracias.

About

🥈 Second Place Solution - Public Leaderboard Top 3 - 0.86639 | Clasificación de preguntas de clientes | Escuela de Ciencias Informáticas 2020. Universidad de Buenos Aires y Banco Santander.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published