- Renato Penha - Professor orientador
- Victor Hayashi - Professor de programação
Este projeto é uma implementação do modelo Bag of Words para processamento de linguagem natural (NLP), seguindo o tutorial disponível no Kaggle (Bag of Words Model for Beginners). O objetivo é desenvolver um código Python no Google Colab com base no tutorial e aplicar o modelo em diferentes conjuntos de frases para observar seus efeitos e resultados.
-
Implementação Baseada no Tutorial: Seguir a implementação guiada do modelo Bag of Words, conforme descrito no tutorial do Kaggle, adaptando o código para ser executado no Google Colab.
-
Organização das Etapas: Estruturar o código em seções bem definidas, cada uma com uma descrição clara da sua funcionalidade e propósito no processamento do texto.
-
Testes com Diferentes Frases: Realizar testes com 50 frases, divididas em 25 frases em inglês e 25 frases em português, para analisar a eficácia do modelo em diferentes idiomas. Para este passo, é permitido o uso de bibliotecas adicionais que auxiliem no processamento de textos em português.
README.md
: Documentação do projeto.bag_of_words.ipynb
: Notebook Jupyter com a implementação do modelo Bag of Words e os testes realizados com frases em inglês e português.
GANDHI, Vipul. Bag of Words Model for Beginners. Kaggle, 2023. Disponível em: https://www.kaggle.com/code/vipulgandhi/bag-of-words-model-for-beginners. Acesso em: 06 maio 2024.