Skip to content

Latest commit

 

History

History
42 lines (29 loc) · 1.56 KB

TECHS.md

File metadata and controls

42 lines (29 loc) · 1.56 KB

Tecnologias Recomendadas para a Biblioteca de Análise de Sentimento

Para construir uma biblioteca de análise de sentimento eficiente e diferenciada, podemos combinar tecnologias robustas e modernas:


1. Linguagem Principal

  • Python: Popular para NLP, com excelente suporte a bibliotecas e modelos de machine learning.
  • Alternativa: JavaScript (para bibliotecas executadas no navegador ou em backends baseados em Node.js).

2. Frameworks e Bibliotecas de NLP

  • spaCy: Para processamento de linguagem natural com modelos otimizados e extensíveis.
  • Transformers (Hugging Face): Para usar modelos pré-treinados de NLP (BERT, RoBERTa) com suporte a português.
  • NLTK ou TextBlob: Para análises mais simples e rápidas.

3. Dados de Treinamento

  • Open Source Datasets:
    • Corpus Brasileiro: Dataset público para português.
    • Opiniões de usuários (anônimos e legais) coletados da R360 (com permissão).
  • Ferramentas de Etiquetagem:
    • Doccano ou Prodigy para rotular textos e criar datasets personalizados.

4. Deploy e Integração

  • FastAPI ou Flask: Para expor a biblioteca como uma API.
  • PyPI: Publicar a biblioteca como pacote Python para fácil instalação.
  • Docker: Para fornecer uma versão containerizada para desenvolvedores.

5. Ferramentas de Suporte

  • Jupyter Notebooks: Para experimentação e demonstrações.
  • GitHub Actions: Para testes automáticos e deploy contínuo.
  • Sphinx: Para gerar documentação detalhada.