Este repositório contém um script Python para a extração automatizada de informações específicas a partir de um texto, utilizando expressões regulares. As informações extraídas são armazenadas em um DataFrame do pandas e posteriormente exportadas para um arquivo Excel.
- Leitura de Arquivo: O script lê o conteúdo de um arquivo de texto.
- Extração de Dados: Utiliza expressões regulares para extrair informações específicas, como número do ofício, número do processo, juiz demandante, CPF/CNPJ, data de recepção, número do protocolo e ID de transferência.
- Armazenamento de Dados: Os dados extraídos são armazenados em um DataFrame do pandas.
- Exportação para Excel: O DataFrame é exportado para um arquivo Excel.
- Função extrair_dados: Responsável por aplicar expressões regulares no texto e retornar um dicionário com os dados extraídos.
- Leitura do Arquivo: O conteúdo do arquivo de texto é lido e armazenado em uma variável.
- Extração dos Dados: A função extrair_dados é chamada para processar o texto e extrair as informações.
- Criação do DataFrame: Um DataFrame do pandas é criado a partir dos dados extraídos.
- Exportação para Excel: O DataFrame é salvo em um arquivo Excel.
4) O arquivo informacoes_extraidas.xlsx será gerado no diretório atual contendo as informações extraídas.
- Python 3.x
- Pandas
Contribuições são bem-vindas! Sinta-se à vontade para abrir uma issue ou enviar um pull request.
Este projeto está licenciado sob a licença MIT. Consulte o arquivo LICENSE para obter mais informações.