Skip to content

Ingestão, preparação e disponibilização gratuita de dados de CNPJs de empresas do Brasil no Google Cloud.

License

Notifications You must be signed in to change notification settings

Bruno-Furtado/cloud-cnpj

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🇺🇸 English version

Cloud CNPJ

Acesso gratuito aos dados de empresas do Brasil

Com o Cloud CNPJ, você tem acesso aos dados das empresas brasileiras, obtidos do site oficial da Receita Federal e disponibilizados gratuitamente.

Neste momento, estamos fornecendo os dados de forma gratuita por meio de uma tabela no Google BigQuery. Pretendemos, em breve (buscando alternativas de baixíssimo custo), disponibilizar uma API.

🩺 Como funciona

Toda a infraestrutura para obtenção, tratamento e distribuição dos dados está hospedada no Google Cloud Platform. As etapas citadas abaixo são orquestradas por um fluxo no Google Workflow.


Cloud CNPJ

1. Ingestão

Os arquivos são obtidos do repositório oficial da Receita Federal e armazenados em um bucket privado no Google Cloud Storage por meio de um job criado no Google Cloud Run.

Para obter mais detalhes sobre a obtenção dos arquivos, acesse ingestion.

2. Preparação

Fazendo uso do BigQuery Data Transfers, esses arquivos são migrados e se transformam em registros brutos dentro de tabelas do BigQuery, tornando-se posteriormente registros tratados em outras tabelas a partir de execuções de queries agendadas.

A etapa de transformação dos dados é detalhada em prepare.

3. Uso

Essas tabelas com dados tratados são disponibilizadas ao público e podem ser consultadas por qualquer usuário com conta no Google Cloud.

Mais detalhes sobre como consumir os dados estão disponíveis em use.

🚴‍♂️ Como utilizar

  1. Acesse o Google Cloud e clique em Comece a usar gratuitamente.
  2. Caso não possua um e-mail Google, opte por Criar conta e siga os passos.
  3. Você será direcionado para a página de Billing, mas não se preocupe: não haverá cobranças.
  4. Acesse o Console do BigQuery para execução de comandos SQL.
  5. Execute o comando abaixo e tenha acesso aos dados de empresas do Brasil gratuitamente.
select *
from `cloud-cnpj.gold.estabelecimentos`
limit 10;

select *
from `cloud-cnpj.gold.estabelecimentos`
where cnpj = '00000000188484';

select *
from `cloud-cnpj.gold.estabelecimentos`
where razao_social = 'BANCO DO BRASIL SA';

select *
from `cloud-cnpj.gold.estabelecimentos`
where situacao_cadastral.codigo = '02' -- empresas ativas
limit 10;

select *
from `cloud-cnpj.gold.estabelecimentos`
where simples.opcao = true -- empresas optantes pelo Simples Nacional
limit 10;

select *
from `cloud-cnpj.gold.estabelecimentos`
where cnpj_basico = '00000000'; -- empresas matriz e suas filiais
 
select *
from `cloud-cnpj.gold.estabelecimentos` e,
unnest(e.socios) as s
where lower(normalize(s.nome, nfd)) = 'jair messias bolsonaro'; -- empresas por sócio

O Google Cloud possui um nível de acesso gratuito. Quando falamos mais especificamente sobre o BigQuery, os primeiros 1TB de dados consultados no mês são gratuitos (a tabela estabelecimentos toda possui cerca de 40GB), conforme informado nesta página.

🛠️ Contribuição

Contribuições são bem-vindas! Consulte o arquivo CONTRIBUTING.md para diretrizes.

📜 Licença

Este projeto está licenciado sob a MIT License - veja o arquivo LICENSE para mais detalhes.


Made with ❤️ in Curitiba 🌳 ☔️

About

Ingestão, preparação e disponibilização gratuita de dados de CNPJs de empresas do Brasil no Google Cloud.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Sponsor this project