Com o Cloud CNPJ, você tem acesso aos dados das empresas brasileiras, obtidos do site oficial da Receita Federal e disponibilizados gratuitamente.
Neste momento, estamos fornecendo os dados de forma gratuita por meio de uma tabela no Google BigQuery. Pretendemos, em breve (buscando alternativas de baixíssimo custo), disponibilizar uma API.
Toda a infraestrutura para obtenção, tratamento e distribuição dos dados está hospedada no Google Cloud Platform. As etapas citadas abaixo são orquestradas por um fluxo no Google Workflow.
Os arquivos são obtidos do repositório oficial da Receita Federal e armazenados em um bucket privado no Google Cloud Storage por meio de um job criado no Google Cloud Run.
Para obter mais detalhes sobre a obtenção dos arquivos, acesse ingestion.
Fazendo uso do BigQuery Data Transfers, esses arquivos são migrados e se transformam em registros brutos dentro de tabelas do BigQuery, tornando-se posteriormente registros tratados em outras tabelas a partir de execuções de queries agendadas.
A etapa de transformação dos dados é detalhada em prepare.
Essas tabelas com dados tratados são disponibilizadas ao público e podem ser consultadas por qualquer usuário com conta no Google Cloud.
Mais detalhes sobre como consumir os dados estão disponíveis em use.
- Acesse o Google Cloud e clique em Comece a usar gratuitamente.
- Caso não possua um e-mail Google, opte por Criar conta e siga os passos.
- Você será direcionado para a página de Billing, mas não se preocupe: não haverá cobranças.
- Acesse o Console do BigQuery para execução de comandos SQL.
- Execute o comando abaixo e tenha acesso aos dados de empresas do Brasil gratuitamente.
select *
from `cloud-cnpj.gold.estabelecimentos`
limit 10;
select *
from `cloud-cnpj.gold.estabelecimentos`
where cnpj = '00000000188484';
select *
from `cloud-cnpj.gold.estabelecimentos`
where razao_social = 'BANCO DO BRASIL SA';
select *
from `cloud-cnpj.gold.estabelecimentos`
where situacao_cadastral.codigo = '02' -- empresas ativas
limit 10;
select *
from `cloud-cnpj.gold.estabelecimentos`
where simples.opcao = true -- empresas optantes pelo Simples Nacional
limit 10;
select *
from `cloud-cnpj.gold.estabelecimentos`
where cnpj_basico = '00000000'; -- empresas matriz e suas filiais
select *
from `cloud-cnpj.gold.estabelecimentos` e,
unnest(e.socios) as s
where lower(normalize(s.nome, nfd)) = 'jair messias bolsonaro'; -- empresas por sócio
O Google Cloud possui um nível de acesso gratuito. Quando falamos mais especificamente sobre o BigQuery, os primeiros 1TB de dados consultados no mês são gratuitos (a tabela estabelecimentos toda possui cerca de 40GB), conforme informado nesta página.
Contribuições são bem-vindas! Consulte o arquivo CONTRIBUTING.md
para diretrizes.
Este projeto está licenciado sob a MIT License - veja o arquivo LICENSE
para mais detalhes.
Made with ❤️ in Curitiba 🌳 ☔️