Com este código, a partir de palavras chaves, será feita a detecção e armazenamento de faces encontradas nos vídeos publicados no Twitter
1 - Acesse a pasta raiz do projeto
cd Twitter_Facial_Detect
2 - Instale as Libs necessárias
pip install -r requirements.txt
3 - Adicione palavras chaves no arquivo query.txt
(Separadas por quebra de linha)
4 - Execute o Script
python3 main.py
python3 main.py -p [PATH_DO_QUERY.txt]
Todos os dados serão salvos na pasta data
-
Download do Firefox, caso necessário. (código em
firefox_downloader.py
)
1- Download pelo servidor ftp.mozilla.org
2- Extração do ZIP para a pastadownloads/firefox
-
WebScraping com o Selenium-Wire na página de pesquisa do Twitter, filtrado pela palavra chave e por vídeos. (código em
twitter_scraping.py
)
1- Load do Firefox controlado pelo Selenium
2- GET na URL
3- Análise do tráfico de rede da página
4- GET de todos os vídeos disponíveis -
Análise dos vídeos e armazenamento dos arquivos. (código em
main.py
)
1- Detecção de faces para cada vídeo encontrado na etapa 2
2- Armazenamento das faces na pastadata/PALAVRA_CHAVE_face_crop/frame_(CONTAGEM_DE_FRAMES)_face_CONTAGEM_DE_FACES.png
3- Armazenamento de cada frame que contenha 1 ou + facesdata/PALAVRA_CHAVE/frame_CONTAGEM_DE_FRAMES.png
Número de tentativas para pegar links dos vídeos. Para cada tentativa o Scroll da página será setado para TAMANHO_DA_JANELA*(NUM_TENTATIVA/2)