Выполняется парсинг данных со страницы с общей информацией о PEP (https://peps.python.org/),
переход по ссылкам и сбор данных о каждом PEP.
Парсер подготавливает данные и сохраняет их в два файла формата csv
в папку results
.
Клонируйте репозиторий к себе на компьютер:
git clone https://github.com/94R1K/scrapy_parser_pep.git
python -m venv venv
pip install -r requirements.txt
scrapy crawl pep
Результатом работы парсера будет создание двух файлов:
pep_ДатаВремя.csv
- содержит список всех PEP (number
,name
,status
);status_summary_ДатаВремя.csv
- содержит сводку по статусам PEP: сколько найдено документов в каждом статусе (Status
,Quantity
). В последней строке этого файла в колонкеTotal
выводится общее количество всех документов.
Лошкарев Ярослав Эдуардович
Python-разработчик (Backend)
Россия, г. Москва
E-mail: real-man228@yandex.ru