Проект асинхронного парсинга документации PEP

Описание

Выполняется парсинг данных со страницы с общей информацией о PEP (https://peps.python.org/), переход по ссылкам и сбор данных о каждом PEP. Парсер подготавливает данные и сохраняет их в два файла формата csv в папку results.

Перед использованием

Клонируйте репозиторий к себе на компьютер:

git clone https://github.com/94R1K/scrapy_parser_pep.git

В корневой папке создайте виртуальное окружение и установите зависимости:

python -m venv venv

pip install -r requirements.txt

Запуск парсера из командной строки:

scrapy crawl pep

Вывод результатов

Результатом работы парсера будет создание двух файлов:

pep_ДатаВремя.csv - содержит список всех PEP (number, name, status);
status_summary_ДатаВремя.csv - содержит сводку по статусам PEP: сколько найдено документов в каждом статусе (Status, Quantity). В последней строке этого файла в колонке Total выводится общее количество всех документов.

Об авторе

Лошкарев Ярослав Эдуардович
Python-разработчик (Backend)
Россия, г. Москва
E-mail: real-man228@yandex.ru

Name	Name	Last commit message	Last commit date
Latest commit Ярослав Лошкарев Update README.md Oct 6, 2023 7e2835d · Oct 6, 2023 History 7 Commits
pep_parse	pep_parse	Final	Apr 11, 2023
results	results	Final	Apr 11, 2023
tests	tests	Final	Apr 10, 2023
.flake8	.flake8	Initial commit	Apr 2, 2023
.gitignore	.gitignore	Initial commit	Apr 2, 2023
README.md	README.md	Update README.md	Oct 6, 2023
pytest.ini	pytest.ini	Initial commit	Apr 2, 2023
requirements.txt	requirements.txt	Initial commit	Apr 2, 2023
scrapy.cfg	scrapy.cfg	Final	Apr 10, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Проект асинхронного парсинга документации PEP

Описание

Перед использованием

В корневой папке создайте виртуальное окружение и установите зависимости:

Запуск парсера из командной строки:

Вывод результатов

Об авторе

About

Releases

Packages

Languages

94R1K/scrapy_parser_pep

Folders and files

Latest commit

History

Repository files navigation

Проект асинхронного парсинга документации PEP

Описание

Перед использованием

В корневой папке создайте виртуальное окружение и установите зависимости:

Запуск парсера из командной строки:

Вывод результатов

Об авторе

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages