Skip to content

сервис по нахождению и хранению рабочих сайтов .narod.ru

Notifications You must be signed in to change notification settings

sh1nkey/narod-ru-parsing

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

50 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Это проект по парсингу сайтов narod.ru в исследовательских, нетсталкерских целях

alt text

Микросервисы:

  • parser. это клиент, который будетпарсить рандомные сайты с .narod.ru, и делать запросы на добавление в БД
  • letter-checker. для того, чтобы проверить, делался ли запрос на определённый нерабочий url или нет
  • db-backend. микросервис взаимодействия с БД существующих сайтов. добавляет сайты в БД, добавляет их описание
  • html-parser. микросервис очистки HTML кода от HTML
  • ai-summarizer. микросервис по сокращению текста

Полный пайплайн, задействующий все 4 микросервиса: parser (находит существующий сайт) => letter-checkr (проверяет, проверяли ли мы его и является ли он рабочим) => db-backend (пишет сайт в БД, делает запрос на добывку описания) => html-parser (очищает текст от HTML) => ai-summarizer (сокращает текст) => db-backend (пишет описание в БД)

некоторые шутки ещё дорабатываю, когда можно будет использовать - скажу :)

Как только доделаю, я добавлю в код бинарник для parse.go, вы сможете его скачать, и он будет слать запросы о сайтах на бэкенд. Таким образом, вы мне поможете, и станете нет-сталкерами :)

About

сервис по нахождению и хранению рабочих сайтов .narod.ru

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages