Skip to content

bluebeach/BfsCrawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

BfsCrawler

a Zhihu BfsCrawler in Java

这是一个实现了宽度优先的知乎网络爬虫。

下载使用的是HttpClient工具,解析页面使用的是HtmlParser,未来还可以考虑使用Jsoup。

通过两个队列,visitedUrl和unVisitedUrl实现了宽度优先爬取。

单线程。

自动爬取知乎推荐的文章存储到本地指定文件中。

About

a Zhihu BfsCrawler in Java

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published