NovelSpidersSimple

其实就是为了用iRead听小说，自己弄了一个小说的爬虫,使用这个脚本需要稍微知道一点html结构和node命令就行;

初次运行

如果是初次运行，请先执行npm install 根据package.json安装依赖;

正式运行

打开工程根目录book.config.js文件，这个文件是用来设置爬小说的源数据;


   const book = {
       'url': 'http://www.uctxt.com/book/5/5632/',//这是小说的目录页
       'href': 'http://www.uctxt.com/book/5/5632/',//这是小说的目录页
       'name': '修真聊天群',//设定保存的书名
       'listDom': '.chapter-list dd a',//小说列表的内容html结构
       'artTitle': '#BookTitle',//每一篇的标题html结构
       'artContent': '#content',//每一篇的内容html结构
       'index':0//从某章节索引开始
   };

#####在工程根目录打开控制端命令界面

执行npm run list，获取小说目录

执行npm run art，获取小说每一篇文章内容然后等着就好了

#依赖说明

##以下是使用到的第三方依赖 cheerio:数据抓取后，可在抓取后的数据中，像jq一样操作，访问页面中某html结构里的内容

fs:文件系统

path:路径系统

bufferhelper:node中对buffer更简便的语法糖

iconv-lite:非常有效的处理中文乱码

Name	Name	Last commit message	Last commit date
Latest commit xh476645818 Merge pull request #14 from xh476645818/xiaohe Apr 24, 2018 ddf262a · Apr 24, 2018 History 39 Commits
data	data	升级一下格式	Apr 24, 2018
modules	modules	升级一下格式	Apr 24, 2018
.gitignore	.gitignore	给目录和文章的采集都加了错误后继续访问，超时之后再加	Mar 5, 2018
README.md	README.md	提交一下文档	Mar 1, 2018
book.config.js	book.config.js	升级一下格式	Apr 24, 2018
package-lock.json	package-lock.json	第一次提交	Feb 26, 2018
package.json	package.json	补充一下文档和修改一下statecode	Mar 1, 2018
server.js	server.js	第一次提交	Feb 26, 2018

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NovelSpidersSimple

初次运行

正式运行

About

Releases

Packages

Languages

xh476645818/NovelSpidersSimple

Folders and files

Latest commit

History

Repository files navigation

NovelSpidersSimple

初次运行

正式运行

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages