Skip to content

其实就是为了用iread听小说,自己弄了一个小说的爬虫

Notifications You must be signed in to change notification settings

xh476645818/NovelSpidersSimple

Repository files navigation

NovelSpidersSimple

其实就是为了用iRead听小说,自己弄了一个小说的爬虫,使用这个脚本需要稍微知道一点html结构和node命令就行;

初次运行

如果是初次运行,请先执行npm install 根据package.json安装依赖;

正式运行

打开工程根目录book.config.js文件,这个文件是用来设置爬小说的源数据;


   const book = {
       'url': 'http://www.uctxt.com/book/5/5632/',//这是小说的目录页
       'href': 'http://www.uctxt.com/book/5/5632/',//这是小说的目录页
       'name': '修真聊天群',//设定保存的书名
       'listDom': '.chapter-list dd a',//小说列表的内容html结构
       'artTitle': '#BookTitle',//每一篇的标题html结构
       'artContent': '#content',//每一篇的内容html结构
       'index':0//从某章节索引开始
   };
   
   

#####在工程根目录打开控制端命令界面

执行npm run list,获取小说目录

执行npm run art,获取小说每一篇文章内容 然后等着就好了

#依赖说明

##以下是使用到的第三方依赖 cheerio:数据抓取后,可在抓取后的数据中,像jq一样操作,访问页面中某html结构里的内容

fs:文件系统

path:路径系统

bufferhelper:node中对buffer更简便的语法糖

iconv-lite:非常有效的处理中文乱码

About

其实就是为了用iread听小说,自己弄了一个小说的爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published