说明 ================================================ 这是社会信息检索与计算课程的作业2的代码repo。本次 作业包括以下两部分: (1)给定两句话,计算这两句话的相似度; (2)根据向量空间模型,自行爬取一定网页内容,根据向量 空间模型,搭建一个简易搜索引擎。 由于中文需要分词,因此我调用了[SWCS中文分词系统]( https://github.com/hightman/scws/)在线分词API。 在此表示感谢。