-
Notifications
You must be signed in to change notification settings - Fork 60
/
Copy pathhelp.txt
101 lines (93 loc) · 4.75 KB
/
help.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
作业查重系统使用帮助(v3.0.0版)
一 快速入门
系统在window10,jdk11 64位下运行并通过测试。
1 程序代码的相似度检测
系统安装包解压后,在保证jdk安装配置正确的前提下,双击run.bat,启动系统主界面。
具体操作步骤如下:
(1)选择被检查文件目录。点击“选择作业”按钮,在文件选择对话框中,选择testdata
目录下的子目录,如“javaabctograde”子目录。
(2)确定检查参数。确认作业类型是“程序作业”,相似度限值适当,检测工具moss,检查的
程序语言java。
(3)执行比较。点击“执行比较”按钮,等待系统去stanford的moss系统网站,提交
“javaabctograde”下的扩展名为java的代码文件,并处理返回的结果,处理完毕后,会弹
出检查结束对话框,点确认。
(4)查看检查结果。 点击“查看结果”按钮,系统会打开“比较结果”窗口,以及启动默认浏览
器,显示相似作业比较的页面。
如果暂时不能上网,可以选择检测工具为jplag,在本地执行检测。
在系统的testdata目录下提供了程序代码的多种样例测试文档,供学习、测试使用。
2 文档文本的相似度检测
目前支持两种方式:
(1)使用shinglecloud算法比较。具体操作步骤和程序代码的检测步骤基本一致,只是选择作业类型时,
选择的是“文本作业”类型(如:testdata/doccn下的文件),文档文件的扩展名必须是txt、doc、
docx、pdf、html。
“文本作业”方式下的比较目前暂不支持通过浏览器网页进行可视化对比。
(2)使用jplag的GST算法比较。系统扩展了原Jplag的功能,增加了“doc”语言类型,可以检测多种格
式文档的相似度,并且支持基于网页的可视化比对。具体操作与“程序代码”检测的步骤相同,检测工具选择
Jplag,程序语言选“doc”即可。Jplag下的text语言类型更适合检测纯英文文档的相似度。
3 图片的相似度检测
(1)选择被检查图片文件目录,如testdata下的imgs目录。
(2)确定检查参数。确认作业类型是“图片”。
(3)执行比较。
(4)查看检查结果。
二 数据准备
系统支持2种数据输入格式.
格式1:
父目录
文件1
文件2
。。。
文件的命名以便于区分出文件作者为原则,如:姓名全拼_原文件名,例如Stu1_Sum.java。
具体格式及命名可以参考testdata子目录下的测试样例。
格式2:(需要使用“提取文件”功能,将文件转成格式1)
父目录
学生1压缩文件
学生2压缩文件
。。。
压缩文件必须是zip方式压缩, 推荐命名是姓名全拼_压缩文件名.zip,如Stu1_mid.zip
压缩文件内的格式举例如下:
Stu1_mid(父目录)
子目录
文件1
。。。
适合提交多文件或项目类(如eclipse项目)作业。文件1的命名采用姓名全拼_文件名。
方式二需要使用“提取文件”功能, 先将每个学生的作业压缩文件放在一个“源目录”下,然后指定
一个“目标目录”,用于存放提取后的文件,系统会先解压各个压缩文件,然后递归遍历每个目录下
的指定扩展名的文件,将找到的所有文件拷贝到“目标目录”。该“目标目录”即是“选择作业”所需
要指定的目录。
注意:对于moss方式检查的文件,其“目标目录”必须是系统内的子目录,建议在testdata下
建立目标目录。
三常见问题
(1)为何无法执行程序?
系统解压后,可以通过双击解压出的antiplag.jar文件执行程序,如果不行,可以双击
run.bat批处理文件来执行程序。如果仍不能执行程序,那么大多数情况下是JDK安装、配置不
正确,需要正确安装、配置指定版本的JDK。
(2)为何使用moss比较时,结果为空?
如果提示“执行失败”,说明执行比较的过程中出现了问题(常见的是网络问题),结果可能为空,
可以重新尝试;如果提示“执行完毕,未发现符合限值要求的结果”,说明执行成功,但没有超过
相似度限值的结果,此时结果也为空,为了得到结果,可以适当降低相似度限值。也有可能是没有
按要求将作业拷贝到testdata目录下。另外使用moss需要存取网络,应保证网络畅通。尽管
moss所在的服务器是24小时持续运行的,但偶尔也会停机维护,另外moss自在2022年,采取限流措施
,每个账号每天提交的文档不能超过100份,此情况下,可以使用jplag
或sim作为替代。如果jplag的结果也为空,则可能是文件扩展名与选定的程序语言不匹配造成的。
如语言选择了c,但提交了扩展名是java的代码文件。
(3)通过修改代码的注释、变量名、格式能影响比较结果吗?
简单说:不能。在参考别人代码的基础上,通过一些不影响程序结构的修改,来规避检查,是抄袭
者常用的手段,检测算法考虑到了此类问题,针对性的做了处理。
(4)程序能对文档中的图片进行比较吗?
不能。系统主要对文档中的文本内容进行比较。
(5)程序能发现从网络抄袭的程序和文档吗?
不能。系统只是对提交的作业之间的相似度进行比较,如果作业内容来自网络,又各不相同,系
统目前无法检测出此类情况。
(6)为何在执行比较的过程中,有时会出现长时间挂起的现象?
经过分析,此类现象可能出现在sim方式下,比较的文件数较大的时候(如500份以上),程序
实际仍在执行,但因算法问题,随着比较的文档数增加,耗费的时间将会明显增加。也可能出现在
moss方式下,由于网络速度慢或不稳定,造成长时间上传文件(特别是上传文件数较多、较大时)。
如果长时间没有响应(如大于10分钟),可以直接点击窗口关闭按钮,关闭程序,然后重试。
(7)如何具体查看两份作业之间的相似情况?
系统比较结束后会输出一个按相似度大小排序的作业之间互相比对的结果,可以根据此结果,
重点检查相似度高的作业之间的相似度,进而进一步确认是否存在抄袭现象,这需要人工比对。
在moss和jpag方式下,系统提供了通过浏览器加载比对页面,进行作业之间可视化比对的功能。
(8)为何提交的代码文件不能全部被比较?
主要原因有2个:一是文件扩展名与指定的语言类型不一致,二是代码文本比较前一般需要经过语法
解析器解析,如果不能通过解析器解析,则该文件不会被比较。
欢迎提出宝贵意见,联系方式: fanghong_jmi@sina.com