如何理解查重报告的相似率?当一篇文章经论文查重软件检测后,相似率是同学们最关心的结果。因为我们很容易把注意力放在这个表示有问题的数字上,所以新用户通常会问的问题是“什么样的重复率说明有问题?
这个问题的答案是,没有一个“神奇的数字”能够告诉你一篇文章是否包含有问题的内容。相似率只是为你提供一个粗略的“总体结果”,以确保你能够直接注意到那些有大量重复的文章,而快速忽略掉几乎没有重复的文章。除此之外,相似率本身不会给你确切的答案,也绝对不能告诉你这篇文章是否有抄袭的情况。
为什么会这样呢?
查阅论文查重报告的重要性
其实,当评估一篇文章的整体重复率时要考虑到若干因素。
首先,需要注意的是相似率告诉你的是一篇文章中和其他文章相同 (即所谓的匹配)的文字的总量。这个总量可能是由许多较小的匹配组成的。相似率30%有可能是指30%匹配同一篇文章,但更有可能的情况是,这30%是由许多较小的匹配相加而成,这些小的匹配最大都不超过4或5%。这只有在看详细的论文查重报告时才能看出来。
当然,一篇有6个5%匹配的文章可能和一篇30%都抄自同一篇文章的文章一样有抄袭的问题。不过不看查重报告就没法确定了。
其次,匹配出现在文章的哪一部分有时比到底有多少文字匹配更重要。例如,某些学科领域的编辑可能不太在意方法部分的重复,因为要描述一个过程也只有那么多的方式。而另一方面,在讨论或结论部分的匹配,尽管它可能只占手稿的一小部分,如果没有适当的引用,也会引起编辑的怀疑。
同样的,一类文章的可接受的阈值未必适合另一类型的文章:综述文章相似率通常会比研究文章高一些。
同样需要记住的是在未编辑的手稿中可能存在一些简单地错误而导致查重软件错误地标出存在匹配的部分。查重软件的排除书目功能是依赖于在文章的参考文献部分有一行是reference这个标题。如果这个标题在手稿中被省略,参考文献部分将不被系统识别不被排除在外。