首页>论文写作>论文查重>论文检测后,要学会修改重复率

论文检测后,要学会修改重复率

2021-04-18|作者:www.paper120.net

CNKI是连续的字数相同不能超过13个字,万方是连续的字数相同不能超过15个字。否则就会

标注出来,算进重复率。我们学校规定是CNKI检测重复率不能超过30%.两种数据库检测重复率

会有结果上的误差,一般CNKI会更严格一点,先在用万方检测一下,然后对照重复段落,句子

反复修改一下,最后用CNKI检测一下,就放心了。

  现在是学生写作毕业论文的关键时期,许多学生在论文写作中要利用一些文献资料,这样

就涉及到一个问题,如何应用别人的文献资料,如何形成一个良好的学术规范,避免抄袭。这在

现在是一个非常迫切的问题,但是我们许多同学缺乏严格的训练,也不知道什么情况下是抄袭,

什么情况下是引用别人的文章。在这里我想对这个问题作出一个简单的讨论。这仅仅只能算是个

抛砖引玉而已,目的是想和大家一起讨论这个话题。什么是抄袭行为?简单地说就是使用了别人

的文字或观点而不注明就是抄袭。“照抄别人的字句而没有注明出处且用引号表示是别人的话,

都构成抄袭。美国现代语言联合会《论文作者手册》对剽窃(或抄袭)的定义是:‘剽窃是指在你

的写作中使用他人的观点或表述而没有恰当地注明出处。……这包括逐字复述、复制他人的写作

或使用不属于你自己的观点而没有给出恰当的引用。可见,对论文而言,剽窃有两种:一种是剽

窃观点,用了他人的观点而不注明,让人误以为是你自己的观点;一种是剽窃文字,照抄别人的

文字表述而没有注明出处且用引号,让人误以为是你自己的表述。当然,由于论文注重观点的原

创性,前者要比后者严重。至于普及性的文章却有所不同,因为并不注重观点的原创性,所以并

不要求对来自别人的观点一一注明,因此只看重文字表述是否剽窃。”那么如何使用别人的文献资

料呢?美国哈佛大学在其相关的学生手册中指出,如果你的句子与原始资料在观点和句子结构上

都非常相似,并且结论与引语相近而非用自己的话重述,即使你注明出处,这也是抄袭。你不能

仅仅简单改变原始资料中的几个词语或者对其进行摘要总结,你必须用你自己的语言和句子结构

彻底地重塑你的总结,要不就直接引用。”(引自哈佛大学的相关规定,该原文是我1年前看到的

现在找不到出处了)。可见,对别人的内容的使用必须进行全面的重写,否则就有抄袭的嫌疑。

但这里要避免胡乱拼凑和揉合。总之来说,我们必须尊重别人的智力成果,在文章中反映出哪些

是你做的哪些是别人做的。当然现在做到这些还很难,但我想我们至少要有这个意识,因为在剽

窃的概念里,除过强调未注明这点外,还强调不是成心的。我们许多人写东西,正是因为不知道

什么是抄袭,如何避免抄袭才犯了错误,所以明确什么是抄袭非常重要。从现实来看,我们的同

学要写一篇10000字左右的没有任何抄袭嫌疑的毕业论文是很困难的,但是我们至少应该从主观

上尽可能的避免出现严重抄袭行为,逐步形成好的习惯。

  在国内就是知网/维普/万方这三大系统,这里面的资源是不断更新的,每一年毕业生的论文

除有保密要求外的基本上都是收这三大系统收录作为比对资源库,所以你就可不能大意啊!!国内

就是三大系统,知网/维普/万方知网不对个人开放,维普及万方对个人开放万方不检测互联网及英

文,知网及维普都检测互联网及英文。现在,所有学校对于硕士、博士毕业论文,必须通过论文检测

查重才能算合格过关。本科毕业生,大部分211工程重点大学,采取抽检的方式对本科毕业论文进

行检测查重。抄袭或引用率过高,一经检测查重查出超过百分之三十,后果相当严重。相似百分之五

十以下,延期毕业,超过百分之五十者,取消学位。辛辛苦苦读个大学,花了好几万,加上几年时

间,又面临找工作,学位拿不到多伤心。但是,所有检测系统都是机器,都有内在的检测原理,

我们只要了解了其中内在的检测原理、系统算法、规律,通过检测报告反复修改,还是能成功通过

检测,轻松毕业的。

  大概当今所有的研究生毕业论文都会经过中国知网的“学术不端检测”,即便最后不被盲审。

这个系统的初衷其实是很好的,在一定程度上能够对即将踏入中国科研界的硕士研究生们一个警示

作用:杜绝抄袭,踏实学问。但正所谓“世界万物,有矛就有盾”的哲学观,中国知网的这个“学术不

端检测系统”并不是完善的。原因有二,其一是目前的图文识别技术还不够先进;其二是目前的机

器识别还达不到在含义识别上的智能化。求索阁一贯的观点就是“战略上蔑视,战术上重视”和“知

己知彼百战百胜”。要破敌,必先知敌;要过学术检测这一关,当然必先了解这一关的玄机。 

    一、查重原理

 

  1、知网学位论文检测为整篇上传,格式对检测结果可能会造成影响,需要将最终交稿格式提

交检测,将影响降到最小,此影响为几十字的小段可能检测不出。对于3万字符以上文字较多的论

文是可以忽略的。对比数据库为:中国学术期刊网络出版总库,中国博士学位论文全文数据库/中

国优秀硕士学位论文全文数据库,国重要会议论文全文数据库,中国重要报纸全文数据库,中国

专利全文数据库,个人比对库,其他比对库。部分书籍不在知网库,检测不到。

  2、上传论文后,系统会自动检测该论文的章节信息,如果有自动生成的目录信息,那么系统

会将论文按章节分段检测,否则会自动分段检测。

  3、有部分同学反映说自己在段落中明明引用或者抄袭了其他文献的段落或句子,为什么没有

检测出来,这是正常的。中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为5%,以段

落计,低于5%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。

举个例子:假如检测段落1有10000字,那么引用单篇文献500字以下,是不会被检测出来的。实际

上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选一篇文章来引用,尽可能多的

选择多篇文献,一篇截取几句,这样是不会被检测出来的。

  4、一篇论文的抄袭怎么才会被检测出来?知网论文检测的条件是连续13个字相似或抄袭都

会被红字标注,但是必须满足3里面的前提条件:即你所引用或抄袭的A文献文字总和在你的各

个检测段落中要达到5%。

  (1)知网查重时,黄色的文字是“引用”,红色的文章是“涉嫌剽窃”。

  (2)知网查重时,只查文字部分,“图”、“mathtype编辑的公式”、“word域代码”是

不查的(要想知道知网到底查那些部分,可以“全选”——“复制”——“选择性粘贴”——

“只保留文字”)。建议公式用mathtype编辑,不要用word自带的公式编辑器。

  (3)word、excel编辑的“表”是可以查出来的。在某些被逼无奈的情况下,可以选择把表

截图放到论文里边去!作者亲眼见过有同学自己编的系数,查出来居然跟人家重了,数据决定了

系数还不能变,欲哭无泪……

  (4)参考文献的引用也是要算重复率的(包括在学校要求的X%以内)!所以引用人家文献

的时候最好用自己的话改写一下。

  (5)知网的查重是以“章”为基本单元的。比如“封面”、“摘要”、“绪论”都会作为单

独的一章,每一章出一个检测结果,标明重复率。每一章有单独的重复率,全文还有一个总的重复

率。有些学校在规定论文是否通过查重时,不仅要求全文重复率不能超过多少,还对每章重复率也

有要求。

  (6)知网查重的确是以“连续13个字与别的文章重复”做为判断依据的,跟之前网上一些作

者说的情况一致。如果你能够把论文改到任何一句与别的文章保证任意连续13个字都不一样,知

网是查不出来的。

  (7)但是,如果你有一处地方超过13个字与别的文章重复,知网的服务器都对这处地方的

前后进行模糊搜索,那些仅仅是简单的加了一些“的”、“在……时”、“但是”等词语来隔断

13个字多数情况是会检测出来的。这些模糊搜索有时候非常傻,可能会把一篇写如何养猪的文章

跟你的那篇写建筑的文章关联到一起,说你涉嫌抄袭!遇到这种情况,你就自己”呵呵“吧!

  (8)书、教材在知网的数据库里是没有的。但是,copy书的同学需要注意,你copy的那部

分可能已经被别的文章抄过了,检测的时候就重复了。这样的情况经常出现,尤其是某些经典理

论,用了上百年了,肯定有人写过了!当然,有些同学觉得用自己的话改写一下就ok了。但现实

情况是:这些经典理论用自己的话写了也一样有”标红“的可能,因为这些经典的理论已经被人翻

来覆去写了N遍了!会不会”标红“就看你人品了!作者查重时,曾出现过一段话用自己的语言翻来

覆去改了三遍仍然”标红“的情况,让人哭笑不得。只能说作者当时人品衰得没办法了,但愿现在发

的这篇文章能攒些人品,以待来日!

  (9)网络上的某些内容也是在知网的数据库里的。比如:“百度文库”、“道客巴巴”、“豆

丁网”、“互动百科”、“百度百科”。作者查重的时候,甚至还遇到很多奇葩的网站,神马“东

方财富网博客”、“人大经济论坛”。所以,选择网上的内容时要慎重。

  (10)外文文献,知网数据库里存储较少。鼓励大家多看外文文献,

多学习国外的先进科学知识、工程技术,翻译过来,把它们应用到我国的社会主义现代化论文中来!

  (11)建议各位学校查重前,在网上先自费查一遍。检测报告会对重复的地方”标红“,

先修改一遍。

  (12)检测一遍修改完成后,同学们不要掉以轻心。因为知网查重最变态、最令人愤怒的

地方来了:第一次查重没有“标红”的地方,第二遍可能会出现“标红”,说你是抄袭。舍得花钱的

话,在网上花钱再查一遍,直到低于学校要求的重复率。

  (13)网上现在常用的查重有”万方“、”知网“、”paperpass“, paperpass最松,

万方居中,知网最严。万方的数据库不全,查出来重复率会低于知网5%,知网是以”连续

13个字一样“就算重复,所以查出来重复率较高!

  最好选择用万方先预查,改完的通过率一般较高。

  1、如果是引用,在引用标号后,不要轻易使用句号,如果写了句号,句号后面的就是

剽窃了(尽管自已认为是引用),所以,引用没有结束前,尽量使用分号。有些人将引用的

上标放在了句号后面,这是不对的,应该在句号之前。

  2、可以将文字转换为表格,将表格边框隐藏。

  3、如果你看的外文的多,由外文自己翻译过来引用的,个人认为,不需要尾注,就可以

当做自己的,因为查重的数据库只是字符的匹配,无法做到中文和英文的匹配。

  4、查重是一个匹配的过程,是以句为单位,如果一句话重复了,就很容易判定重复了,

所以:的确是经典的句子,就用上标的尾注的方式,在参考文献中表达出来,或者是用:原

文章作者《名字》和引号的方式,将引用的内容框出来。引号内的东西,系统会识别为引用

如果是一般的引用,就采用罗嗦法,将原句中省略的主语、谓语、等等添加全,反正哪怕多

一个字,就是胜利,也可以采用横刀法,将一些句子的成分,去除,用一些代词替代。或者

是用洋鬼子法,将原文中的洋名,是中文的,就直接用英文,是英文的直接用中文,或是哦

中文的全姓名,就用中文的名,如果是中文的名,就找齐了,替换成中文的姓名。故意在一

些缩写的英文边上,加上(注释)(画蛇添足法)总之,将每句话都可以变化一下,哪怕增加

一个字或减少一个字,都是胜利了。特别注意标点符号,变化变化,将英文的复合句,变成

两个或多个单句,等等,自己灵活掌握。因为真正写一篇论文,很罕见地都是自己的,几乎

不可能,但大量引用别人的东西,说明你的综合能力强,你已经阅读了大量的资料,这就是

一个过程,一个学习、总结的过程。所有的一切,千万别在版面上让导师责难这是最划不来

的。导师最讨厌版面不规范的,因为他只负责内容,但又不忍心因为版面问题自己的弟子被

轰出来。

  5、下面这一条我傻妞试过的,决对牛B:将别人的文字和部分你自己的文字,选中,复

制(成为块,长方形),另外在桌面建一个空文件,将内容,复制到文件中,存盘,关闭。

将这个文件的图标选中,复制,在你的正文中的位置上,直接黏贴,就变成了图片了,不能

编辑的。这个操作事实上是将内容的文件作为一个对象插入的,所以是图片。这个操作事实

上是将内容的文件作为一个对象插入的。所以是图片。

  结论:本文的写作纯属作者个人理解、心得体会,根据多年来的检测修改及学校系统规

律所得,有人祝各位同学顺利毕业,大好的工作、大把的妹纸在前方等着你,骚年!师兄只

能帮你倒这儿了

  特别需要注意的问题:

  面总结几个常见问题:

  一、有些书籍的年份久远,知网等检测系统没有收录这些材料,大段大段的copy是不是

很安全?也有同学认为,数据库大多是往届学生论文和期刊的文章,书本和政府工作报告等

暂未入库,直接抄书一般也不会“中招”。

  答:这些做是存在风险的。第一,虽然中国知网没有收录书籍,但是可能存在a同学或者

老师,他同样也抄了同样的内容,并且已经将其抄书的论文发表了,中国知网能数据库全文

收录a的文章,那么你再抄同样的内容,在进行论文检测的时候,很可能指向a的文章,将会

被认定为抄袭。“但如果所抄书本,前几年有人抄过,还是会被测到,因此大家会选择最近两

年出版的新书来抄。”但是,新书也可能存在抄别人或者被别人抄的现象。另外,在论文评审

的时候,评审专家的经验和理论水平比较丰富,你大段的引用可能被这些老专家们发现,到

时候结果就很悲催了!

  二、现在有些网页上也有很多相关材料,撰写论文能不能复制上面的内容?

    比如百度文库、豆丁?”。

  答:也是很危险的。网页很大程度上来源于期刊网,不少文章是摘抄期刊网上的文章,

通过n篇论文粘贴复制而成。另外有些数据库已经将互联网网页作为数据库的组成部分之一。

连续13个字相同,就能检测出来你可以把原文的内容,用新的文字表达出来意思相似就可以

了,最好用联想法,就是看一遍用自己的语叙述出来,但要做到专业性,就是同义词尽量

专业术语代替,要做到字不同意思相同。例如主动句改成被动句,句式换了,用同意词或

是用专业术语代替等等。还要注意论文框架。

  降低抄袭率率的方法:

  1划分多的小段落来降低抄袭率。

2.很多书籍是没有包含在检测数据库中的,比如论著。可摘抄

3.章节变换不可能降低复制率

4.论文中参考文献的引用符号,但是在抄袭检测软件中,例如一篇文章有5000字,文章的1%

就是50字,如果抄袭了多于50,即使加了参考文献,也会被判定为抄袭。只要多于20单位

的字数匹配一致,就被认定为抄袭

修改方法:

首先是词语变化。文章中的专业词汇可以保留,尽量变换同义词;其次,改变文中的描述

方式,例如倒装句、被动句、主动句;打乱段落的顺序,抄袭原文时分割段落,并重组。

  知网查重是以句子为单位的。即将文章以句子为单位进行分割,然后与知网数据库中的

论文逐句对比,若其中有主要内容相同(即实词,如名词、动词、专业词汇等),则标红。

若一个段落中出现大量标红的句子,则计算在论文重复率中。按照我自己的经验,避免查重

最好的办法,就是把别人论文中的相关段落改成用自己的语言写出来。比如调换句子之间的

顺序,更重要的是改变句子主谓宾的结构。按照这样的方法,我的论文重复率大概在3%左右,

没有任何问题。希望可以帮到你!是这样的。因为基本上都是以句子为单位的。不过从现在

掌握的情况来看,实际上是针对每段的内容,将该段的所有句子打散,然后逐句对比查重。

比如说你的论文中的一段有A、B、C、D四句话,数据库中一篇文章的一段中有E、F、G、H

四句话。那么比较的时候,应该是A、B、C、D分别于E、F、G、H比较,笨一点说,就是比

较16次。这样的话,单纯改动句子顺序就不好用了,必须改变句子结构才可以。好多论文查

重系统检测是不对外开放的,大家完成论文之后可以提前去知网论文查重网进行知网论文检测。