封面、摘要、緒論、第一章、第二章、等等這樣一系列的都會(huì)各自分成一個(gè)片段來檢測(cè),每一個(gè)片段都計(jì)算出一個(gè)相似度,再通過這樣每章的相似度來計(jì)算出整篇論文的總重復(fù)率。 當(dāng)學(xué)術(shù)查重系統(tǒng)識(shí)別到你論文中有某句話涉嫌抄襲的時(shí)候,它就會(huì)對(duì)這句話的前面后面部分都重點(diǎn)進(jìn)行模糊識(shí)別,這個(gè)時(shí)候判斷標(biāo)準(zhǔn)就變得更嚴(yán)格,僅僅加一些副詞或虛詞 (比如“的”、“然后”、“但是”、“所以”此類詞語)是能夠識(shí)別出來的。 在學(xué)術(shù)查重進(jìn)行中,檢測(cè)系統(tǒng)只能識(shí)別文字部分,論文中的圖片、word域代碼、mathtype編輯的公式、是不檢測(cè)的,因?yàn)闄z測(cè)系統(tǒng)尚無法識(shí)別這些復(fù)雜的內(nèi)容格式。
學(xué)術(shù)論文查重系統(tǒng)計(jì)算的總字?jǐn)?shù),是Word文檔里統(tǒng)計(jì)的字符總數(shù)(計(jì)空格),而不是單純的依據(jù)Word里所統(tǒng)計(jì)的字?jǐn)?shù)。 所以說,不合理的排版(空格)格式,對(duì)于各位專家學(xué)者們進(jìn)行學(xué)術(shù)論文查重是有著不小的阻礙作用的。 學(xué)術(shù)查重時(shí)表格里面的內(nèi)容也會(huì)算字?jǐn)?shù),而簡(jiǎn)單的Word統(tǒng)計(jì)的時(shí)候一般表格統(tǒng)計(jì)不到字?jǐn)?shù)。 這也就是說,學(xué)術(shù)論文查重入口可以有效的辨別表格是否是重復(fù)的的問題。 每篇文章基本都會(huì)有英文摘要或者英文參考文獻(xiàn),對(duì)于英文更占字符數(shù)了。
檢測(cè)偏差又是什么呢,我們看下面的中國學(xué)術(shù)論文查重的檢測(cè)報(bào)告。 是不是很驚喜! 很多同學(xué)遇到這個(gè)情況就會(huì)說,什么破檢測(cè),根本就不是一回事,怎么也算是重復(fù)呢。 是的,這個(gè)就是學(xué)術(shù)查重系統(tǒng)的局限了,論文查重檢測(cè)系統(tǒng)的最基本檢測(cè)原理就是對(duì)比,所以在圖片中出現(xiàn)的兩句話里,因?yàn)橹貜?fù)的文字超過了系統(tǒng)設(shè)定的閾值,就被判斷為重復(fù)了。
目前,國內(nèi)有三家官方權(quán)威數(shù)據(jù)庫平臺(tái):中國學(xué)術(shù)、維普、萬方,相對(duì)的,也只有這三家推出的查重系統(tǒng)才被各大高校認(rèn)可,而普及率最高的,特別是針對(duì)畢業(yè)論文和學(xué)術(shù)期刊投稿論文,是學(xué)術(shù)查重系統(tǒng)。 學(xué)術(shù)查重系統(tǒng)已經(jīng)推出10年了,重復(fù)率算法現(xiàn)在已經(jīng)相當(dāng)成熟。 但是有一點(diǎn)大家需要知道,學(xué)術(shù)查重系統(tǒng)的重復(fù)率算法,從來沒對(duì)外公布。