總字數:有的同學會發現報告中的總字數與論文中的總字數出入較大,這是因為檢測系統統計的是字符數,例如thesis,在word中是一個詞(字),在檢測系統中是6個字符。 重復字數:重復部分+引用重復部分的字數,一般改重是根據重復字數收費。 (報告中的重復字數實際上是重復字符數,文科二者基本接近,理工科重復字符數與實際重復字數相差較大,在跟商家溝通費用時需特別注意) 總段落數:學術檢測時會根據文章的格式(如果格式(目錄)沒有正確調整,就根據內容)進行分段檢測,分成幾段,就是幾個段落。 (需要注意的是內容發生變動時,學術檢測會重新分段,有可能出現頭一次檢測正常的內容第二次變紅,這屬于正常現象) 指標:疑似剽竊觀點、疑似剽竊文字表述、疑似自我剽竊、過度引用等。
學術檢測論文的重復性是按照13個字的連續性作為判斷的根據,若作者希望修改后的論文查重沒有那么高,就可以先選擇將論文13個字相連的地方做修改,修改后保證13個字與字之間的內容與抄襲的原作者文章內容不一致,這樣過檢測的概率會很高。 學術不端網 覺得,按照目前的論文檢測系統來說,是非常容易的,只需要做簡單的修改,等到以后會不會縮短字數進行查重檢測就不得而知了。
大致上來說,學術查重算法采用的是一種根據語義模糊解析算法,用近似比對的方式進行重復率檢測。 而不是簡單地基于某個最小語句為單位(比如傳說中的“13個字連續一樣”),進行“循環比對”這么簡單。