學術查重,是以“連續13個字重復”做為識別標準。 如果找不到連續13個字與別人的文章相同,就檢測不到重復。 (3)
封面、摘要、緒論、第一章、第二章、等等這樣一系列的都會各自分成一個片段來檢測,每一個片段都計算出一個相似度,再通過這樣每章的相似度來計算出整篇論文的總重復率。 當學術查重系統識別到你論文中有某句話涉嫌抄襲的時候,它就會對這句話的前面后面部分都重點進行模糊識別,這個時候判斷標準就變得更嚴格,僅僅加一些副詞或虛詞 (比如“的”、“然后”、“但是”、“所以”此類詞語)是能夠識別出來的。 在學術查重進行中,檢測系統只能識別文字部分,論文中的圖片、word域代碼、mathtype編輯的公式、是不檢測的,因為檢測系統尚無法識別這些復雜的內容格式。
學術查重系統 的報告單的第一比例為“去除本人已發表文獻復制比”,即自己發表過且被學術查重系統收錄的內容不算為重復,各大高校也以此結果為參考。 默認情況下,無論是第幾作者都去除不算為重復率,而“不是僅去除第一作者本人文獻”(默認不勾選),如下圖所示。