如何正確地評估不同系統(tǒng)的重復率的正確性?如上所述,根據(jù)調查重量的系統(tǒng),比較檢測出的庫是不同的。除了了解網絡之外,其他檢測系統(tǒng)大多是網絡文及一些學術論文。另外,系統(tǒng)所使用的算法也有不同,以了解網絡為例,段落重復率閾值為5%,其是否以13個字符連續(xù)進行重復。即,段落重復率不在5%以下計算。身邊很多學生在做重檢查時,先用A系統(tǒng)查一下,手動下降到10%左右,又換了B系統(tǒng),結果重復率為20%,再次下降到10%。
其實我想說的是,沒有必要。換一個系統(tǒng)檢查的話,可能是30%。因此,我覺得各個檢查系統(tǒng)之間沒有什么關系。從A系統(tǒng)的7%到38%就在身邊。有A系統(tǒng)的15%。學術接近0%。網上的一些內容也在知道網絡的數(shù)據(jù)庫里。
例:“百度文庫”、“道客巴”、“豆丁網”、“互動百科”、“百度百科”。作者調查的時候,遇到了很多新奇的網站。“東方富網博客”、“人民代表大會經濟論壇”等。因為是
,所以選擇網絡內容的時候請慎重。我的建議可以在前期使用一些比較方便的檢查系統(tǒng)進行初稿的修正。如果你想要低重復率和穩(wěn)定,最好在使用學校系統(tǒng)之前購買網絡檢查。結果和學校一樣,容易修正,請減少繞道。