捜索引擎如何抓到抄袭的数据


1.6捜索引擎如何抓到抄袭的数据

最近受到IEEE的国际研讨会之邀,替他们审核稿件,看这些投稿 的文章是否符合国际水准以在研讨会发表。看了这些来自各国的所谓高 级知识份子的文章后,赫然发现了一般学生常发生的“COPY-PASTE”

25

第1章搜索引擎

(复制-粘贴)竟然也在这些教授学者间发生了。

当个审稿者(Reviewer)最头痛的就是无法精通各种领域,就算是 在某个领域精通,当你看到一篇应该是你精通领域的文章,但你竟然看 不太懂某篇看似很有条理的文章时,你会有点迟疑:这篇文章到底是超 乎水准,所以才看不懂?还是真的是狗屁不通才让你看不懂?有时真的 会很怕误人前途,把别人呕心沥血之作退稿,更怕的是把粗劣的文章流 传出去,让后面可怜的博硕士生去看这些垃圾内容。

曾经看到一篇旁征博引的文章,里面的数学公式更是证明详细,但 是看完之后总觉得数学式表示得怪怪的,并且谈的内容乎应该是五六 年前的东西,但是因为论文的格式实在四平八稳,因此卡在退与不退之 间徘徊,就这样迟疑了一个星期。后来实在难以决定,因此使用了 Docoloc (如图 1-27 所示)。

产、 ....... xnzt m?> ■ & 4r -t . "兩 U/ uia丨 A4I ? a ? s M ? ? ? wm ? ijic ? _

Docol?c

; :' i-Sg 的 j

图1-27 Docoloc是检查文章是否抄袭的网络工具(需要收费)

Docoloc主要是用来判断文章是否为剽窃之作,它可以与网络中上 百万篇文章作比较,计算出剽窃的比例。笔者把审查中的论文通过 Docoloc检查,发现该论文果然是抄袭别人多年前的论文,剽窃比例竟 然高达50%以上,而数学公式的上下标因为COPY-PASTE (复制-粘贴) 的关系,没有正确呈现上下标的格式,难怪总觉得怪怪的。

再使用Docoloc来检查其他各篇的论文,虽然不算是完全剽窃,但 竟然也出现许多是整段文字的COPY-PASTE (复制-粘贴),大概是引用 别人观点时,懶得自己再叙述,不敢置信的是一般学生常发生的

26

上一篇:捜索引擎业者动态 下一篇:没有了