记者把原创文章复制粘贴到这样的网站上,一键即可生成同义词替换过的文章,被替换的词通常用不同的字体和颜色标记出来。
在这个过程中,记者发现,专业类文章替换较少;生活类的文章替换掉的词较多;文章越长,替换率越高。在线“伪原创”工具还附带相似度检测、关键词排序、关键词统计、关键词组合工具等在线工具,文章整体替换的比例在10%左右。替换后的文章可读性降低,网站建议对文章进行人工修改提升可读性。一个“伪原创”网站在说明中称,“‘伪原创’文章最好将文章开头和结尾用自己的语言组织,这样的效果更好一些”。
记者使用相似度检测对原创和“伪原创”进行对比发现,机器识别出相似度在85%至98%之间。
记者在网站上看到一个生成记录,内容文本字符长度为734个字的文章,共替换了44个词长度为90个字符,替换比率为12.26%。原文和替换之后的文章相似度为92.6%,如此高的相似度怎么办?这些网站给出了进一步的“解决方案”。
“在线生成文章,将其粘贴入前两步已做好的‘伪原创’文章后一段即可”。记者点击“在线生成文章”发现,生成的并不是可读的文章,而是一段看似是中文的乱码。将这段乱码贴在文章最后,相似度降低到84.3%。
除了用乱码降低相似度,这些网站介绍称还可以在文章中插入图片,建议用户打乱文章顺序等方法。
此外,记者发现,网上还可以搜索到大量关于“如何制作‘伪原创’”的教程。
原创维权依然麻烦
作者的原创内容遭“伪原创”剽窃,将会有哪些损失?
“就商业价值而言,一篇文章招广告,卖价要看这个公众号的粉丝量有多少。大一点儿的公众号,一篇头条文章去年的价格大约是5万元;剽窃我们的公号,估计一篇头条文章的卖价在几千元到两三万元之间。保守估计也可以卖出几千元。”刘思含说。