自媒体平台怎么判定原创度,揭秘百度是怎样判断原创的

在上篇百度鼓励原创中,Q猪引用了百度站长平台关于如何判断原创的一段话,今天Q猪想就这段话自媒体平台怎么判定原创度,谈谈判断原创的几种方式,欢迎拍砖。

站长平台关于百度如何判断原创的描述是这样的:

首先,通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合;

其次,对原创候选集合,通过作者、发布时间、链接指向、用户评论、作者和站点的历史原创情况、转发轨迹等上百种因素来识别判断出原创网页;

最后,通过价值分析系统判断该原创内容的价值高低进而适当的指导最终排序。

百度如何判断内容相似,是根据上下文意思,根据所表达的中心思想,还是文字的相似。

如果是根据表达的主题,那很多内容,不同的人所写,内容不同,但是主题相同,是不是也被当成相似呢;

判断原创的几个重要步骤

判断原创自媒体平台怎么判定原创度,有几个比较重要的因素。

a、作者、发布时间

分析:网络上大部分抄袭的、复制的内容,作者都是改过的,不是原文作者。还有发布时间,互联网上数以亿计的网页内容,搜索引擎不可能实时监控所有的网站,爬完所有的内容,精确记录文章发布的时间。

所以这两因素不是很靠谱,当然很多网站,特别是博客,有显示发布时间,但是,这也不能太当真,是吧。

b、链接指向

分析:其实,对于做网络优化SEO的人员来说,做好网站内部的链接,是一项最基本的工具。

在一篇文章中,拥有很完善的链接体系,也是作为原创文章的一个判断标准,至少说明对文章内容很用心。