近日,部分用户向站长之家反馈称,百度搜索结果页中已经对部分网站的部分搜索结果进行原创内容标注,或预示着百度原创火星计划已经上线。
据编辑了解,百度目前主要对新闻媒体网站的原创内容进行标注。在对门户网站IT新闻链接进行搜索测试时,只发现新浪、腾讯存在原创内容标注现象,而搜狐、网易暂未发现。其中人民网、环球网、中国新闻网、21世纪经济报道等网站同样也存在原创内容标注。
除新闻媒体网站外,科技博客36氪是编辑发现的唯一 一家存在原创标注的网站,暂不清楚是否有更多类型网站存在原创标注。
百度搜索结果页中对新浪科技原创文章的标注 站长之家配图
百度搜索结果页中对36氪原创文章的标注 站长之家配图
去年8月,百度搜索团队首次表示,正在设计一套较完善的原创识别算法,并提出了互联网生态的项目课题,解决原创内容的搜索排名问题。今年2月,百度搜索团队在发布的2013年中国网站发展趋势报告中更是明确表明,2013年百度将推出原创星火计划,重点扶持原创网站,建设原创联盟,给予原创、优质站点更高的发展空间。
从测试的结果看,百度原创星火计划应该还处于测试阶段,并未正式上线。根据百度官方星火计划的安排,待第一阶段的原创联盟建立完善后,百度将在第二阶段中重点扶持原创联盟网站,并开放高级站长工具,给予这些网站更好的发展环境,而第三阶段将是扶持所有原创网站,同时增加协议标签,实现网站与搜索引擎间的生态关系圈。
其实,早在2010年,谷歌就为内容发行商提供一种基于荣誉系统的新展示方式,允许发行商通过添加网页协议标签的方式,实现原创内容突出显示。不过,引入原创标签并非是一个完美的决策,因为任何网站都可以通过此方式来进行标注,最终判定又是一个新的问题。此外,原创内容标签并未考虑到对新闻报道的增量更新,例如一家媒体在现有新闻报道上添加新的细节。换句话说,如果一家媒体首先曝出英国威廉王子与女孩约会,而另一家媒体随后加入更多细节,那么也很难通过这个方式判断谁才是原创内容来源。
据编辑初步了解,百度对原创内容标注,并未采用谷歌此前的做法。相关网站页面并未出现特别的协议标签。暂不清楚,百度原创内容标注判别的大致算法和方式,欢迎更多知情站长向站长之家提供信息。