搜索引擎对于原创处理细节以及在算法所占比重实验

 

  白帽SEO,无非就是一个长期观察、针对实验、提练方法的过程,并没有什么深不可测的理论。这篇文章就是有关不同搜索引擎针对原创内容的处理细节以及在其算法所占比重的小实验。可以让你了解到如何观察搜索引擎以及如何有针对性进行网站实验。

  谈到原创内容,对于网站优化的重要性不用多讲,在任何一篇有关SEO的文章都会提到,并都会强调原创内容对于网站优化的重要性。但是很少有文章详细的描述不同搜索引擎对于原创内容的态度有什么不同。据我观察,其实不同搜索引擎对于原创内容的处理细节是完全不同,在其算法中所占比重也大相径庭。我们现在就做这样的一个小实验。

  实验对象:Baidu/soso/360 so/google/sogou/youdao/bing

  实验素材:原创文章 “警惕恶意垃圾外链对网站的负面影响”

  实验准备:

  第一步 3月23日上传原创文章,首发于新派网络公司博客

  地址:http://www.0769xp.com/blog/post/150.html 标题:警惕恶意垃圾外链对网站的负面影响

  第二步 3月28日投搞于A5站长网

  地址:http://www.admin5.com/article/20130328/494811.shtml 标题:警惕垃圾外链对网站的负面影响

  第三步 被众多网站采集或转载,大致分为三种类型:

  A 正规转载,保留原文地址。 B 无节操转载,没有保留原文地址。 C 无良转载,改的乱七八糟。

  为了观察到更多内容,我在投搞于A5站长网之前,刻意修改了一下标题,内容完全一样。

  正式实验:

  为了保证不同搜索引擎能有充足的时间来索引内容,所以我们定在半个月之后进行观察。打开各大搜索引擎,直接搜索原创内容标题。

  百度(baidu.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:采集网站,属于 B 无节操转载,没有保留原文地址。其实就是盗版侵权的网站。

  第二名:A5站长网,这是我主动投搞的网站。

  第三名:A5站长论坛贴子,被网友用来刷论坛积分用的。

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:A5站长网,这是我主动投搞的网站。

  第二名:A5站长论坛贴子,被网友用来刷论坛积分用的。

  第三名:转载网站,属于 A 正规转载,保留原文地址。

  搜索不同标题都没有原创首发网址被索引。

  百度结论:原创内容对于百度来说,并不按首发时间判断,而是由网站权重判断。通俗点讲,“啥原创不原创,谁面子大就是谁的” 极其不尊重内容版权也许是百度对于原创内容的态度。这对老老实实做原创内容的小网站来说,是个很大的打击,是不是你的东西并不是由你自己说了算。这里不能光是批评百度的声音,值的肯定的是百度对内容的分析能力非常厉害,我刻意修改了文章标题,搜索结果是不同标题的网址交集,证明百度完全明白这两次搜索是同一篇内容。

  搜搜(soso.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:首发原创网址,即新派网络公司博客地址。

  第二名:转载网站,属于 A 正规转载,保留原文地址。

  第三名:第三名以下全是打酱油的结果。

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:A5站长网,这是我主动投搞的网站。

  第二名:百度百科,属于 B 无节操转载,没有保留原文地址。

  第三名:转载网站,属于 A 正规转载,保留原文地址。

  第六名:首发原创网址,即新派网络公司博客地址。

  搜索不同标题都有原创首发网址被索引。

  搜搜结论:相对百度来说,搜搜对于原创内容态度鲜明的多,基本上是通过首发时间来判断原创文章。但是对于内容的分析能力比百度要逊色很多。这就出现为了两次搜索结果相差这么大的原因。

  360搜索(so.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:采集网站,属于 B 无节操转载,没有保留原文地址。其实就是盗版侵权的网站。(同百度一样)

  第二名:首发原创网址,即新派网络公司博客地址。

  第三名:转载网站,属于 A 正规转载,保留原文地址。(同百度一样)

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:A5站长网,这是我主动投搞的网站。(同百度一样)

  第二名:转载网站,属于 A 正规转载,保留原文地址。

  第三名:A5站长论坛贴子,被网友用来刷论坛积分用的。(同百度一样)

  搜索原文标题有原创首发网址被索引。

  360搜索结论:不想过多评论,只讲一句,模仿者想超越任重而道远。

  谷歌搜索(google.com.hk)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:首发原创网址,即新派网络公司博客地址。

  第二名:采集网站,属于 C 无良转载,改的乱七八糟。

  第三名:A5站长网,列表网址,非投搞网址。

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:首发原创网址,即新派网络公司博客地址。

  第二名:首发原创网址,新派网络公司博客列表页。

  第三名:采集网站,属于 C 无良转载,改的乱七八糟。(与第一次搜索结果的第二名一样)

  谷歌结论:我不是美分,但我不得不由衷的赞叹来自美帝、世界第一的搜索引擎对原创内容态度和内容分析的能力,也许这是国内搜索品牌与国际搜索品牌真正的差距所在。想做世界品牌的搜索引擎,学着点吧。只想在圈里称王的可以飘过。这里发现一个小细节,针对google来说,列表页的权重真的比较高哦。

  搜狗搜索(sogou.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:首发原创网址,即新派网络公司博客地址。

  第二名:转载网站,属于 A 正规转载,保留原文地址。

  第三名:采集网站,属于 B 无节操转载,没有保留原文地址。

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:A5站长网,这是我主动投搞的网站。

  第二名:采集网站,属于 B 无节操转载,没有保留原文地址。

  第三名:采集网站,属于 B 无节操转载,没有保留原文地址。

  搜狗结论:中规中矩的搜索引擎,对待原创保持尊重,对内容的分析能力也较弱,两次搜索结果相差比较大。

  有道搜索(youdao.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:打酱油飘过

  第二名:打酱油飘过

  第三名:第三名?没有第三名了.....

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名: 转载网站,属于 A 正规转载,保留原文地址。

  第二名:A5站长网,列表页

  第三名:打酱油飘过

  有道结论:只要下次别说你是做搜索引擎的就好了,大家能理解。

  必应搜索(bing.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:首发原创网站,即新派网络公司博客列表页,非文章地址。

  第二名:正规转载列表页,非文章地址。

  第三名:无节操转载列表页,非文章地址

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:A5站长网,这是我主动投搞的网站。

  第二名:无节操转载列表页,非文章地址

  第三名:首发原创网站,即新派网络公司博客列表页,非文章地址。

  必应结论:好吧,下次找列表页内容,就用你了。

  以上为七个搜索引擎关于原创内容的处理细节观察。尊重原创与否,只是不同搜索引擎的算法差异之别,并无对错之分。以上个人结论如果表现明显好恶之意,纯属个人性情,无意于干扰你的观察。以上实验素材少,周期短,难免出现偏颇,请各位看官谅解。通过这次实验,大概也了解到新派网络网站为什么在谷歌、搜搜等上面表现很好(有兴趣的朋友可以观察一下) 因为尊重原创的搜索引擎,必然在其网站排序算法中所占比例较重。如果所有搜索引擎都开始不尊重原创内容,都信奉“谁的面子大就算谁的”,那还有谁为互联网添加新鲜血液?

  原文出自新派网络公司博客:http://www.0769xp.com/blog/post/152.html 转载请保留地址。

时间: 2024-12-03 19:47:21

搜索引擎对于原创处理细节以及在算法所占比重实验的相关文章

【原创】机器学习之PageRank算法应用与C#实现(2)球队排名应用与C#代码

在上一篇文章:机器学习之PageRank算法应用与C#实现(1)算法介绍 中,对PageRank算法的原理和过程进行了详细的介绍,并通过一个很简单的例子对过程进行了讲解.从上一篇文章可以很快的了解PageRank的基础知识.相比其他一些文献的介绍,上一篇文章的介绍非常简洁明了.说明:本文的主要内容都是来自"赵国,宋建成.Google搜索引擎的数学模型及其应用,西南民族大学学报自然科学版.2010,vol(36),3"这篇学术论文.鉴于文献中本身提供了一个非常简单容易理解和入门的案例,所

影响百度搜索引擎优化的最新两大核心算法

中介交易 SEO诊断 淘宝客 云主机 技术大厅 众所周知,百度在今年发布了网页质量白皮书,白皮书对于seoer而言犹如一盏明灯,指引着我们网站优化的方向,3721.html">2014年是百度算法变化最为频繁的一年,很多seoer都觉得网站优化力不从心的感觉愈来愈烈,其实任何一个行业都会由萌芽到发展到鼎盛,seo也不例外,百度不断完善自身的算法只能说是搜索引擎也在不断完善自己的搜索算法,不断改进自己的用户体验,作为seoer我们应该在当下如何有效的优化网站呢?好,咱们闲话短续进入正题,今天

浅论搜索引擎对原创和伪原创的判定机制

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 做网站说白了就是做服务,而服务好不好关键就在于网站提供什么样的内容给客户,内容的质量越好,网站就越容易被客户接受,客户就会喜欢上你的网站,对你网站产生了依赖,这就表明一个成功的网站诞生了,可是对于个人站长来说,网站的内容更新实在很困难,都知道原创的内容非常好,可是原创的难度是可想而知的,于是很多站长就搞起了伪原创,可是现在搜素引擎也越来越智能

请相信:原创文章只是暂时调整算法的优势

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 不知道是从什么时候开始,大家逐渐觉得原创文章才是优化的正途.大概是百度K站之后,但是,站长们都觉得写纯原创仿佛难度太大了.而且,针对于不同的行业来写原创,对于网站编辑来说是一个很大的问题.然而,现在百度说明了原创文章的重要性,却让不少人花费了心思.那么,对于原创文章来说,其真正的价值是什么呢? 原创文章最大的优势是让百度知道你的内容是新的,是

如何进行机器学习算法的实验?

问题描述 如何进行机器学习算法的实验? 学习了很多的机器学习算法,但是理解的还是不够透彻,想自己跑实验试试,但是有不知如何下手?! 请教各位大神该如何深入理解和运用? 解决方案 [机器学习实验]用Python进行机器学习实验 解决方案二: 本人创建的机器学习研究QQ群445858879,欢迎爱好机器学习的朋友来此交流学习心得,群里有数据挖掘的高手跟大家切磋

认清2014年百度搜索引擎变化与优化细节

中介交易 SEO诊断 淘宝客 云主机 技术大厅 相对2012年百度对站长们的摧残,如今我们已经够幸运了,相信站长们都不会再去想面对6.28.就从百度搜索引擎上半年来分析,虽然打击力度有,但主要有针对性的网站,百度需要的是一个全新用户体验页面,而不是一个挂满全广告的页面.站长们有竞争,但百度何尝会没竞争呢?这半年随着360的客服电话与广告不断渗入我的耳根与眼眸,说明360搜索业务不断在扩张,当然对于站长们倒是乐意坐山观虎斗,最好两败俱伤.随着两大巨鳄的争斗,站长们要时刻关注最新动态,以防反弹对网站

搜索引擎常用的三种网站排序算法

搜索引擎如何对互联网上那么多的网站进行合适的排名?想必做站长的都想知道这一点,这是通过一套非常繁琐复杂的算法计算出来的,具体的算法想必没有几个人知道,但是最常用的三种算法还是需要大家去了解一下的. 1.词频位置加权排序算法:顾名思义是说从整个网站上的文字的位置上与出现的次数进行排序,先来说一下位置,不同的网站关键词在内容里出现与在标题里面出现时差别非常大的,搜索引擎认为标题能表现出一个网站是干什么的,如果标题里面出现了关键词要远比文章里面出现关键词重要的多的多.这就是现在大家都知道一个网站的标题

【原创】机器学习之PageRank算法应用与C#实现(1)算法介绍

考虑到知识的复杂性,连续性,将本算法及应用分为3篇文章,请关注,将在本月逐步发表. 1.机器学习之PageRank算法应用与C#实现(1)算法介绍 2.机器学习之PageRank算法应用与C#实现(2)球队排名应用与C#代码 3.机器学习之PageRank算法应用与C#实现(3)球队实力排名应用与C#代码  Pagerank是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的唯一标准.在揉合了诸如Title

搜索引擎喜欢原创不一定对你的网站有利

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 我也是个作站新手,看到了很多关于优化的文章,其中最重要的一点就是要求原创,但我做站也有一段时间了,其他的关于优化的问题我还能认可,就原创这条我非常不认同. 每每我呕心沥血写出片原创来,但倒是转载的都被收录了,但我自己网站发表的根本不被收录,好像我的文章是抄袭来的,那些权重高的站转载的反而被认定是原创. 大家可以在百度和谷歌搜如何优化网站--五