《百度网页搜索质量白皮书》研究

shape
shape
shape
shape
shape
shape
shape
shape
%title缩略图

在问答发了一次,管理员让我发在 jike专栏,我修改了下发过来了。

一、 预估

3月份,我发现百度的服务器不够用,很多服务器日常工作量减少、某些工作停滞,结合一些百度举措,认为百度将有新规则出台。时间大约在5-7月间,重点内容是“页面相关度”、“用户体验”。

1.预估时间

%title插图%num

2.预估内容

%title插图%num

%title插图%num

百度白皮书纲要:

%title插图%num

呵,没想到第三点也作为这次的重点,其实也可以归结为用户体验的要素。

3.预估影响

符合百度优质页面的 网站、内页、文章页将会获得排名,特别是内容精确、信息量丰富、用户数据好的内页将会替代首页来占据排名;很多网站的排名会逐渐消失,直到所有关键词排名消失(这个应该较缓慢,集中在部分行业)。

2015年前变动可能不大,年后估计可能有很大变动。

二、 在此之前

%title插图%num

%title插图%num

1. 2013年6月至11月,百度市场占有率持续下降,下降约为6.4个百分点,百度各股东对于此事,应该都感到不高兴,长远利益一致就好做事了。

2. 360没有搜索引擎核心技术,但是具有自身优势和很强的势力,对百度具有一定的威胁。

3. 百度自身的核心技术“超链接分析技术”存在问题,不能满足正确搜索结果的展示。

4. 在大多数情况下,钱发挥着主导行为的功效,百度应该花得起钱买来几个掌握google算法核心技术或者边缘的人吧?

Google大概2万名主要员工,这2万人都有google的股份,掌握核心技术员工的股份和持股形式就更不同了。在世界第一流的公司担当重要角色,且能分红,看来是不会去百度的。如果百度有更高的薪资待遇, google就会给更高的,在一定程度上解决了某项技术的外泄。

看看谷歌20位员工工资(此数据为2012年6月):

职务 年薪 (美元)

高级软件工程师139084

研究科学家121547

产品经理119495

销售工程师118710

研究工程师117900

软件研究工程师116593

产品营销经理106667

财务分析师104819

软件工程师103436

用户体验研究员95320

站点可靠性工程师94934

数据库管理员94420

高级客户经理89778

用户界面设计师87661

网络工程师87219

实习软件工程师82488

商业分析师80510

客户经理68188

AdWords助理53538

网络销售助理、运营助理50200

看来百度只能靠自己,Google做的挺好,可以跟着google走,做个山寨模拟机,只要偶尔能实现就行:

核心技术“超链分析”把网络搞的一团糟,为此百度推出了一系列算法来清理网络,百度公布了一些举措。比如针对低质量站点的措施与石榴算法;超链作弊的算法升级;Web2.0反垃圾详细攻略;谈外链判断;绿萝算法。

按照百度的态度,理论上以下行为将受到打击:

1. 链接中介网站,参与链接中介的网站;

2. **、出租链接的网站(我认为这个百度难以做好);

3. 购买链接的网站(我认为这个百度难以做好);

4. 影响浏览,含弹出广告、垃圾广告、和页面不相关广告的网站;

5. 承载和发布推广软文的网站;

6. 打击交叉链轮;

7. 隐藏链接;

8. 使用程序机在web2.0等网站大量的群发指向您网站的链接;

9. 不具推荐意义的交换链接;

10. 采集链接;

11. 黑链;

12. 虚假锚文本;

13. 论坛签名带链接;

14. 留言、回复带链接;

15. 文章插入链接和明显推广链接;

16. 伪原创组合文章。

PS:加入推广合作平台,你会发现每月你有无数的链接,这些链接蛮有意思的,不过都是属于被惩罚的行列。实践出真知,以前人家办这个的人赚到了,不过有多又少。

2012年的6.22和6.28事件,表明百度想打击低质量页面,可是投入不够,没啥力度。

2014年,百度升级了“百度索引量工具”,看看我一个网站的索引量数据(本身是作弊的网站,权重5下降到2,后调整了作弊,权重恢复到4,但整体是下降的):

%title插图%num

明显百度这次说到做到,在索引量从77万下降持平后,突然暴增至100多万。

随后,我观察百度对其它工作的处理缓慢、滞后、停滞,估计百度的服务器都用来处理全网抓取行为了。

%title插图%num

此时(5月9号),百度正在编写白皮书,13号发布了白皮书预告。预计百度索引行为结束,而且可能出了很多索引分析,下半年百度将处理排序展示这些结果,2015年将有一个新的百度搜索结果和百度搜索界面。

三、 如何做

我正好有个新站要做,是关于b2b电商平台的。Seowhy的人并不这么做,但是一些新手会发生的事情:

1. 缺乏nofollow链接,follow链接比例过高——-目前仅适用google。

2. 发布大量这些链接:博客带链接、软文带链接、帖子带链接、论坛签名带链接、留言带链接、回复带链接、评论带链接。

3. 委托淘宝、seo平台服务,多为廉价作弊。

4. 加入站长互惠宣传、交换资源平台,产生直接或连带惩罚。

5. 链接锚文本精确匹配—-目前仅适用google。

6. 链接到内页比例过高—–目前仅适用google。

7. 交叉连接、引用尝到甜头,开始搞几十层的交叉链轮,费时费力还有反作用。

8. 数量上排名前10个锚文本关键词都是商业化的词或其他不自然的词。锚文本使用商业性强的词比例过高——-目前仅适用google。

9. 企业自己的站点互链,降低了效果,导致排名下降—-目前仅适用google,看来百度有这个趋势,但方向应该是相关度和用户的点击及随后的行为。

10. 锚文本使用较少的品牌词和复合词——-目前仅适用google。

11. 生硬插入链接。

12. 采集链接,我的网站有 产品采集、黄色网站采集。

13. 隐藏链接。

14. 非自然链接增长,链接增加快于同类网站平均速度——-目前仅适用google,百度以后应该会跟上,但受苦的还是平民站。

15. 适用工具,为原创、群发、模拟点击。

16. 链接主题和被指向网页不相关,即不具备推荐意义。

呵,还有些一时想不起,昨夜的疯狂让我头疼。

看看google的思路,多少在影响着百度的思路:

1. PageRank

%title插图%num

2. 超链分析技术

%title插图%num

3. 用户体验

%title插图%num

4. 社交化

Google还在研究。

可以看出,百度在跟风google,而且很多东西Google在2007-2010就开始不用或者解决了,你在google的正常网站怎么做的,就可以照搬过来,只是需要结合“国情”具体问题具体分析。需要解决的问题是:

1.增长安全的链接,获得链接数(这个真说烂了);

2.高质量链接,这个每个人都会说,但是却在发垃圾(这个真说烂了,作为常识给新手罗列下);

3.链接具有互通相关性(这个真说烂了,作为常识给新手罗列下);

4.链接有人点,并且之后的用户体验数据优良;

5.用户体验,产品经理、ui设计、程序、功能、流程等(这个真说烂了,作为常识给新手罗列下)。

6.针对百度的文案和用户的文案如何安排,如何获得最佳效果,通过模块代码,还是视觉,或者其他方法,根据自身情况来安排。

7.考虑如何才能符合百度白皮书的:

需要研究下分词和语义分析。估计暂时很多行业,百度会以原有排名站的描述、写进百科、知道、词条的的描述,以及行业通用语、行业关键元素来作为判断。

具体方法,想到了一些,打算在新站中试验试验。

请珍惜自己的品牌! 本文质量及原创性由搜外网审核,永久保存。【ID:184】点此查核→

发表评论