研究百度搜索结果页F系参数背后的心路历程

shape
shape
shape
shape
shape
shape
shape
shape
%title缩略图

第一阶段 解释未知的参数

研究百度搜索结果页 F 系参数源动力是对 the art of seo 两个版本的比较得出

“best practices and optimization opportunities”被改成了“web technologies, Internet search behavior, and the search engines themselves”,不是优化技术在不断提高,而是网络技术、互联网搜索行为、和搜索引擎在不断演进,感觉有点懂网络比懂 seo 更有前途的意味。

学习编程知识,研究用户从 PC 端百度搜索逐步转移到微信咨询,研究搜索引擎本身(research the search engines itself)亦是现时进程中的一部分。

模仿 Matt Cutts 的首页等于拥有一把打开 F 系参数的钥匙,而知道 Matt Cutts 又是因为读了 Zac 的 SEO 实战密码,而读 Zac 的书则是因为入了 seo 外包公司,之所以买书是认为读书可以改变命运。好罢,命运的确被改变了。

具体研究 F 系参数是 2 个牛人启发的,一位是现任公司的市场部总监提出的,他以前去过淘宝;另外一位是上面提过的谷歌 Matt Cutts,要不是2013年模仿他独具创意的网站标题,估计想出 F2 的含义还要推迟一段时间。

  1. 刚开始以为 F 系参数是 16 进制的 IP,转换成 10 进制无果。
  2. 后来又将 F 系参数每 8 位字符作为一个整体,研究变化规律,稍微发现一点规律,但不明白为什么同一个查询词会发生变化。
  3. 曾认为每个搜索结果 F3 相同。
  4. 查询近似关键词又认为可能是查询词被压缩后显示的形式,F3 与查询词有关,但不是压缩查询词的算法。
  5. 然后研究春节这个时事关键词,觉得可能与搜索结果首页位置变化无关。

尝试了 5 种失败的猜测后,于是罗列比较个人较为熟悉的百度搜索结果页的 F 系参数,整理以期发现规律。所持有的理念是王世襄《明式家具研究》中

不浮曰沉,沉是深而稳的意思,是浮躁的反面。

渐渐从 F 系参数中发现第 1 个规律,搜索结果标题的组合形式

(link-h1)( – )(title)

(读过书的好处之一是能提携你步入正轨,而不是像无头苍蝇四处乱撞。)

第二阶段 多线程分析法

为了证明 F2 与搜索结果标题有关,找到了谷歌炸弹 miserable failure.

发现除了 F2 以外,F3 亦有不同处,遂开始研究 F3 参数的含义。

根据每日观察同一 query 给出了几种猜想:

  1. F3 与 query 大小写无关
  2. 可能与网页 title 同 query 的关系无关
  3. F3 和搜索结果有关联

    期间发现 54E52437 类似 54E5243F,这为后来了解 F3 = xxxxxxx7 是 query 匹配搜索结果网址埋下伏笔,可参考 http://ask.seowhy.com/question/10149 中的答案。

之后不断更换关键词测试,从数量上找缺口

终于从 seomoz 更换域名为 moz 的结果中找到了一条突破口,

moz 54E5243F

seomoz 54E5243F

虽然更换了域名,但 F3 的值都是 54E5243F

又发现时常出现 F3 = xxx7xxxx,在 F3 第 5 位找不出意义的窘境下,同时研究 F3 第 4 位是什么意思。

第三阶段 传统 seo 主流观点的谬误

使用高级指令 intitle:,从而打开 F3 = xxxx2xxx 另一层含义的大门

由于 F2 相较 F3 容易理解,得知搜索结果标题并非一定是网页标题,而可能是 H1,链接锚文本等,所以用到 intitle: 高级指令验证自己的想法,除了成功证明对 F2 的猜测基本正确之外,又发现了 F3 第 5 位的另一层意思。

intitle:seowhy

按痞子瑞《SEO深度解析》第 3 章常见名词和指令讨论的简释

title|intitle|alltitle

该组指令会把搜索范围限制在网页的标题,而不会对网页的内容进行搜索。

通过对 F2 含义的证明,已经坐实网页标题只是搜索结果标题的选择范围之一,intitle: 可能出现作为锚文本的搜索结果标题,那么接下来就是推翻“不会对网页的内容进行搜索”的谬论。

按百度站长社区版主痞子瑞的观点 intitle: 是要 query 匹配网页标题,实际 F3:xxxx2xxx 的结果 title 未必匹配 query,可能是这几个都是权重较高的页面,所以百度用没有出现关键词的网页标题(title)作为搜索结果标题。F3 = xxxx2xxx 的优先级高于 intitle:

修正了下

F2:xxxx2xxx 可能是当前搜索结果页 query 权重较高的主域名和子域名搜索结果,无论 query 匹不匹配搜索结果标题;另外若是百度认为主域名与子域名权重都不高,而某几个详情页 query 权重较高,详情页亦会出现 F2:xxxx2xxx

痞子瑞又在《SEO深度解析》第 5 章站内优化提到

站在 seo 效果的角度,在不考虑链接导入权重的情况下,一般同一个网站内各类页面的权重大小关系为:

主域名首页 > 子域名首页 > 主域名目录 > 子域名目录 > 主域名内页 > 子域名内页

根据观察 F3 第 5 位亦和主域名、子域名、目录、内页有关,看来不止一种意思。

收集到的 F3 键值有 0, 1, 2, 3, 6, A, B

但 F3 第 5 位分类方式与《SEO深度解析》不尽相同,主域名、子域名是第 1 类(A, 2),目录、详情页是第 2 类(B, 3),但不清楚 0, 1, 6 是什么类型,看来还有许多细节尚未发现被 seoers 发现,有关 seo 的书里也没提到过除了主域名、子域名,目录、内页外还有哪些其他类型的网页。从对高级指令及网址形式的理解和定价却要 99 元来看,《SEO深度解析》只能给 3 颗星。

1. A 当前 SERP query 权重较高的主|子域名

2. B 当前 SERP query 权重较高的目录|详情页

3. 2 当前 SERP query 权重较低的主|子域名

4. 3 当前 SERP query 权重较低的目录|详情页

5. 未知 0, 1, 6

Tips: F3 是以 10 个搜索结果为一组,排序后,前 10 个搜索结果与后 10个搜索结果之间的域名权重互不影响。第 1 页,第 2 – 3 页又不同于其他搜索结果页。

这里的权重与排序关系不清楚,权重是在排序之后的搜索结果页以 10 个为一组按照优先级分配的,所以如果 SERP 大都是详情页,可能 10 个结果全部出现 xxxx2xxx。

经过这么多纷杂的判断后,结论是 F3 与 query 对应当前搜索结果页 10 个搜索结果网址形式权重高低有关。

插曲

2014年03月01日前后有个插曲,推广的1位男嘉宾上新浪微博热搜榜了,我在前任公司推广过的 1 位相亲节目男嘉宾,历经了1年多的时间,从青涩男生成为了找回自己的愤青,百度指数也从 0 涨到几千,主要的推广方式就是电视上给女生们以梦想,网络上靠微博、微信、贴吧、网站、视频等宣传其多才多艺,时不时爆些八卦新闻。这时我正好处在研究 F 系参数的第三阶段,也跟着鸡犬升天了,许多人转载了我的研究文章,但他们不清楚为什么想要转载我的文章。

如果说读家具设计书使得我走上研究百度 F 系参数的正轨,那么推广相亲节目男嘉宾就使得原本独自的研究得以传播开。

亦是之前我在 http://ask.seowhy.com/question/8888 的回答,做些 seo 以外的事,像是开个人网站,玩微信,旅游等,会让你看到不一样的风景。

引用微信缔造者张小龙2011年在华中科技大学演讲最后说的话:

至少抽出百分之三十的时间去接触其他的一些东西,那个是你将来灵感的产生地,在这里你会学到更多工作上的、技能上的能力。

2014年03月03日 补充另一种逆向含义

我在《百度搜索结果参数F3 – 超越域名选择的含义》一文中证明 F3 在一个搜索结果页里不仅仅是域名优先级(网址形式权重),另有给予"内容比较充实的页面"较高权重,让其出现在搜索结果页的作用。

这解释了 intitle: 高级指令为什么会出现网页标题没有 seowhy 的搜索结果,却出现 F3 = xxxx2xxx,当然文章内容比较晦涩难懂。

搜索引擎算法不是死的,F3 第 5 位出现的 2 挽回了一些"内容比较充实的页面"标题里不出现关键词造成的权重损失。而如果按传统 seo 一定要在网页标题中加入匹配查询的关键词做法,便无法精确解释 F3 第 5 位是什么。

第四阶段 遭遇算法的瓶颈

2014年03月25日看了点彩版的《算法导论》(clrs),受到启发,将所有已观测到的 F 系参数添加了背景色,没有则留白。

很快,留白的地方就被五颜六色填满,没有再出现留白的 value(参数值),这样就很好地缩小了 F 系参数的预估总量。

已发现的 values

虽然有了更多数据,但因为对各种算法不甚了解,几十种参数各自表示不同算法的统计数据,光是发现 F2, F3 的部分含义就已颠覆了几个传统的 seo 观念。为之配套的独立开发工具已经可以替代部分百度搜索引擎的功能,这是准备自己开发搜索引擎的节奏。

过于小众的东西类似 Wolfram Alpha 搜索引擎。(Wolfram Mathematica 可以轻易计算微积分题目,比微软经典的 Excel 更强大,不过少了许多手工解题的乐趣)。但离“解释未知的参数”的初衷越来越远,解释参数对我而言已经成为次一级的需求,走上了研究算法之路。

注 《算法导论》(clrs)是麻省理工学院(MIT)几位教授编的全世界最权威的算法课程的大学课本。非 seo 必须技能,不过想要理解搜索引擎算法,可以没事翻翻。虽然价格小贵,但花费同样的时间,能比《SEO深度解析》学到更多知识。

请珍惜自己的品牌! 本文质量及原创性由搜外网审核,永久保存。【ID:95】点此查核→

发表评论