简单讲解语义分析

shape
shape
shape
shape
shape
shape
shape
shape
%title缩略图

刚来搜外时写的一条评论,感觉内容对新人有一定帮助,就抄过来了。http://ask.seowhy.com/question/11881

例句:“乔布斯离我们而去。苹果会不会降价?之前每公斤是多少钱?这个季节的苹果甜不甜?”

很多时候相关程度取决于背后的语义联系,而非表面的词语重复。

事实上在自然语言处理领域里已经有了很多从词、词组、句子、篇章角度进行衡量的方法。

比如主题模型,顾名思义,就是对文字中隐含主题的一种建模方法。

上面的例子,“苹果”这个词的背后既包含是苹果公司这样一个主题,也包括了水果的主题。

当我们和第一句进行比较时,苹果公司这个主题就和“乔布斯”所代表的主题匹配上了,因而我们认为苹果和苹果公司是相关的。

第二句,“降价”所代表的主题和苹果公司还有水果这两个主题都能匹配。那么就要比较是苹果公司还是水果的主题在最近这段时间出现频率高,根据时效性来判断的。

第三句,“公斤”与“多少钱”,这两个词所代表的主题和水果这个主题匹配上了。

第四句,“季节”和“甜”,这两个词所代表的主题和水果这个主题匹配上了。

通过主题模型,我们可以发现,第一句与苹果公司相关,第三、四句与水果相关。

但是第一句乔布斯单独出现,第三、四句都与关键词“苹果”同时出现。即可判断主题与水果相关。

如果这篇文章中有多个词汇被加了锚文本指向某些水果主题的页面,即可判断主题与水果相关。

如果页面所在栏目主题与水果相关,整站主题与水果相关,即可判断主题与水果相关。

如果访客是从与水果相关的页面进入该页面,即可判断主题与水果相关。

如果访客浏览的多数是与水果相关的页面,即可判断主题与水果相关。

上面说的都是内部的,外部也是同样的道理。

能够识别网页主题的因素太多了,我就列举几个主要的出来。

大家可以按照下面的思路去拓展:

以前我们对页面进行优化只是针对单一的关键词,对这个关键词进行合理的布局。

现在我们对页面进行优化不再针对单一的关键词,应该是对相关词进行合理布局。

发表评论