影响相关性的主要因素腻戴怯猡包括如下几方面:
关键词常用程度
经过分词后的多个关键词,对整个搜索字符串的意义贡献并不相同。越常用的词对搜索词的意义贡献越小,越不常用的词对搜索词的意义贡献越大。
词频及密度
一般情况下,认为在没有关键词堆积时,搜索词在页面中出现的次数多,密度越高,说明页面与搜索词越相关。不过这只是一个大致规律,实际情况未必如此,所以相关性计算还有其他因素。出现频率及密度只是因素的一部分,而且重要程度越来越低。
关键词位置及形式
就像在索引部分中提到的,页面关键词出现的格式和位置都被记录在索引库中。关键词出现在比较重要的位置,如标题标签、黑体、H1 等,说明页面与关键词越相关。这一部分就是页面 SEO所要解决的。
关键词距离
切分后的关键词完整匹配地出现,说明与搜索词最相关。比如搜索“优化方法”时,页面上连续完整出现“优化方法”四个字是最相关的。如果“优化”和“方法”两个词没有连续匹配出现,出现的距离近一些,也被搜索引擎认为相关性稍微大一些。
链接分析及页面权重
页面之间的链接和权重关系也影响关键词的相关性,其中最重要的是锚文字。页面有越多以搜索词为锚文字的导入链接,说明页面的相关性越强。链接分析还包括了链接源页面本身的主题、锚文字周围的文字等。