搜索引擎排名的基础之一,就是关键词与网页的相关性。
机器算法和人不一样的地方是人可以直接理解词的意思,文章的意思,机器和算法不能理解。人看到苹果这两个字就知道指的是那个圆圆的,有水的挺好吃的东西,搜索引擎却不能从感性上理解。
但搜索引擎可以掌握词之间的关系,这就牵扯到语义分析。
两年前搜索引擎优化业界很热烈的谈论过一阵潜在语义索引(Latent Semantic Indexing)。因为时间比较久,记得也不是很清楚,大概介绍一下。
所谓潜在语义索引指的是,怎样通过海量文献找出词汇之间的关系。当两个词或一组词大量出现在同一个文档中时,这些词之间就可以被认为是语义相关。
...