l

A.Y.

2022年6月13日

什么是(Latent Semantic Index)LSI关键词? 如何开发搜索引擎中的下拉关键词?
l

A.Y.

2022年6月13日

Latent Semantic Index(LSI), 这是一个术语词. 基本上你会发现几乎大部分的术语词的中文翻译都有点晦涩难懂.

这个词翻译成中文结果是潜在语义索引: 算法将具有相同属性的两个不具备相同关键词的词联系在一起, 比如 “automobile” & “car”.

Adam Y.

Latent Semantic Index(潜在语义索引, LSI)简析

潜在语义索引(LSI)是搜索引擎用来分析页面上的术语与概念之间的关系, 以便给搜索用户提供最准确和相关的搜索结果的一个复杂算法和系统.

(如果我的专业不是英语, 词汇学没有挂过科的话, 看到这些内容我估计都挺懵的…)

与之相对的是 Latent Semantic Analysis(LSA), 潜在语义分析, 这两个算法构成的系统给用户省却大量的时间, 比如模糊搜索:

1. 有时候写作有成语不会用的时候, 我就到百度去打字, 比如”思忖再三”, 其中有个字我不会拼, OK, 我到百度上打其他会的字, 能搜出来

2. 比如一个字, 没有其他线索了, 我不懂念, 我只了解笔画, OK, 一样能搜出来

Adam Y笔记 | adamy.top

图片来源:  Y 笔记

我们不需要去过分了解这个专业术语, 我们只要了解他的功能并加以利用即可.

当我们在搜索一个词的时候, 搜索引擎会使用LSI算法来模拟用户输入的过程:

1. 当我们输入 “tesla” 自动带出和tesla相关联的下拉词供用户选择;

2. 当我们继续输入, 搜索引擎继续反馈下一步的LSI算法结果

Adam Y笔记 | adamy.top

图片来源: adamy.top

当然用这俩张图来概括LSI, 显然不够全面.

就像我们开篇提到的两个车的单词, 其实还有许许多多的例子:

Apple 和 Iphone、Itunes是如何联系在一起的? 搜索引擎是如何判断这是可以吃的苹果还是可以用的苹果手机?

答: 搜索引擎会检索你的页面, 查看你的页面内容包含了哪些已经被系统明确定义了的LSI关键词, 结合这些词来断定你这个是吃的苹果还是苹果手机.

搜索引擎判断的原理大约是在页面上寻找它数据库中已有的LSI关键词, 然后通过对比匹配来进行判断.

比如上面的例子中, 可能会使用”果树”、”农场”、”收成”、”iOS”、”越狱”等词来进行判别, 这些词都属于Apple不同意义下的LSI引申义关键词.

这种行为其实是模拟了人类的分辨过程:

人: 眼睛看到→提交给大脑分析→出结果
搜索引擎: 收集内容→特征库查找比对→出结果

Adam Y笔记 | adamy.top

图片来源: 《盗梦空间》

千万不要沉浸于入这些文学/算法上的难题, 我们不是学者, 我们学习的目的是让产出的数据有价值.

使用LSI关键词的好处是什么

我们可以通过使用LSI关键词来提高关键词的相关性, 让搜索引擎和用户更好的理解网页和文章的主题, 从而提高页面的排名率:

  • LSI关键词可以防止过多的关键词堆砌在搜索引擎中被标记为垃圾信息
  • LSI关键词帮助完善中心主题, 避免网页以错误含义的关键词来排名, 间接降低跳出率
  • 更多的LSI关键词会帮助公司侧面减少广告竞争, 以更高的排名和更低的广告支出来节约预算开支

SEOer如何利用好LSI

想要充分利用好LSI来提高SEO效果, 我们需要先收集到对应的词做为优化方向:

1. 查找 & 收集LSI关键词

通过下列工具来探索和发掘更多的LSI关键词:

2. 审核搜集到的关键词

我建议你100%人工筛选过滤一遍, 因为不同的公司不同的行业和产品, 往往一定会有关键词和你的公司/行业/产品不符.

在这方面没有什么捷径可言, 我自己是录入Excel人工手动筛选的.

如果英语水平有限, 可以使用词典/搜索引擎来再次确认该词, 不确定的词最好不要采用.

3. 配置LSI关键词

当我们的关键词密度比较大的时候, 只做一个关键词是很危险的, 因为很有可能关键词堆砌而被谷歌降权.

而使用LSI关键词的一大好处在于, 我们可以交替使用不同的LSI关键词来完善我们的标题和正文.

哪些位置可以使用LSI关键词:

和主要关键词一样, 我们需要尽量避免同一个LSI关键词的滥用, 避免因为LSI关键词堆砌而被搜索引擎惩罚.

一个保险而稳妥的做法是: 不管用在什么位置, 每个LSI关键词在每个页面上只使用一次.