很多seo工作人员都不清楚搜索引擎的工作原理,其实搞懂原理更好优化,那么今天小编就来讲讲搜索引擎工作过程的三个阶段:
1,爬行和抓取
搜索引擎对网站进行爬取,收集网站的页面数据,存入自己的数据库;
2,预处理
索引程序对抓取的页面继续预处理,包括文字提取,分词等处理;
3,排名
用户采用某个关键词搜索,排名程序调用数据库数据,进行排序,生成搜索页面。
接下来就详细讲解搜索引擎工作时可能涉及到的几个概念:
1,跟踪链接:蜘蛛从任何一个页面出发,顺着链接可以爬行到网上的所有页面
2,地址库:为了避免重复爬行和抓取网址,搜索引擎的地址库会记录以及被发现、但还没有抓取的页面,以及已经被抓取的页面。
3,提取文字:从HTML文件中去除标签、程序,提取出可以用于排名处理的页面文字内容。
4,中文分词:把句子划分成词和词的形式。
5,去助词:例如“的”、“哈”之类的。
6,去重:去除重复的内容,毕竟用户不想看到同样的内容放到一起展示出来。
7,拼写错误提示:用户输入错误时,搜索引擎会提示是不是需要找其他相似关键词。
8,搜索框提示:也就是我们看到的下拉词,用户搜索关键词时,会出现相关的热门搜索。
9,相关性计算:影响相关性的因素有关键词热度,关键词密度,关键词位置等因素。
以上是搜索引擎工作的部分知识,如果对搜索引擎感兴趣,可以看下百度官方的相关文档,了解原理,才能更好的针对其进行优化。
上一篇:中小卖家的谷歌广告投放入门指南 下一篇:如何通过SEO优化将网站图片出现在快照位展现
推荐阅读
相关阅读
最新文章
随机文章