新闻资讯

主页 > 新闻资讯 >

索引库建立分词

索引库建立

搜索引擎的资料库

搜索引擎提前将它认为重要的页面信息下载好,放在数据库中,这个供用户查询相关结果的数据库就是搜索引擎的资料库。

不同搜索引擎的数据库也是不一样的,一般是几十到 100 亿个网页左右。

索引库

搜索引擎的本职工作我们在搜索一个关键词的时候,搜索引擎要在浩瀚的网页世界给我们找到我们需要的网页。搜索引擎为什么那么快?因为搜索引擎对网页进行了分类处理。这个经过分类的页面信息资料库就是索引库。

索引库的分类和建立

不论是中文还是英文,词语的总数是不变的(中文词语不到 10万,英文大概 100 万左右单词)。

如果按每个词 100亿个网页 / 10万个词语=每个类别 10万个网页。

所以,如果我们要搜索某个关键词的时候,只需要在 10 万个网页里去找即可。

分词

分词技术

想要建立索引库,就必须把页面上的文字进行拆分,然后把分好的词一个一个放到索引库中去,搜索引擎的这项技术就叫分词技术。

分词技术的流程

提取原代码 - 把关键词与 URL 对应储存

分词技术对 SEO 的意义

长尾词可以带动相关近义词的权重。如果 “网上如何赚钱” 这个词被优化到了百度第一,那么 “如何赚钱”、“网赚” 这样的词也会有很好的权重(即使他们并没有完全匹配)。单字无法带动其他词的权重。所以,在写页面内容,尤其是写网页 title 的时候要注意搜索引擎的这项技术。

第一阶段

名词解释

概述:建站程序介绍、博客、企业、论坛、商城、其他

域名

域名介绍、域名购买、域名使用、域名备案

服务器

服务器介绍、服务器类型、服务器绑定域名、服务器 IP、服务器日志

网站程序

建站程序介绍、博客、企业、论坛、商城、其他

SEO 基础

内容:三大标签、关键词、文章、用户体验链接:链接的概念、链接的分类、链接的应用HTML:HTML 基础、静态化、Nofollow、DIV + CSS、Alt 属性、网页地址技术:http 状态码、爬虫、搜索引擎入口、权重、robots工具:百度开放平台、指令、站长工具、统计工具、其他黑帽:黑帽的概念、黑帽的常用手段、对黑帽的惩罚

SEO 应用

淘宝客、SEO 顾问、广告联盟、推广、PPC

第二阶段

SEO 模型

排名

原理:优化对象 超链分析 相关页面 SEO 模型选词:选词的重要性、选择的原则标题:标题的重要性、遵守的原则布局:关键词分类、导航型搜索、信息型搜索、交易型搜索内容:原创、内容为王、关键词分布、导出相关链接外链:权重和 PR 的概念、外链的价值、外链的形式、操作原则

建站

建站流程、虚拟主机、上传安装、模板、演示、SEO设置

内容

挖词确定行业:寻找行业、用户分析、转化率分析确定目标关键词:确定搜索量、确定转化率如何判断竞争度:关键词搜索结果前三页、竞争对手页面和域名年龄、竞争对手的收录和外链、竞争对手的网站结构长尾词挖掘:流量来源、长尾词根挖掘思路、海量长尾词挖掘整站布局:导航型搜索关键词布局、信息型搜索关键词布局、交易型搜索关键词布局标题:概念和分类、写法和注意点文章:原创、质量(内容/技术)、更新频率结构:用户行为分析和 F 型/树型结构、相关推荐和最新文章、次导航、站内站站内优化:长尾词列表、锚文本、SEO 频道

外链

历史和价值、资源分析、操作、注意事项、策略

心态

执行力、SEO 层次和方向

程序

导读、单页站、企业站、论坛、商城、其他SEO 模型丨程序

上一篇:SEO和搜索引擎优化的暧昧关系 下一篇:SEO优化我们都了解,那对于网站结构优化你知道吗?

推荐阅读

相关阅读

服务领域

网站建设

微官网制作

seo排名优化

营销策划

seo方案

免费获取SEO优化报告

热门文章

猜您喜欢

客户案例 | SEO优化 | 服务领域 | seo流程 | 联系我们 |