笔者过去曾做过几年的站长,对搜索引擎优化有一些粗浅的研究,也曾依靠百度获取了数十万日IP的流量。最近发现厂内许多 Web 站点还存在许多较初级的面向搜索引擎的问题,感觉过往的经验还有一点价值,做一些的分享。
-
本文的阅读对象主要是对 SEO 感兴趣的 运营、产品 或 研发同学 ; -
如果对 HTML语法 和 域名注册、网站运维 的有一点了解,更好了 ; -
阅读时长约15分钟。
一、搜索引擎的工作原理
简而言之,搜索引擎的目标,是帮助用户检索到满足他们需求的内容,解决用户的问题。搜索引擎的工作过程,大体上可以分成三个阶段。
1.1 爬行和抓取
搜索引擎蜘蛛通过跟踪链接发现和访问网页,读取页面HTML代码,存入数据库。
1.2 预处理
索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序。
1.3 排名
用户输入查询词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。
二、搜索引擎优化
我们从 域名和服务器 、 网站搭建、网站运营、作弊和惩罚 四个维度,快速的聊聊影响网页在搜索引擎排名的因素,以及提升他们的方法。为突出重点,这里将 必须遵守的规则标记为⭐⭐,强烈建议遵守的规则标记为⭐,未标星则为普通的推荐的级别。
三、域名和服务器
3.1 域名
3.1.1 域名背书
-
如果网站的域名是一个知名站点的子域名,类似*.qq.com,则搜索引擎的信任加分
-
如果网站的域名近期曾做过质量和权重较高的网站(参看 5.2.2),则搜索引擎的信任加分
3.1.2 域名简短
3.1.3 语义化域名
-
你叫拉勾?那么最好的域名是 lagou.com;
-
你是招聘类网站?那么zhaopin.com 和 51job 都不错,但是前者比后者更好。
3.1.4 主流域名
-
最好使用.com、.cn等主流后缀;
-
其次.net等次主流;
-
或者 .la 等对中文用户友好的非主流域名;
-
当然,最低限度地,域名须在中国境内可备案。推荐我司 dnspod.cn ,注册时会告知当前后缀在国内是否可备案。
3.1.5 不要使用被惩罚过的域名⭐
-
域名曾经涉黄涉黑;
-
曾经因为 SEO 作弊被惩罚过;
-
曾经做过质量非常低下的垃圾站。 ……
3.2 服务器
3.2.1 畅通⭐⭐
3.2.2 稳定⭐⭐
3.2.3 快⭐
-
网站启用GZIP,减小网页体积;
-
优化网页和网页中的元素(如图片、JS代码)等的体积和载入时长,单个网页承载内容不要过多;
-
使用CDN,注意:须使用节点稳定的CDN服务提供商,否则若无法稳定访问反而会极大影响收录和排序,推荐腾讯云的CDN服务;
-
使用腾讯云的对象存储,存储图片等附件;
-
使用可靠稳定的域名智能解析服务器,如 DNSPod;
-
提高 服务器带宽和性能(参考当前和预估未来一段时间的访问数据,访问峰谷带宽开支、资源开支);
-
优化代码和数据库的性能;
-
使用缓存技术;
-
静态化网页;
-
多与研发和运维聊聊,还有哪些方式可以加速页面的访问?
四、网站搭建
4.1 用户体验⭐
-
页面美观、整洁,有自己的风格;
-
让可以很容易的了解到网站的背景;
-
详细的网站介绍、联系方式,让用户可以方便的联系;
-
用户评论、顾客反馈等信息,让原有的用户影响新用户;
-
在网站设计中注重强化网站的品牌,让用户更了解、进而信任你的网站;
4.2 网站结构
4.2.1 树状结构
4.2.2 网状结构
4.2.3 二级域名还是子目录
-
通常来说,子目录的内容可更快继承站点的权重,而二级域名的可扩展性和独立性要高一些
-
内容差异大、相关度相对较低,独立性和可扩展性要求高,推荐使用二级域名。如 :https://sports.qq.com/
-
内容差异性较低,相关度较高,独立性和扩展性要求不高,推荐使用子目录。如:https://sports.qq.com/NBA
4.2.4 使用面包屑导航
4.3 网站内容
4.3.1 确保内容搜索引擎可识别⭐⭐
-
不要把 “ 期望被搜索引擎识别的内容 ” 放到JS、图片、FLASH 等非文本类的内容载体中;
-
如果你的网站是前后端分离的架构,请使用类似SSR的技术,使得内容被搜索引擎可识别;
-
如果网站中存在图片,请使用alt标签告诉搜索引擎图片是什么;
-
不要使用 frame 或 iframe框架 显示 “ 期望被搜索引擎识别的内容 ”。
4.3.2 确保内容的价值⭐
4.3.3 确保每1个网页都可通过1个唯一的URL访问⭐
-
不同的页面,不要使用相同URL,比如近些年较流行的 “ 单页面框架 ” ;⭐⭐
-
一个网页不要可通过多个URL访问,会让搜索引擎搞不清哪一个才是网页的主要URL⭐
4.3.4 确保已被收录的url链接可被访问⭐
-
如网址变更,请及时301跳转,跳转至内容的新的URL,
-
如网页已被删除无法访问,请在站长管理平台中(见7.4)作为死链提交删除
4.3.5 URL中包含目标关键词
-
关键词包含在域名中,如,前述的 zhaopin.com ,核心关键词为“招聘”
-
关键词包含在网页的url路径中,举例,目标关键词为 “ 张三的简历 ”,则推荐如下的url结构 zhaopin.com/jianli/zhangsan/
4.3.6 写好 title⭐
-
页面标题的写法有多种方式,切记勿对堆砌关键词,须自然、对用户友好(面向用户,适当考虑搜索引擎)
-
可以参考百度百科的写法,也是百度推荐的写法,如:百度百科的首页:网站名称_一句话简介(简介可包含目标关键词);百度百科的内页:内页标题_网站名称
-
良好的页面 title,不仅会影响搜索引擎对你的网页的识别和索引,也会影响用户在搜索结果中的点击行为,进而持续影响搜索排序。
-
不同网页的 title 不要相同;
4.3.7 写好 description
-
meta标签中的 description 的内容也会作为搜索引擎的较主要的内容识别参考标准之一,类似title,须面向用户自然友好的撰写,适当包含目标关键词;
同title,description 的内容,一般来说同样会在搜索结果中呈现,也是作为用户识别网页内容的参考之一,影响用户在搜索结果中的点击行为,进而持续影响搜索排序;
-
不同网页的 description 不要相同,相对而言,宁可为空。
4.3.8 内容与关键词的关联⭐
-
关键词分为 核心关键词 和 长尾关键词。
-
核心关键词 指 网站的核心的1-3个关键词,通常来说,核心关键词的检索量是巨大的,例如,汽车之家的 核心关键词 可认为是 “ 汽车 ” 。在核心关键词的优化工作中,取得绝佳的搜索引擎自然排名,是搜索引擎优化工作的最核心工作之一,它不仅能带来可观的流量,更是品牌的极大提升和体现。网站的首页通常承载着实现核心关键词优化目标的实现;
-
长尾关键词,指围绕目标关键词和产品的目标用户广泛分布的较小搜索量,但数量巨大的关键词,例如,汽车之家的某一条长尾关键词可能是:理想one 2021款价格。长尾关键词的单个搜索量可能远低于目标关键词,但因基数数量巨大,实际带来的流量通常远胜单一的目标关键词所带来的流量。网站的内容详情页通常承载着长尾关键词的优化目标的实现;
-
关键词的分布。页面中,面向用户的适当、自然的关键词的内容分布,有助于搜索引擎将您的页面和目标关键词建立起关联;
-
传统上建议目标关键词密度为2% – 8%之间,我个人不建议教条于此区间数值,保持面向用户、自然、合理,适当兼顾目标关键词的呈现就好。页面关键词密度检测工具:http://tool.chinaz.com/tools/density.aspx
-
4.3.1所述的图片的alt标签,也建议自然、合理的围绕页面的 目标关键词 产生关联,因为用户同样会在搜索引擎的图片搜索中使用这些 “核心关键词” 和 “ 长尾关键词 ”。
-
可适当在网页的 <h1> – <h6> 标签,以及 <b>、<strong> 等标签中,自然的包含关键词。这相当于告知 用户 和 搜索引擎,这些词语,是相对其它内容更重要的。勿滥用,也因为在漫长的搜索引擎进化史中,发现此类方法被滥用较多,也早已不在像多年前那么的重要了。
-
获得关键词搜索数据的工具:百度指数:index.baidu.com ; 长尾关键词的挖掘工具:https://ci.aizhan.com/ ;https://data.chinaz.com/
4.3.9 不要复制其它网站的内容
-
内容的生产,尽可能原创 或 二次加工后,提供更高的价值。不要直接复制其它网站已存在的内容。如大量此行为,可能会让搜索引擎认为你的网站内容的价值不大。
4.4 网站改版
4.4.1 只是更换域名,绝大部分内容无变化⭐
-
全站301跳转至新的域名
-
使用各大站长管理平台(见7.3)的 ” 网站改版 “功能,按提示操作,告知搜索引擎你的改动。
4.4.2 网站重构,内容绝大部发生变化
-
若重构后,网站的所属行业或领域、目标用户变化不大,权重依然会继承不少,新的内容也会较快收录,排名较全新域名会加分不少;
-
对可保留的,仅是更换了url路径的,推荐做301跳转,部分页面的权重和排名依然会保留。从用户体验的角度,显然这也是更友好的做法。
五、网站运营
5.1 内容运营
-
在漫长持久的运营过程中,持续围绕4.3 的建议,自然,频度分布合理的输出内容。
-
不要一次产生大量的内容,又间隔很久不产生内容
5.2 链接策略⭐
5.2.1 获取高权重网站的投票
-
质量、可信度更高的网站,对你的投票(即链接),更好。比如新浪的首页,指向你,这是极大的价值的;
-
相关度更高的网站,,对你的投票(即链接),更好。比如你要做开源软件,那么CSDN或者GitHub的首页能够链接指向你的网站,这是极大的价值的;
5.2.2 怎样判断网站的质量或权重
-
网站品牌的百度指数。有多少人每天搜 “ 腾讯 ” 两个字,侧面判断 tencent.com的质量和用户可信度。详细解释见 7.3;
-
对网站本身的用户价值和用户体验的判断,体现了网站的长期价值;
-
网站的其它服务的活跃度,例如app下载数据、社区活跃度;
-
网站的 “ 百度权重 ”。详细解释见 7.3;
-
网站的 alexa 全球排名。详细解释见 7.3;
-
网站在一些业内其它排行榜的排名:如,https://top.chinaz.com/ ;
-
网站的运营时间,通常 “ 关于我们 ” 里可查看
-
域名的注册时间时长。https://dns.tech/ 可查询
5.2.3 外链的位置
-
自然的被外部网站推荐、或者被用户推荐的链接的价值,高于在友情链接等处被推荐的链接;
-
高权重的页面(如网站的首页)推荐链接的价值,高于低权重页面的价值(如专门的友情链接页)
5.2.4 链接的锚文字
5.2.5 图片链接还是文字链接
5.2.6 重视你的导出链接
-
不要链接质量低下的网站
-
谨慎链接到新的网站
-
可以链接到较高质量的相关度较高网站
5.2.7 怎样获取大量外部高质量的链接
-
功能设计,社会化分享等功能,引导用户分享推荐你的网站;
-
策划活动,引导用户分享推荐你的网站;
-
同类型同质量或略高质量的网站的友情链接;
-
BD、资源置换等各种运营策略;
5.3 信任度和品牌
六、作弊与惩罚
6.1 常见作弊行为
-
构造目录发布低质内容;
-
通过刷点击,提升网站搜索排序的作弊行为;
-
通过网页标题作弊欺骗用户并获得点击的行为;
-
在页中、页尾堆积关键词;
-
通过网页劫持或跳转,欺骗搜索引擎;
-
通过算法,批量生成的无效内容,欺骗搜索引擎;
-
出售或购买链接。
6.2 易被打击的低质内容
-
采集;
-
伪原创;
-
批量生成的低质内容;
-
用户体验差:网页大量弹窗;
-
用户体验差:诱导下载。
6.3 惩罚与改正
-
对用户体验及搜索结果质量影响不大的,去除作弊部分获得的权值;
-
对用户体验及搜索结果质量影响严重的,去除作弊部分获得的权值并降低网站的权重,直至从搜索结果中彻底清理掉;
-
若被惩罚,改正后,搜索引擎会定期自动对作弊网站进行检测,大部分修正了作弊行为的网站,会在一定的观察期满后自动解除惩罚。
七、常见工具推荐
7.1 网站统计
百度统计:
7.2 网站数据分析
7.3 SEO 工具
Robots检测:
7.4 各搜索引擎的站长平台
bing站长平台:
八、后记
快乐工作,快乐生活
Happy work , Happy life
本篇文章来源于微信公众号: 腾讯CDC体验设计