纯新手建站入门(下)

2023/09/02 #建站 & SEO 本文总阅读量:

书接上回,继续说建站,这次我们主要讲如何让搜索引擎发现我们,也就是收录我们,这里我假设你已经做好了静态站点,不管你使用的什么静态网站生成工具.

为什么要让搜索引擎收录我们的网站?

这个问题其实都不是问题,如果搜索引擎都不收录我们的网站,试问别人如何得知你有个网站呢?都不知道你的网站了,谈何访问量?因为只有搜索引擎收录了你,用户在搜索相应的关键词的时候,搜索引擎才能把你的网站推荐给对方.

那如何让搜索引擎收录呢?

搜索引擎自身有爬虫,收录网站基本就两种方式.

  1. 你等它来爬你的网站,爬虫会定期的光顾你的网站,看看你哪些页面是可以爬的,它会挨个遍历,等待收录.
  2. 你主动告诉它,通过前面一篇文章里讲到的sitemap.xml文件,这里有篇文章介绍了这个文件的格式.你需要自己编写下这个文件,但是现在一般的静态生成器都有对应的sitemap插件,你可以自行搜索下,一般都有的.

基本就这 2 种方式了,个人觉得第二种更高效,也更方便,推荐大家都使用第二种方案.

这里有个新的东西出现了,叫做robots.txt,是一个文本文件,一般放在你的静态站点的根目录,格式在这里有说明.

简单来讲它的作用就是告诉搜索引擎,哪些网址可以被收录,哪些不能被收录.有人可能要问了,怎么还有不想被收录的?这里有 Google 能够收录的文件类型,你可以看到它能收录的东西太多了,必定会有一些是你不愿意被爬虫爬到的,这时就需要这个robots.txt派上用场了.这个文件可以利用一些在线的生成工具来生成,不必自己编写,只需要定义好哪些地址是能被索引的,哪些是不能被索引的就可以,比如去这里生成,对了它还可以定义允许哪些搜索引擎的爬虫来爬,比如你很讨厌baidu,可以屏蔽它,前提是对方遵守游戏规则.

是时候上线你的网址了

到这里,可以考虑上线你的网站了,这里我直接使用了CFPages服务,部署的静态站点.大家可以自行选择,比如之前提到的Vercel也是非常不错的,千万不要自己购买vps,搭建nginx之类的,那会很麻烦,还要自己申请免费的ssl证书,管理nginx,投入过大,不划算也没必要.

至于CF上线Pages很简单,大家按照官方文档操作就可以了,还支持绑定自定义域名+免费ssl证书,不香吗?

实际操作提交 sitemap 或者 URL

好了,到了这一步,完事具备,只欠东风了,我们的静态站点已经做好了,各种准备也已经到位了,目前全世界最大的搜索引擎是Google,当然要首先告知Google了.去注册一个GSC(Google Search Console)账号,就是Google站长工具,在这里你可以提交你的sitemap地址或者单个的URL.

下图是我提交的 sitemap,可以看到,这个地址里面包含了 21 个网页.

jsonconert.net在Google Search Console提交的sitemap

提交完成后一般需要耐心等待搜索引擎过来爬取你的网站,这个过程每个人不一样,有的 1-2 天就被收录了,有的等了 1-2 周.我这个站基本 2-3 天就有被收录了.

这只是GSC,还有其他的搜索引擎,比如Bing,比如Yandex等,都可以自己去提交sitemap,一般这些站点都需要验证你的网站所有权,基本都是放一个文件到你的静态站点根目录,或者dns TXT记录的方式,大家根据提示自行操作即可.

如何得知是否已经被收录了?

刚提交完sitemap的时候,我感觉要起飞了,恨不得立刻被收录.实际上这个过程就是等.2-3 天基本Google能收录,其他的不好说,最坑的是Yandex,7 8 天才有收录.查看收录的办法主要有 2 个:

  1. 在你提交sitemap的地方一般会有显示.如果没被索引,下面也会告诉你原因.

jsonconvert.net的收录显示

  1. 直接在搜索引擎搜索,比如Google的,在 Google 的搜索框里输入site:你的站点地址,比如我的site:jsonconvert.net

jsonconvert.net的Google收录结果

这里你可以核对下,你的sitemap文件中的地址和实际Google搜索出来的地址是否一致,如果搜索出来的还要少,你可能需要在GSC上看看原因了,比如上图我有的被Robots.txt屏蔽了,有的返回了 HTTP 状态码301或者302,或者没有带canonical标签,大家根据提示自行修改即可.

你会遇到哪些不收录的情况?

我想你大概率会遇到以下一些不收录的情况,我这里列举下我遇到的,以及对应的方案:

  1. 备用网页(有适当的规范标记) 这个是什么意思呢?其实就是前面一篇文章里说的canonical标签,比如https://example.com/search?key=hahahttps://example.com/search?key=ha所渲染出来的结果是一样的,那么就说这个页面有多个地址,你需要在你的页面里明确的告知搜索引擎,哪个才是主要的地址,希望搜索引擎收录的地址,AHRefs一篇文章对于这个讲的非常好,推荐大家去看看.
  2. 网页会自动重定向 这个好理解,就是请求的地址没有正常返回200,而是返回了301,302类的跳转,搜索引擎对这个没办法处理,有一种情况是你的站点是全站https,所以http访问会自动跳转到https,这种没办法,我没找到好的办法.CF在这里有个天坑,访问你的静态页面,比如html后缀的,它会把.html去掉,换成/访问,比如https://jsonconvert.net/json-to-xml/index.html,它会自己返回308跳转到https://jsonconvert.net/json-to-xml/,我最后没找到什么好的解决办法,索性 URL 就按照CF的来,在最后加一个/,原因就是在于json-to-xml是一个文件夹,里面有个index.html,但是这个是Hexo生成的,我也没研究如何更改它,所以按照CF来,这个地址还更短,更好看.
  3. 已被 robots.txt 屏蔽 这个没啥好说的,自己设置的,自己看着办就行.
  4. 重定向错误 这个一般是你提交的URL不对,改对了就行.
  5. 已发现-尚未编入索引 这个就是需要你继续等到,等到搜索引擎来收录,没什么别的好办法.

终于结束了?不,这才是刚开始.

网站上线了之后需要干什么?当然是检测又没人访问你的站点了.这个后续有人看的话,我会继续写一些我实践过的文章.目前最重要的是找一些免费的SEO检测工具,对我们的网站来个体检,看看有没有需要优化和整改的地方.这里我推荐几个,都是我使用过的.

  • web-check,强大的免费的开源的检测工具,它检测了很多东西,大家可以自行试用.
  • seoptimer,每天有免费的次数限制,很全能,基本你能在这里找出你所有的问题.

以下是使用 seoptimer 对 jsonconvert.net 的 SEO 检测结果 使用seoptimer对jsonconvert.net的SEO检测结果

可以看到得分是B-,说明还有待提高,最好是能到A+,我看了下主要问题是出在了网页的meta tagtitledescription上,字数超长了,接下来我会改掉,争取到A+

它还可以显示在搜索引擎的 SERP 结果预览.大家可以根据页面上的提示,自我修复下,尽量保持A+得分.

显示在搜索引擎的SERP结果

最后就是保持耐心了

SEO能看出效果的,最短也要 3-6 个月,保持耐心,每天上Googlesite指令看看收录情况,根据GSC里的数据看看哪些关键词经常被搜索,但是缺没有点击,找找原因,分析下,优化了试试.就是如此.

这篇文章到这里就结束了,本文主要针对的是Google搜索引擎,建议建站使用英文,因为国内的CPC很低,不是很推荐大家做中文站点.最后,这次说是失败了,其实也学到了不少的东西,后面我又建了个Online Timer的站点,这是后话了,建第二个站明显就比第一个要快,知道哪些坑应该避过去,但是又进入了新的坑,后续我还会继续分享,感兴趣的朋友们可以收藏下,也欢迎转发,保留出处即可.

希望这篇文章能帮屏幕前的你!

Copyright © 2023 | 老王分享 | JSON转换器 | 在线定时器 | SITEMAP | RSS | 联系我| Build with Astro And Tailwind CSS 本站总访问量: