页面收录工作列表
为了提高网页的收录,需要做如下的工作。
1.设置站点Sitemap,提交给搜索引擎,监控网页的收录进展
有些读者会有一种错误的认识,可能觉得做百度排名的没有必要去别的搜索引擎提交网站地图。这是一种错误的观点,因为搜索引擎许多因素都是互相借鉴的,网站在某一个搜索引擎当中获得较好排名后,一般情况下也会在别的搜索引擎当中慢慢地得到相应的体现,所以要重视各大搜索引擎的优化,首先就是要设置并提交网站地图Sitemap。
除了百度以外,谷歌、搜狗(包括必应)等都有Sitemap的网站地图提交渠道,甚至还有指定蜘蛛爬行某个页面的工具。但是Sitemap并不是一交了之的,其提交过程中也有策略规划。首先要了解网站地图。网站地图分很多类型,严格地说只要符合Sitemap.0.90规范的都可以称为Sitemap网站地图,其中又分以下3种常见格式。
·Sitemap.xml是最常见的格式,也是谷歌最喜欢的格式。
rss.xml或者 atom.xml。
· 纯文本的 urllist.txt。
了解网站地图种类之后,我们还要知道网站地图提交的主要目的,即指引搜索引擎蜘蛛顺利爬行网站,提高收录速度和网站收录率。所以,在网站地图建立前,SEO人员必须要先按照网站框架做好规划,将各页面的重要性和更新频率决定好,将不太更新的主要页面分割出来,编写成Sitemap.xml类型的网站地图;将更新度比较频繁的页面,比如新闻、动态、评论等编写成rss.Xml或者atom.xml类型的网站地图。在提交的时候分别提交这两个地图,这样搜索引擎会按照提交的网站地图类型准确地判断包含地图的网页类型,并且合理安排蜘蛛来网站定期进行爬行。站内链接的合理建设是SEO的重要技术之一,站内链接的优化能使网站整体获得按2.设置良好的站内链接索引擎的价值认可。网站可以从以下五个方面来优化站内链接。
(1)制作网站导航。制作网站导航栏的注意事项有:第一,尽量使用文字链接;第二不要使用JavaScript 调用方式,尽量使用CSS特效方式;第三,图片导航的ALT一定要加入说明;第四,导航名称一定要通俗易懂。
(2)制作面包屑导航。所谓面包屑导航就是“您当前的位置:主页>SEO资源>友情链接交换”这种形式。面包屑导航的架构使用户对所访问的页面与其他页面在层次结构上的关系一目了然,这种网站结构最明显的特性体现在返回导航功能。此外,良好的网站导航还应对访问者透明,即访问者能够在网站中来去自如,但又无需经过层层顺序,这样就会将主动控制权交给网站的访问者而非设计者。
(3)制作网站地图。Sitemap在前面介绍设置站点网站地图时已经提及,网站地图其实就是一个页面,上面放了很多本网站的链接。网站地图对提高用户体验很有好处,它为网站访问者指明方向,还可以为“蜘蛛”提供可以浏览整个网站的链接,并指向一些比较难到达的页面。
(4)制作相关性链接。在用户阅读完某一篇文章后,会看到文章下面有一些关键词相关的文章列表,用户很可能通过相关文章进行深入挖掘,直到用户对该主题兴趣消失。而这种方式可以使用户达到最大满意度,因为内容是关联性的。
(5)制作内文链接。这里所介绍的内文链接是在文章内容中出现的链接,如果在文章中出现陌生术语或相关关键词,这时应当将这个词语链接到相应的页面。这样做不单是为用户考虑,更重要的意义是对网站的文章做一个连接载体。如果网站多数文章都有内文链接,将会形成一个非常复杂的内链网络,这样的优化传递对于整个网站权重的提高有很多好处,是制作站内链接的重中之重。制作内文链接的方法可以分为自动和手动添加两种。前面介绍的四个是固定模式,所有网站都可以有的功能。而内文链接就需要下功夫了,不是每个网站都能把内文链接做好的。
坚持做好以上五点方法基本就可以了。一个网站站内链接设置不合理的话,搜索引擎就很难在所提交的网站更深入地爬行,这样不但收录得不到增加,而且会减少搜索引擎对网站的权重。
3.监控网站爬取异常提示,确保网页的正常访问页面被搜索引擎收录之后并不是万事大吉,还需要时刻监控网站的爬取异常提示,并要着重注意以下8个方面的异常情况。
(1)检查程序最大线程数是否足够。
(2)程序代码是否不够优化,如出现死循环、死锁。
(3)Web配置文件的参数是否不够优化。
(4)查看Web和系统日志是否有访问异常。
(5)网站是否被盗链。
(6)是否有搜索引擎爬虫大面积爬取网站。
(7)是否受到了小型网络攻击,进程是否有异常。
(8)检查机器是否中毒或中木马。
根据不同的服务器类型可以选择不同的方式来获取异常信息。Linux服务器可以通过系统日志、Web日志和一些top、free、uptime、sar、ps命令查询原因,Windows服务器可以通过资源监控器分析。
|