对网站进行优化的成败及最终效果取决于搜索引擎如何看待我们的工作。如果在优化过程中不遵循基本的SEO原则,那么,无论付出多大都不会取得意想中的效果:如果我们所做的一切并没有被搜索引擎“看”到,我们的网站在搜索页面中的排名怎么会靠前呢?
什么是Spider
Spider是搜索引擎用来访问Internet上网站的自动程序(即通常意义上的Robots)。一般说来,不同搜索引擎的Spider的功能与手段大致相同,它们都用来在网站内“爬行”,读取Web页面,将其纳入搜索引擎的索引数据,在此基础上,搜索引擎才能依据各自的算法决定索引数据库中网站的相关性、排名等,当然,不同的搜索引擎采用不同的算法,索引网站的具体技术也各有特征,不过,我们今天要讨论的重点是Spider对什么感兴趣,哪些又是Spider所忽略的——毕竟spider决定别人是否能够发现我们的网站——了解了这些,我们才能更有针对性地建设、改进我们的网站。
从根本上说,正因为搜索引擎的 spiders 只是“程序”,这就决定了其不可能象人那样去读相应的网站,比如说,象图片、Flash、JavaScript等可以对人视觉有很大冲击的建设对Spider来说则是“不可见的”,它们只认识特定的标识。这就需要我们针对Spider的“好恶”来调整网站的建设。
Flash、JavaScript、图片与框架
对spider来说,Flash、JavaScript、与图片中的文本是不可见的,框架在很多时候对 SEO来说则更是一场灾难。也许上述的元素可以让我们的页面更漂亮更吸引人,但对搜索引擎来说则是另一回事。至于在某些图形建设者网站常见的使用Flash首页的情况更要命,在那些页面中,关键词与链接均被嵌入在flash中,这根本不能被搜索引擎解读嘛,搜索引擎在这样的页面上几乎看不到任何感兴趣的东西,这还谈什么搜索结果排名?
事实上,Spider读取页面的方式类似于“古老”的文本浏览器,它们看不到文本之外的其他内容,所以,图片中的文字对Spider来说毫无意义。对于网站中必须使用的图片与Flash,可以采用在其的alt属性中加入对图片的描述,当然,在描述中要注意不要过度使用关键词,不然又走向了另一个极端即“关键词填充”。
链接
很多网站在链接中使用javascript如mouse over事件来实现很华丽的效果,但这样的链接Spider往往不能有效地解读而被忽略,这就造成了Spider在网站内“爬行”的中止。对这类问题的解决办法是加上<noscript>标签,把相应的链接添加到<noscript>语句中。
动态页面
动态生成的网站,尤其是使用类似于“?id=14”的页面,对 spiders 来说也是很难理解的,虽然大多数搜索引擎一直在着力解决这个问题,但在很多情况下仍不能象静态网站那样对spider更友善。如果条件允许的话,可以通过采用相应的url Rewrite技术来说spider认为那是一个静态网站,缩小其阅读的难度。
为确保无误,在网站建设好后,可以使用spider模拟器来检查一下Spider眼中我们的网站是什么样子的,是不是与我们建设的初衷有所偏离。类似的spider模拟器网上很多,如这个。毕竟,只有在保证我们的网站能够被搜索引擎正常收录的条件下,谈搜索引擎排名的优化才有意义。