网站目录加斜杠是否对排名有影响
一般而言,url在末尾处是不是加上斜杠“/”,对用户访问是没有太大影响的,大多数的Web服务器均能正确解析:当Web服务器接收到对某个末尾不含斜杠的url请求时,如“http://www.zhaorongtao.com/web”,其首先假定在网站根目录下存在一个名为“about”的文件,至于具体的文件格式则取决于web服务器的具体设置,根据设置不同可以是 html或其他任何格式如:asp、php、jsp等文件,如果当在相应目录下找不到该文件,主流的Web服务器如:Apache或IIS便自动将其作为目录处理,在上述例子中即在根目录下查找名为“about”的目录,如果存在这个目录,则向客户端浏览器返回这个目录的默认文档;而对以斜框“/”结尾的url,web服务器则直接将其按目录处理。
这一过程由Web服务器自动处理,用户基本上感觉不到。当然,也不排除在极端情况下web服务器不能正确解析而返回404 错误。正因为此,许多网站在建设中往往忽略网址中的斜杠问题,在撰写url时比较随意,部分url在末尾处加了斜杠而另外部分则未加斜框,等等。
另一方面,即使网站建设者在自己的网站内能够规范地撰写url,即对除针对文件外的网址均在url末尾处加上斜杠,但同样也存在一个问题:别的网站创建的链接未必在末尾处包含斜杠,这同样会带来问题。
因此,理想的解决办法便是让web服务器能够自动为末尾没有斜杠的url添加“/”。
url末尾处加上斜杠“/”能够有效的避免Duplicate Content。
从SEO(搜索引擎优化)的角度,网站内出现过多的重复内容(Duplicate Content)是一大忌。简单地说,所谓重复内容 (Duplicate Content),是指同样的内容、页面可通过多个不同的url访问,这往往会给搜索引擎收录、影响网站排名。
很多Seoer一般比较关注域名中含“www”与不含“www”的问题,即类似于“http://www.zhaorongtao.com”、“http:/www.zhaorongtao.com”造成的重复内容问题,却容易忽略url末尾的斜框可能带来的重复内容。事实上,这也是极易带来重复内容的主要因素。虽然在浏览器中,“http://www.zhaorongtao.com/about”与 “http://www.zhaorongtao.com/about/”虽然都链接至我们的”关于“页面,但对搜索引擎而言,这是两个完全不同的的网址,这样的两个 网址指向同一个页面情况正是标准的Duplicate Content。
在url末尾处加上斜杠“/”能够提高web服务器的效率。
从本文开头所介绍的web服务器解析url的机制可以很明显地看出,当url指向目录而末尾没有斜杠“/”时,web服务器需首先进行一个查找有无同 名文件的过程,这无疑会加重Web Server的压力,而以斜框结尾的url则可省略这一过程。
当然,web服务器的性能取决于很多因素,仅仅这样做,即在url末尾添加斜杠,对服务器性能的提升影响很小。但如果您的网站访问量相当大,积少成多,带来的好处也是很可观的。在Apache中自动将末尾没有斜杠的url以301重定向至正确地址。
要避免网站在搜索引擎中出现重复内容,最简单的解决办法便是将不同的url以301重定向至一个标准的url上,这样,才能最大限度地挖掘链接的价值,特别是来之不易的外部网站链接。
Apache由于支持mod_rewrite功能,在.htaccess中进行简单设置即可实现这一点,即将没有以斜框“/”结尾的url永久重定向 至以“/”结尾的网址。至于IIS,要实现类似功能,似乎并没有太简单的方式。
下面即为实现这一功能的.htaccess代码:
RewriteEngine On
RewriteBase /
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_URI} !(.*)/$
RewriteRule ^(.*)$ http://www.zhaorongtao.com/web/ [L,R=301]
说明:
* RewriteCond %{REQUEST_FILENAME} !-f : 指定操作仅针对目录,对指向文件的url不进行rewrite操作;
* RewriteCond %{REQUEST_URI} !(.*)/$ :判断url是否以斜杠“/”结尾;
* RewriteRule ^(.*)$ http://www.zhaorongtao.com/domain/ [L,R=301] :自动将符合上述条件的url以301跳转重定向至以斜杠结尾的版本,比如说将“http://www.zhaorongtao.com/about”重定向至 “http://www.zhaorongtao.com/about/”,其中“L”指该行为规则的最后一行,而“R=301”则指明采用301 Redirect。