动态url不利于收录,需要先实现伪静态化,在服务器上使用rewrite模块重新编译,更方便被收录。
01- 网站 URL静态化
(1)搜索引擎在发展初期,一般 不太愿意爬行和收录动态URL, 主要原因是可能陷入无限循环或收录大量重复内容,造成资源极大浪费。
(2)故以前的搜索引擎对动态URL敬而远之,要想网站页面被充分收录,站长需要 把动态URL转化为静态URL 。
(3)最常见的方法是使用服务器的URL重写,以LAMP服务器为例,要想把URL: ,静态化为: ,需要启用服务器mod_ rewrite模块 ,然后在.htaccess文件中写入如下代码:RewriteRule /products/([0-9]+) /products.php?id=$l
“伪静态化”——也就是说服务器上还是不存在相应的 HTML文件 ,用户访问时还是动态生成页面,只不过通过URL重写技术使网址看起来像是静态的。
(4)一般来说还是建议将URL静态化, 既能 提高用户体验,又能降低收录难度 。
02-网站UR规范化
(1)含义 :url(Uniform Resoure Locato),统一资源定位器,是internet 上用来描述信息或资源位置的字符。
(2)规范1:url越短越好 (不超过1000个字母都会被收录)
→url地址中,域名、目录名、文件名要突出关键字与页面内容相关性。
→避免太多参数。
→目录层次尽量少(不大于4层)。
→文件及目录名具有描述性。
→字母统一小写。
→ 连字符 使用:短横线-
(5) (3)规范2:统一到某一URL
→例:,,,,以上四个网址都是同一个url,但搜索引擎认为这是4个不同网址。(统一的做法:统一设置链接到)
→搜索引擎分不清真正的网站会导致:
A、分散页面权重,不利于排名。
B、外部链接也可能指向不同url,分散权重。
C、搜索引擎与站长想要的网址不是统一。
D、影响收录。
E、复制内容过多,搜索引擎可能认为有作弊嫌疑。
(6) (4)规范3:规范URL
A、确保使用的cms系统只产生规范化网址,无论静态与否。
B、所有内部链接保持统一,都指向规范化的同一个网址。
C、使用 301重定向 ,把不规范的转向规范化的url。
D、向搜索引擎提交时,提交统一规范的url。
E、提交的xml网站地图中使用统一规范化的同一网址。(注:地图有利于 蜘蛛 爬取到各个页面。 谷歌 喜欢的是xml地图, 百度 喜欢的是html地图)
动态URL的伪静态化,及规范统一化,一方面有利于收录,一方面做好重要页面的引流,提高网站的友好体验,包括搜索引擎蜘蛛和用户体验。