网址规范化做搜索引擎最喜欢的URL

网址规范化(URLcanonicalization)指的是搜索引擎挑选最合适的URL作为真正(规范化的)网址的过程。

为什么出现不规范网址,举例来说,下面这几个URL—般指的是同一个文件:

http://www.domainname.com

http:// domainname .com

http://www.domairmamexom/index.html

http://domainname.com/index.html

但是从技术上来讲,这几个URL都是不同的网址,搜索引擎也确实把它们当做不同的网址。虽然在绝大部分情况下,这些网址所返回的是相同的文件,也就是网站首页,但是从技术上说,主机完全可以对这几个网址疼回不同的内容。除了上面因为带与不带www造成的,以及结尾是否带index.htmi文件名造成的不规范网址,网址规范化问题还可能由于如下原因出现:

cms系统原因,使同一篇文章(也可以是产品、帖子等)可以通过几种不同的URL 访问。

URL静态化设置错误,同一篇文章中有多个静态化URL。

URL静态化后,静态和动态URL共存,都有链接,也都可以访问。

目录后带与不带斜杠。(http://www.domainname.com 和 http://www.domainnanie.com/ 是不同网址,但其实是一个页面)。

加密网址 http://www.domainnamet.com 和 https://www.domainname.com 同时存在,都可以访问。

URL中有端口号, http://www.domainname.com:80 和?http://www.domainname.com

跟踪代码,有的联署计划或广告服务在URL后面加跟踪代码,如http://www. domainname. com/?affid— 100?显示的都是首页内容。

网站出现多个不规范网址会给搜索引擎收录和排名带来很多麻烦。比如,网站首页应该是固定的,只有一个但很多站长在链接回首页时所使用的URL并不是唯一的,一会儿链接到 http://www.domainname.com —会儿是http://www.domainname.com/index.html。虽然不会给用户造成什么麻烦,因为这些网址其实是同一个文件,但是给搜索引擎造成了困惑,哪一个网址是真正的首页呢?哪一个网址应该被当做首页返回呢?如果网站上不同版本的网址同时出现,那么两个或更多版本的URL都可能被搜索引 擎收录,这就会造成复制内容。搜索引擎计算排名时必须找到所谓规范化的网址,也就是 搜索引擎认为的最合适的URL版本。

网址规范化造成几个问题:

cms系统在不同地方链接到不同的URL,分散了页面权重,不利于排名。

外部链接也可能指向不同URL,分散权重。

搜索引擎判断的规范化网址不是站长想要的那个网址。

如果网址规范化问题太严重,也可能影响收录。一个权重不很高的域名,能收录的总页面数和蜘蛛总爬行时间是有限的。搜索引擎把资源花在收录不规范的网址上,留下给独特内容的资源就减少了。

复制内容过多,搜索引擎可能认为有作弊嫌疑。

要解决URL规范化问题有很多方法,比如:

确保使用的CMS系统只产生规范化网址,无论是否有静态化。

所有内部链接保持统一,都指向规范化网址。以带与不带www为例,确定一个 版本为规范化网址,网站内链接统一使用这个版本。这样搜索引擎也就明白哪一个是站长希望的规范化网址。由于用户习惯,通常选择带www的版本为规范化网址。

在Google管理员工具中设置首选域。

使用301转向,把不规范化URL全部转向到规范化URL。下一节将深入讨论。

使用canonical标签。后面将深入讨论。

提交给搜索引擎的XML网站地图中全部使用规范化网址。

但这些方法都各有局限:

google管理员工具不适用于其他搜索引擎。

有的网站因为技术原因做不了301转向。

CMS系统经常不受自己控制。

内部链接自己可以控制,但外部链接不受控制。

所以,虽然有解决方法备选,但到目前为止网址规范化一直是困扰站长及搜索引擎的 —个问题。据估计,网上有10%?30%的URL是内容相同但URL不一样的不规范化网址。 为了万无一失,经常需要综合使用多个方法。

Seo先生博客发布,固定地址:http://SeoSir.cc/564.html?转载请注明。

关于Google沙盒效应(sandbox)

如果你的新网站在Yahoo, MSN和其它搜索引擎上有不错的排名,但却在Google表现不佳,这是有可能你的网站被Google请进了它的sandbox(沙盒)。

——什么是Google sandbox?

通常,新域名下的网站最终需要6-8个月时间才能在Google获得顶尖排名。

Google首先索引新网站,在一些不是很重要的搜索词下能够找到新网站,但之后就从搜索结果消失几个月时间,有时连公司名也找不到。

Google之所以故意延迟对新网站的排名及收录表现,据猜测是因为Google力图要鼓励站长注重网站内容建设,而不是单纯地为网站建立外部链接,尤其是一些垃圾链接如自制小型链接网络。

目前很多站长和SEO服务商人为地为网站建立外部链接,比如制造一些不同URL的网站彼此互链,形成一个小型链接网络,很多这类子站没有任何内容意义,唯一的目的就是链向主站。

因此,Google通过延迟对新网站的排名,让这种小型链接网络策略失效,同时鼓励站长多做内容来吸引访问量。

——遭遇sandbox如何解决?

如果你有一个新网站,牢记把内容做扎实,并且通过正常渠道建立起有价值的外部链接,当然,别忘了针对Google做基本的优化工作。

一旦你拥有了新域名,先创建一个临时页面,并在其他被收录网站上对它做一个链接,让Google索引到这个页面。因为6-8个月的时间应该是从Google第一次抓取到它开始计算,因此,Google对它知道越早,你的网站走出沙盒的时间就越快。等到内容完全做好,正式发布的时候,你已经快要走出sandbox了。

——有什么办法可以缩短google sandbox时间?

据说还没有什么办法可以缩短这一时间段。有人建议可以为网站的不同页面争取外部链接,而不只是首页,或许可以产生效用。

还有人说如果你的网站有独立IP或者来自Yahoo目录链接都可以尽早走出沙盒,但这些言论均未有证实。

——什么样的网站更容易走进沙盒sandbox?

1)当短时间内出现大量链接而非自然增长是容易被放进沙盒观察一段时间,因为不少的垃圾站就是大量的购买链接现在短时间内提升网站权重。

2)当你的新站的主关键词竞争比较激烈的时候,搜索已你去那个非常的重视用户体验他不希望一个热门关键词里出现垃圾内容影响用户体验。

——怎样避免走进沙盒,怎么样走出沙盒?

要想走出沙盒最好的就是别进去那该死的地方,针对沙盒现象的特点我们尽量避免就可以。

1)在网站的初期尽量避免使用竞争激烈的关键词。

2)在网站开始收录的1-2个星期里不发外链或者少发外链。

3)网站内不存在垃圾或伪原创文章,至少用户能要能读懂。

4)建设内链,良好的内部优化会让搜索引擎更加的相信你的网站。

即使我们在小心也不能百分百的避免走进沙盒的危险搜索我们就要做双面准备,那么怎么才能尽快的将新站拉出沙盒呢?

1)首先原创文章与外链发布不能间断。

2)如果手上有已经被收了的网站可以做链轮增加网站权重(不懂链轮的就别考虑可能导致几个网站全部被K)。

3)买高权重网站外链。

4)做一级目录。

总之,Google sandbox是为了保证搜索结果高质量而对那些单纯针对搜索引擎而不是用户的SEO行为采取的防范措施。要在Google长期获得好的收录和排名,还是要坚持用户为本的搜索引擎优化策略。无论原因怎样,对待沙盒效应,正确的态度和方法是:保持冷静,当排名在短时间内迅速上升时不应盲目乐观,因为这是不稳定的表现。应该利用这个有利时机,频繁更新网站内容, 提高内容质量,获得更多高质量导入链接,增加网站访问量,才能将排名优势一直保持下去。

Seo先生博客发布,固定链接:?http://SeoSir.cc/485.html 转载请注明。

为WordPress博客添加百度地图和谷歌地图

今天给已使用WordPress博客新手站长们说说如何添加百度地图和谷歌地图,为何要建立网站地图?它可以让搜索引擎蜘蛛提供可以浏览整个网站的链接;为搜索引擎蜘蛛提供一些链接,指向动态页面或者采用其他方法比较难以到达的页面;作为一种潜在的着陆页面,可以为搜索流量进行优化;如果访问者试图访问网站所在域内并不存在的URL,那么这个访问者就会被转到无法找到文件的错误页面,而网站地图可以作为该页面的准内容。

首先,给大家推荐这两款插件:

1.Baidu Sitemap Generator
This pulgin generates a Baidu XML-Sitemap for WordPress Blog. Also Build a real Static Sitemap-Page for all Search Engine. | 生成百度 Sitemap XML 文件。就相当于网站被百度–全球最大的中文搜索引擎订阅,进而为您的网站带来潜在的流量。同时生成一个静态的站点地图页面,对所有的搜索引擎都有利。

2.Google XML Sitemaps
This plugin will generate a special XML sitemap which will help search engines like Google, Yahoo, Bing and Ask.com to better index your blog.

包括笔者在内一直都是使用这两款插件,它们完全可以满足百度和谷歌对你博客的抓取。Seo先生推荐使用。

关于百度收录新规则

在A5中,看见了一篇关于关于百度收录新规则的文。整理精简下发布,大家交流。

1、URL中出现关键词
url链接中包含页面的关键字可以使搜索引擎增加对链接页面以及本页面的关注度,有利于在百度的收录;

2、网页Title中出现关键词
毫无疑问,所有的搜索引擎优化们都认可Title中出现关键词对于网页排名的用处;

3、常规内容中出现关键词
适当的关键词密度有利于页面在搜索引擎索引中获得好的名次;

4、在页面的第一段中出现关键词
搜索引擎似乎特别关注页面的开头以及页面的底部,似乎在文章开头或者结尾出现关键词有强调关键词的作用,尤其是在文章的第一段,似乎搜索引擎还在沿用截取的办法获得文章的描述,如果页面没有设定描述的话; (more…)

设计网页对搜索引擎友好全分析

很多朋友和我聊天,有会说SeoSir.cc博客里的很多文看的很无厘头,自己就没基础,好多看不明白。那今天就简单的介绍下“基础”内容。首先,我们要知道一个网站对于搜索引擎友好的重要性。好的优化利于搜索引擎好的排名,从而有好的客户访问量,这就可以带去好的业务咨询量,带动企业的发展,这也就是我们一直在说的搜索引擎营销。下面我就来简单的说明几点,供大家思考学习: (more…)