|
0 v Q% z( T0 [ 百度互联网创业俱乐部搜 8 X5 O1 l0 E5 n$ w
索引擎优化指南
; C1 H& W8 D9 X9 \; O: O版本号:V1.0 ' s; I& g o* ~- u4 K# `+ C/ @
@ Baidu 2010 + N6 ^4 b9 W( s
2 百度搜索引擎优化指南
Z8 ~8 ]! a' s+ D
8 U N+ Q3 U2 I0 i& m
/ t4 b" c A$ |- m# I
: W' [& X3 b2 X& |. C4 ]% U4 U前言
* U2 H, d G1 \SEO(Search engine optimization,搜索引擎优化),指为了提升网页在搜索引擎 W r) t. B9 O+ v7 u" u
自然搜索结果中(非商业性推广结果)的收录数量以及排序位置而做的优化行为,这一行为
" z. n# S, @8 n7 D2 c0 o/ G的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现形象。而SEM(Search
3 k' [1 [, _8 p) R5 iengine marketing,搜索引擎营销),则既包括了SEO,也包括了付费的商业推广优化。
- b+ G. e0 N' n8 {( Q毋庸讳言,SEO 自从1997 年左右出现以来,就和搜索引擎处于某种对立状态。这种 $ g1 q7 p, L: ^4 \$ f8 d4 b
对立源于两方面:
$ J( H$ a4 Y: d2 C( x) R一方面,大量SEO 行为只考虑了如何获得更多的“免费”流量,至于多的这些流量是否 7 P$ W# G+ f) B. u
符合搜索用户价值,则不在考虑范围之内。这种SEO 被称为“黑帽”,历来受到搜索引擎的 7 G9 k( R5 W; {2 `4 n
严厉打击。 , N3 n' O1 n; f: V C
另一方面,SEO 的目的是为了获取更多的“免费”流量,这和搜索引擎的商业推广是对立 I) r5 v: M" e6 e
的。所以很多SEO 的从业者,包括相当多的搜索引擎从业者,从心底里认为,两者的利益 3 c% d9 \& u' j: `& G* x, B3 F4 Y9 \# f
就是不可调和的。 & N7 k) Y# L" {- _. m
但如果从更加长远的角度来看,搜索引擎和SEO 从业者的利益,实际是有高度一致的
& R. }0 V- |9 t9 [ a5 h) ]* I3 ]地方的:
( v+ R) `$ E9 L; t* G首先,搜索引擎的搜索质量改善,很大程度上受到资源形态的影响。比如很多优质资源,
1 |* B, m8 z! u是用Flash 或者Ajax 做的,搜索引擎就无法很好的爬取和索引。搜索引擎无法独立承担起
" R0 g0 F: Z/ s, t0 w9 Y6 k) {这个引导教育职责,有了SEO 参与其中,这些优质资源就可以更好的发挥其检索效果,改
! U. B' t3 L( o ~0 r1 m善用户搜索体验。
" O% H: M; o# j5 S. i& _7 U3 f其次,SEO 从业者也是搜索引擎商业价值很好的布道者。尤其对于中国这样的新兴市 $ o6 q# h! s4 q% G& G
场,传统的中小企业对于如何触网,如何做互联网营销,并无多少经验。SEO 在其中可以
2 H0 K2 t7 e& e6 I8 j& `扮演非常重要的角色。而这种布道,对于搜索引擎产业价值的拓展,是很有好处的。 ) m( b! n6 x- @7 W7 F% C8 r
基于以上原因,我们需要重新审视搜索引擎和SEO 之间的关系。两者宜建立起一种更 & W9 U1 H4 V5 q- b
加良性的共生关系,驱逐劣币,提携良币,以使互联网生态圈得到更加健康有序的发展。百
1 s0 u0 w% y) A/ L度作为中文搜索领域的领导者,有责任和义务来推进这个事情。这也是本文档发布的初衷。 \. x& J8 h. A! \
我们先来看一下过去的问题所在。 2 I3 q4 H8 B0 J3 Q; }
(1) 黑帽SEO 大行其道,占据了SEO 主流话语权 " z" |1 [! C' [9 D
黑帽SEO 行为,通常就是一般所谓的“搜索引擎作弊”。利用和放大搜索引擎的策略缺 # p% d7 R3 l+ _) E9 A9 A
陷(实际上完美的系统是不存在的)获取更多用户访问量。而这种更多的访问量,是以伤害 0 B7 \2 q4 u3 o4 ~4 K7 J2 {
3 百度搜索引擎优化指南 - ` ^$ Y2 f3 L2 ~: K8 X! q8 z
用户体验为代价的,而这会危及一个搜索引擎的生存基础。所以,面对这样的行为,如果短
. R# M2 Y! O, L# j: p7 T! x期内无法修补系统,搜索引擎也会通过一些临时策略进行遏制以免事态的失控。在作弊领
0 T2 Y- w- a1 D% [7 S6 W域,破窗效应是非常明显的。 / l' t5 u/ t6 h4 T7 [) N% s
很多人会说,整天说作弊作弊,到底哪些行为是作弊?这是无法穷尽的。互联网在动态
! C3 Z1 U* ~/ u9 `' x的发展,搜索引擎也在动态的发展,作弊行为自然也是在动态的发展。最基本的界定法则,
; Z- R3 b6 D5 Y$ Y0 ?/ J就是这个行为的泛滥,是否会影响搜索系统,最终伤害到用户的搜索体验。 9 j3 V1 ?; a" R/ P% @7 b
对黑帽SEO 行为放任不管,不仅会造成搜索引擎质量的下降,还会恶化互联网生态环 , ?) g# k. S$ w: y
境,并使得良性的建站积极性受到打压,最终形成劣币驱逐良币的恶劣后果。在过去,黑帽 + L8 n. V- N$ X: S1 p3 R0 D* [3 y
SEO 者面对惩罚,振振有词,甚至将搜索引擎告上法庭,这种状况,严重影响了正常的舆 ! K! k4 k# |5 P2 S0 l9 C
论氛围。这是我们必须要去扭转的。 ! z+ Y2 ^" M: X- t2 ~5 ]9 D
总之,搜索引擎和黑帽SEO 行为之间的矛盾,是不可调和的;过去如此,现在如此, ' s4 ~% z" J& }7 Y- K
将来也一定如此。打击黑帽SEO,会始终是搜索引擎质量控制的关键环节之一。而营造黑 % v* X2 p4 j" m7 v
帽SEO 者“老鼠过街,人人喊打”的舆论氛围,也是我们需要努力的目标。
* N- A) O0 U9 L% I# x% z(2) 白帽SEO 行为得到的指引不够清晰
; b6 n+ Q9 \6 S" _所谓白帽SEO,就是能起到改良和规范网站设计,使之对搜索引擎和用户更加友好,
+ \+ z `8 A1 [& C并从中获取更多合理流量的优化行为。但过去的问题在于,我们过去较少的界定,什么样的 4 B2 n* ?3 ^ Q8 c" }
行为是推荐的。这导致很多白帽优化心存顾虑。 2 d3 d4 q* T: p5 p% ?2 U7 W2 A
正是鉴于上述问题,百度决定提供更加公开化的白帽SEO 指南,营造更好的舆论氛围,
& B* p2 H2 `& ~5 ^5 @以使SEO 行业,有更加良性的发展。
; T6 ]7 a Y' z- b需要指出的是,我们所颁布的SEO 指南,虽然听取了众多站长的意见和建议,但离完 6 D& X6 {" f+ `; c% P( a
美仍有相当距离。所以,我们会通过“百度站长俱乐部”这个渠道, 收集更多的建设性意见, # u) i" [2 g- ?1 e& J
来不断的完善这一指南。
! p k6 Q2 K0 F3 E1 w8 {0 X5 g7 y! q4 百度搜索引擎优化指南 4 `! j: C. o6 V" r
目录 2 @5 C& [% r' A2 v+ r7 g
前言.. 2
# c, c7 B2 d' D# }4 i! r& H0 f8 R9 n目录.. 4
4 Q2 Y+ t# n' ~7 ?1 前期准备.................................................................................................................... 5 4 e* s' x. M6 S6 j+ _
1.1 域名注册.................................................................................................................... 5
' j% w' `/ I/ M# _' Q- h1.2 服务器、空间租用..................................................................................................... 5
: a' t; @2 B& \4 F% }( [* s2 面向搜索引擎的网站建设.......................................................................................... 6
! y W1 [ W- o: P& H2.1 良好收录.................................................................................................................... 6 2 N- N' s: H" h: Y0 [! J) J
2.2 良好排序.................................................................................................................. 11
9 K3 Q9 ]3 [* l' g$ e+ f2.3 良好展现.................................................................................................................. 13
& i, o0 P0 G/ a; J; v3 网站运营.................................................................................................................. 15
; B7 G$ W+ e) Z3.1 目标=转化率............................................................................................................ 15
% q. X1 Z8 {4 g9 U$ w( @3.2 搜索引擎流量分析................................................................................................... 15 - B, N6 A' ~. C, [
3.3 网站信任度.............................................................................................................. 16
% c4 u6 a6 G' H3.4 不断强化品牌概念................................................................................................... 16
v# U4 D1 n) l- w* |4 作弊与惩罚.............................................................................................................. 16
) Y6 d: a( q; t4.1 百度如何定义作弊................................................................................................... 16 # i% N- ^( }2 O/ ~
4.2 作弊会受到怎样的惩罚............................................................................................ 18
1 M* g% D5 C# E4 t# r4.3 改正后能否解除惩罚? ............................................................................................ 18
) k& z8 e/ \1 x8 V5 联系与反馈.............................................................................................................. 18 $ }* n3 d0 Q4 D' ]$ t* }3 O8 D
6 关于百度的十万个为什么........................................................... 错误!未定义书签。
6 l/ |" ^7 N7 t m5 百度搜索引擎优化指南 . k! Y8 Y3 h6 H& `
1 前期准备 ( v j% I; Z& B) |
域名和服务器空间是网站建设的基础。
1 i1 ?5 v/ [3 t9 b( e$ W* q1 A+ q, A1.1 域名注册 ! b) e% }* O" H% {
域名是用户对网站的第一印象,能否让用户迅速记住域名对网站发展非常重要。建议注
- S4 S# Y2 l( r7 i$ |& i' }) Z j册域名时选择容易让用户记忆、容易产生信任感的域名,这样可以提高回头率,并方便用户
. x$ p+ p3 a6 C8 ~. Y推荐。
' p- k+ @8 f- K' i z3 ?9 x1 F _& e( r(1) 域名尽量简短,越短的域名,用户的记忆成本就越低 ' `: D4 m" U4 S; y: w
(2) 域名可以和网站主题或网站名称相呼应,让人看到域名就能联想到网站内容,比如
2 a/ g8 ?; @, X% Z# B( b* U5 X使用公司名称、商标、网站名称或者公司产品等信息来选择域名
/ ^& a& V8 H: H) {(3) 使用何种形式的域名后缀对百度网页搜索没有影响,但域名后缀也需要考虑方便用
& W; y, h! b9 i5 e- }9 J户记忆。.com、.cn、.net 等常见的域名后缀用户更容易记忆,一些不常见的后缀可
: s. b$ l: k$ S: c2 x能会让用户产生不信任感,增加用户的判断成本。 ' e1 B: Z7 D5 A a
1.2 服务器、空间租用
! b+ y' D7 _) v- ]# K, n. j* E* A, X7 v服务器、空间的速度和稳定性直接影响网站的用户体验,也会影响搜索引擎的抓取。建 5 J) s, y0 [/ i+ X) L: {) q
议选择服务稳定、速度快的服务器或者空间。
8 B/ I5 G, C( ]" W8 j" P(1) 选择有实力的正规空间商 ) w n& H: H& }6 T- Z) c# }
服务器和空间的稳定性需要一定的技术实力来保障,一些没有实力的空间商,可能无力 6 \5 }6 ?7 I" ]4 l; ~8 w
提供良好的服务,服务的稳定性无法保证。甚至有空间商为了节省资源,故意屏蔽掉
* ^8 S% A" x" KBaiduspider 的抓取,导致网站无法被百度网页搜索收录。
- `3 b) x. e8 W: b(2) 保证用户的访问速度和稳定性
3 o- }' ^9 f$ v+ i* z$ h(3) 根据网站规模和要提供的服务来决定选择购买何种空间(服务器) 0 w. }9 c& o0 b0 x* A
通常空间都会有流量、连接数以及功能上的限制,因为是多个网站共用一台服务器,稳
F- g# T- _1 n7 A z' W" m, a6 F定性会受到影响,但价格便宜;服务器各种限制较少,可以更自主的管理,但价格较贵。可 $ J `, x; c! ^; R2 H% Z7 f
以根据自己的需求来进行合理的选择。 2 V# v( N5 l/ x! y+ }
(4) 根据用户群分布选择接入商
# z% ?) h6 Q) }1 i2 s R, B" h由于互通问题的存在,选择接入商也很重要,如果用户群主要在联通,就尽量选择联通 9 V, t4 A2 {5 Q% p5 @$ G
访问较好的接入商,如果用户群主要在电信,则选择电信访问较好的接入商。如果用户群在 6 f* J! R/ t. \/ L8 f3 n5 }; O
全国,那就选择一家互通处理的比较好的接入商。 9 g3 j6 J4 ~" T o
6 百度搜索引擎优化指南 " U5 Z/ B0 z0 c" _% r7 i0 b; A1 _5 x
购买之前,可以先找一两个空间商现有的客户网站,测试访问情况如何。 7 F; w- O' E) ?, t7 C6 f2 p
2 面向搜索引擎的网站建设
, f/ i& N; n% P0 @' D搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断,
H3 b: _" v2 N& R' S ]也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的
, x/ G5 F+ j4 x4 K优化,同时也会让用户受益。 ; {& k* O' y3 b1 W( ~3 g; J+ G
面向搜索引擎的网站建设,主要分为三个部分:如何更好的让搜索引擎收录网站中的内
/ S% D& F2 w! R# B& J; F3 U. X容、如何在搜索引擎中获得良好的排名、如何让用户从众多的搜索结果中点击你的网站。简
- W) W( t2 o+ Z i' O9 @. u1 m) ~单来说,就是收录、排序、展现。下面我们将从这三个方面分别介绍。 ; C2 v* G: F; W; `, ?+ {0 i; ^ h
2.1 良好收录
8 `/ I) L) @ e" l: J6 U: \4 E7 J7 q2.1.1 机器可读 3 B) @+ u8 ~. y: R
百度通过一个叫做Baiduspider 的程序抓取互联网上的网页,经过处理后建入索引中。 ( W# |3 v; B+ l. H$ k4 B: b
目前Baiduspider 只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、
; n7 g8 x- B0 l: V0 F图片中的文字,百度无法识别。
5 ?( V2 }* `+ b: M5 w2 B! r3 p建议使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接,搜索引擎 2 d+ r/ V: _! r% Q
暂时无法识别Flash、图片、Javascript 中的内容,这部分内容无法搜索到;仅在flash、
& w C4 u" m cJavascript 中包含链接指向的网页,百度可能无法收录。
3 `' V2 G5 c2 [/ b* e5 [冘 使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接 + f1 M. b) C' c, V
冘 如果必须使用Flash 制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页
" @7 c; [5 P0 _0 g, S; u& g; ?使用文本链接指向文字版
1 ^6 {1 j4 H. X" F, S/ \7 c/ f. \& W4 g冘 Ajax 等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看”
0 b& N" J6 H: d7 j, E" y2 R7 S到的导航及正文内容放到Ajax 中 ' H4 _( s9 r) x+ V, N8 h
冘 不使用frame 和iframe 框架结构,通过iframe 显示的内容可能会被百度丢弃
% E; o4 _+ q6 v; a* O我们建议: ) F+ f+ n$ X8 X( k$ U
7 百度搜索引擎优化指南 2 G/ A. C) ?+ g5 \6 G. V& a, R1 Q
上面例子中,虽然网页上提供了很丰富的信息,但由于信息都在falsh 中,搜索引擎无法提取,对 & b3 Q$ e- {5 g9 q" n5 D3 b
搜索引擎来讲,这个网页没有任何内容。
& u/ e( H/ f: B3 M2.1.2 网站结构
, s% H6 S5 {: A' M网站应该有清晰的结构和明晰的导航,这能帮助用户快速从你的网站中找到自己需要的 4 z5 M1 i( _- A' N! n5 h4 I1 M
内容,也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。
1 F0 }4 a b9 o) x4 f- K' A( W+ ~网站结构建议采用树型结构,树型结构通常分为以下三个层次:首页——频道——文章
9 a1 x& v2 d3 ~$ X3 h- {' w4 f- p' c页。象一棵大树一样,首先有一个树干(首页),然后再是树枝(频道),最后是树叶(普通
* L- [5 l5 F6 {2 P内容页)。树型结构的扩展性更强,网站内容变多时,可以通过细分树枝(频道)来轻松应
* c+ N. d% X8 W1 Z1 M& `对。 l% L) u; k" ^, V+ |
理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理
1 F4 V: _2 U( ~) S, r! k起来,会更简单。
Y8 c2 M: Q# } E同时,网站也应该是一个网状结构,网站上每个网页都应该有指向上、下级网页以及相 # B9 f, N: W9 s; ~& x+ u$ o
关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接、普通内容页 . Q9 M. \8 c7 K
有到上级频道以及首页的链接、内容相关的网页间互相有链接。 % G! u% f+ v" G! T
网站中每一个网页,都应该是网站结构的一部分,都应该能通过其他网页链接到。 ( a/ b; s3 C G/ V& C' H# l
总结一下,合理的网站结构应该是一个扁平的树型网状结构.........。 * m, ~1 P7 @0 o* _3 F
冘 确保每个页面都可以通过至少一个文本链接到达。 ) o0 f4 e, F% h: L5 \* c3 X8 h
冘 重要的内容,应该能从首页或者网站结构中比较浅的层次访问到。
6 N2 W% e& P( [$ N我们建议: ) D9 r( Q! E' m1 J( X
8 百度搜索引擎优化指南 ( E& |5 a% @# F9 M: E
冘 合理分类网站上的内容,不要过度细分。
. P! p5 d$ |0 B4 l+ {. q网站应该有简明、清晰的导航,可以让用户快速找到自己需要的内容,同时也可以帮助 7 b/ U8 b5 {5 o3 |4 `. |
搜索引擎更好的了解网站的结构。
/ M% ]# X. U9 i冘 为每个页面都加上导航栏,让用户可以方便的返回频道、网站首页,也可以让搜索引擎
8 r: H; g- ?) w* D2 g( z方便的定位网页在网结构中的层次。 # ]3 D* C" [2 t, y# S) w- |
冘 内容较多的网站,建议使用面包屑式的导航,这更容易让用户理解当前所处的位置:网
% N, D4 `+ F% @站首页> 频道> 当前浏览页面 0 {7 n8 } ^/ i& f1 s7 o
通过面包屑导航,用户可以很清楚的知道自己所在页面在整个网站中的位置,可以方便的返回上 6 q: o% V& R' o# [9 w! W
一级频道或者首页也很方便。 6 n( S0 F$ ?& @& |9 t. \3 z
冘 导航中使用文字链接,不使用复杂的js 或者flash
/ d* O6 Z( |% U( p2 ]/ W8 m+ S# i冘 使用图片做导航时,可以使用Alt 注释,用Alt 告诉搜索引擎所指向的网页内容是什么
- I1 I0 P/ Q! w- n2.1.3 子域名与目录的选择 ! y, C7 _3 I9 u" M! ~, Q9 Z
选择使用子域名还是目录来合理的分配网站内容,对网站在搜索引擎中的表现会有较大
. j+ c8 f: y4 @ m: T- y的影响。 7 N" T) k% U- I' N
冘 在某个频道的内容没有丰富到可以当做一个独立站点存在之前,使用目录形式;等频
! ]2 ~) _: s! S' ?4 g J& h( y道下积累了足够的内容,再转换成子域名的形式 ! [2 B- K8 f6 a* D& ~& C! A. f$ P/ {4 |
一个网页能否排到搜索结果的前面,“出身”很重要,如果出自一个站点权重较高的
) a" }5 S* t d, N8 J9 A, c网站,那排到前面的可能性就越大,反之则越小。通常情况下主站点的权重是最高的,
' k) t3 J; @8 I8 T7 b/ o子站点会从主站点继承一部分权重,继承的多少,视子站点质量而定。
* {9 ]# k$ n0 Y在内容没有丰富到可以做为一个独立站点之前,内容放到主站点下一个目录中能在
' _( \ {+ J N! }$ Q搜索引擎中获得更好的表现。 * r1 J' N; C# A
冘 内容差异度较大、关联度不高的内容,使用子站点形式 * x* I) F4 y6 R; j# b8 r% g
搜索引擎会识别站点的主题,如果站点中内容关联度不高,可能导致搜索引擎错误
8 G5 O5 d9 j4 g% }$ k& b) h& ]的识别。关联度不高的内容,放在不同的子域名下,可以帮助搜索引擎更好的理解站点
! B! y% P5 E9 G/ f- T的主题。
4 J' q$ p+ x5 |8 P5 j, v冘 域名间内容做好权限,互相分开,a. example.com 下的内容,不能通过b. / p/ M3 p/ `1 R2 X. S3 \5 ~
example.com 访问 2 O8 T$ L1 N- Y W: V, k2 ]: H. X
子域名间的内容可以互相访问,可能会被搜索引擎当做重复内容而进行除重处理,
& y7 S' F' @( N" V我们建议: $ X, R& @$ P1 M$ Y9 u- L: B: Z7 q
我们建议: 9 J0 l0 v- ~ n
9 百度搜索引擎优化指南 & m- @. ~+ m9 t: ~2 _( f
保留的url 不一定是正常域名下的。
" G/ j; ~& g3 d1 a冘 不要滥用子域名
. l# V5 \3 {- I8 z6 `; F无丰富内容而滥用大量子域名,会被搜索引擎当做作弊行为而受到惩罚。
|