|
* l' l H9 n z- l% O" W 百度互联网创业俱乐部搜
) z% h: ~, S; U2 \索引擎优化指南
% P" t0 ~ z6 T& d0 Z版本号:V1.0 7 g7 K9 P: O2 X
@ Baidu 2010 3 V: v: u$ [1 o6 N+ W4 l( g
2 百度搜索引擎优化指南
9 Z" G3 v- X0 x$ A1 w0 l: j. m4 Z" _7 \
* }# H$ k+ E0 L0 U. k0 z
3 ~5 j( g) T8 h1 q! c/ k5 n1 j前言 : ^) G& I& f& [. x: k
SEO(Search engine optimization,搜索引擎优化),指为了提升网页在搜索引擎 8 y( ~1 P5 o! y- R! ~0 G
自然搜索结果中(非商业性推广结果)的收录数量以及排序位置而做的优化行为,这一行为 3 s7 B# J# s* R9 a" B
的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现形象。而SEM(Search 5 ~ M1 a& z3 z/ i# N4 j6 z: S
engine marketing,搜索引擎营销),则既包括了SEO,也包括了付费的商业推广优化。
" C; z+ [- |7 \* `( q+ K毋庸讳言,SEO 自从1997 年左右出现以来,就和搜索引擎处于某种对立状态。这种 4 H2 i3 |1 I$ q: D
对立源于两方面:
2 e. o7 f0 E7 q* G" y一方面,大量SEO 行为只考虑了如何获得更多的“免费”流量,至于多的这些流量是否 . U b- h3 S: I) @' D- a
符合搜索用户价值,则不在考虑范围之内。这种SEO 被称为“黑帽”,历来受到搜索引擎的
" W, [& Y% v- j2 T$ m0 R7 {% a严厉打击。 , m: J; M& R1 a5 G! D
另一方面,SEO 的目的是为了获取更多的“免费”流量,这和搜索引擎的商业推广是对立
! M+ y5 U3 c. B5 W, b的。所以很多SEO 的从业者,包括相当多的搜索引擎从业者,从心底里认为,两者的利益
- \1 K$ D' y. p( i" p3 b7 J" j就是不可调和的。 7 s x# k0 N$ {3 W
但如果从更加长远的角度来看,搜索引擎和SEO 从业者的利益,实际是有高度一致的
0 x [5 R6 J& d地方的: - G+ L) H! M9 I' Y, J; G
首先,搜索引擎的搜索质量改善,很大程度上受到资源形态的影响。比如很多优质资源,
: _8 n9 `" K. v( N7 o( e. v+ [$ }' o是用Flash 或者Ajax 做的,搜索引擎就无法很好的爬取和索引。搜索引擎无法独立承担起 # s+ o, z9 ? e
这个引导教育职责,有了SEO 参与其中,这些优质资源就可以更好的发挥其检索效果,改
# o; C" r* f' W( X2 l0 \6 H善用户搜索体验。
5 V5 K1 V8 m+ l其次,SEO 从业者也是搜索引擎商业价值很好的布道者。尤其对于中国这样的新兴市 ( Q5 U2 g) s9 _
场,传统的中小企业对于如何触网,如何做互联网营销,并无多少经验。SEO 在其中可以
$ L; E! O c2 i# P: @ g. Y9 U4 g扮演非常重要的角色。而这种布道,对于搜索引擎产业价值的拓展,是很有好处的。 6 d$ [. S( _5 K4 {% B9 J
基于以上原因,我们需要重新审视搜索引擎和SEO 之间的关系。两者宜建立起一种更 . @9 H: l' m: l. a9 l/ g
加良性的共生关系,驱逐劣币,提携良币,以使互联网生态圈得到更加健康有序的发展。百
/ t4 ?8 Y: R U4 v9 B5 X8 n度作为中文搜索领域的领导者,有责任和义务来推进这个事情。这也是本文档发布的初衷。
3 q& a$ `. B5 u6 F" c' t我们先来看一下过去的问题所在。 % s1 }( A" j9 x6 {- |2 T0 g# J7 W
(1) 黑帽SEO 大行其道,占据了SEO 主流话语权
: @7 u0 S5 c! M( P% ~黑帽SEO 行为,通常就是一般所谓的“搜索引擎作弊”。利用和放大搜索引擎的策略缺 ! E$ f+ r/ [5 |3 L+ ^. `3 d
陷(实际上完美的系统是不存在的)获取更多用户访问量。而这种更多的访问量,是以伤害
/ p6 v! P9 ` ~3 Z3 百度搜索引擎优化指南
' L2 J9 r. P, o9 ^$ t1 b0 O用户体验为代价的,而这会危及一个搜索引擎的生存基础。所以,面对这样的行为,如果短
" M( E$ x8 E3 @0 T' g) A期内无法修补系统,搜索引擎也会通过一些临时策略进行遏制以免事态的失控。在作弊领 3 Q2 x% Z, _- M ?
域,破窗效应是非常明显的。
4 g& t- \ c1 @, Q1 ~很多人会说,整天说作弊作弊,到底哪些行为是作弊?这是无法穷尽的。互联网在动态 y1 E: E6 [3 T% f
的发展,搜索引擎也在动态的发展,作弊行为自然也是在动态的发展。最基本的界定法则,
6 }8 H1 y0 R4 b' a9 @7 {就是这个行为的泛滥,是否会影响搜索系统,最终伤害到用户的搜索体验。
& ?$ U1 Y0 X3 G. h对黑帽SEO 行为放任不管,不仅会造成搜索引擎质量的下降,还会恶化互联网生态环 5 h# T& t/ c) H6 M7 |# A$ z
境,并使得良性的建站积极性受到打压,最终形成劣币驱逐良币的恶劣后果。在过去,黑帽
. ~3 e7 l' v) t. O2 I- DSEO 者面对惩罚,振振有词,甚至将搜索引擎告上法庭,这种状况,严重影响了正常的舆 9 [ Q# V; R4 l
论氛围。这是我们必须要去扭转的。
& D5 j. S2 n5 e总之,搜索引擎和黑帽SEO 行为之间的矛盾,是不可调和的;过去如此,现在如此, 1 N7 d- t$ F- d$ I" c) H+ A
将来也一定如此。打击黑帽SEO,会始终是搜索引擎质量控制的关键环节之一。而营造黑 8 b. i9 V+ S' n7 k( z1 f8 a$ s6 z
帽SEO 者“老鼠过街,人人喊打”的舆论氛围,也是我们需要努力的目标。 ) Q7 b1 V7 g O% I
(2) 白帽SEO 行为得到的指引不够清晰 9 P" x4 ~6 g: ^+ [9 Q
所谓白帽SEO,就是能起到改良和规范网站设计,使之对搜索引擎和用户更加友好, , N& F) C5 I- B- E9 J
并从中获取更多合理流量的优化行为。但过去的问题在于,我们过去较少的界定,什么样的 3 o" ^* H1 g$ E4 }) b
行为是推荐的。这导致很多白帽优化心存顾虑。
/ t" X, L( i- A正是鉴于上述问题,百度决定提供更加公开化的白帽SEO 指南,营造更好的舆论氛围,
3 \4 |; B" e' K. e以使SEO 行业,有更加良性的发展。
( V( B3 F; ]. G; t6 p需要指出的是,我们所颁布的SEO 指南,虽然听取了众多站长的意见和建议,但离完
7 o U- s; y: O. ?6 w( K2 X4 t! c美仍有相当距离。所以,我们会通过“百度站长俱乐部”这个渠道, 收集更多的建设性意见,
8 {5 _/ Y6 t7 ~1 G" {来不断的完善这一指南。
# V5 Y, \ b2 z4 百度搜索引擎优化指南
: G- N2 M* o. ~; G- L, a$ n目录
& d4 @: Q! w {前言.. 2 5 `- ~( A: h/ S, I' r
目录.. 4
: m! f: U' N7 R' h/ w6 M7 [- X1 前期准备.................................................................................................................... 5 7 n7 [6 i. d0 d0 X8 L! W; d0 h
1.1 域名注册.................................................................................................................... 5 9 _) v) T/ G- g6 g: }9 \
1.2 服务器、空间租用..................................................................................................... 5
( P3 f1 h) w5 ?2 R: W7 h2 面向搜索引擎的网站建设.......................................................................................... 6 0 G5 e+ l' \8 c$ ]; ]. W
2.1 良好收录.................................................................................................................... 6 / ? W: F( l: i( b
2.2 良好排序.................................................................................................................. 11 4 \& G7 W( k5 t3 C
2.3 良好展现.................................................................................................................. 13 4 E& _' M8 k! ]# z( L7 W* v/ i
3 网站运营.................................................................................................................. 15
1 t3 i' p% l4 Y B& ?' ^3 t3.1 目标=转化率............................................................................................................ 15
( d. o% Z4 H3 M* C# X3.2 搜索引擎流量分析................................................................................................... 15
# r6 K- E# H/ f7 a7 ]: H3 F9 h3.3 网站信任度.............................................................................................................. 16
" o: O1 j0 Z% S+ @8 e0 |1 v6 h3.4 不断强化品牌概念................................................................................................... 16
1 D0 G& ]; h1 S5 K4 作弊与惩罚.............................................................................................................. 16 , ^; }5 T$ c |, k& i
4.1 百度如何定义作弊................................................................................................... 16
+ c% r# `; ]1 {1 y8 e, Q4.2 作弊会受到怎样的惩罚............................................................................................ 18
! e- X# z4 S- G k; y5 D4.3 改正后能否解除惩罚? ............................................................................................ 18 4 w( u0 I) A0 p3 q
5 联系与反馈.............................................................................................................. 18 1 i' A5 {; ]- t# W. B Q' r2 h
6 关于百度的十万个为什么........................................................... 错误!未定义书签。
9 R0 p! x8 n3 w1 ~5 百度搜索引擎优化指南 4 n T) t9 u( y2 q" `2 A9 s
1 前期准备
+ B/ P* C$ q: V( q0 e5 ^域名和服务器空间是网站建设的基础。
! r: ~/ D0 R* T1.1 域名注册
N' w9 p% q2 A; N0 t域名是用户对网站的第一印象,能否让用户迅速记住域名对网站发展非常重要。建议注
% j- k: r, ^) ~: @9 r册域名时选择容易让用户记忆、容易产生信任感的域名,这样可以提高回头率,并方便用户
& h! c d$ | ]推荐。
7 n1 r0 i+ B2 W, N(1) 域名尽量简短,越短的域名,用户的记忆成本就越低
) c/ _. l0 w3 Q2 b# ~(2) 域名可以和网站主题或网站名称相呼应,让人看到域名就能联想到网站内容,比如 - H# p( ?8 a7 e1 B! m c
使用公司名称、商标、网站名称或者公司产品等信息来选择域名
0 B2 a8 @/ g: U(3) 使用何种形式的域名后缀对百度网页搜索没有影响,但域名后缀也需要考虑方便用
: g/ Y% M( t* H, b' y. I( f V户记忆。.com、.cn、.net 等常见的域名后缀用户更容易记忆,一些不常见的后缀可 3 ]' B( M) O" P" e/ U( d6 G. @
能会让用户产生不信任感,增加用户的判断成本。
, Z2 `7 P2 t2 N! t/ T9 }1.2 服务器、空间租用
: t2 K# m7 d6 \1 c& N! y+ k) R% ?服务器、空间的速度和稳定性直接影响网站的用户体验,也会影响搜索引擎的抓取。建 0 H r. o0 o' b7 @% h
议选择服务稳定、速度快的服务器或者空间。
5 B6 G& J/ d! K& a* s% ~(1) 选择有实力的正规空间商 3 s8 z4 X- O6 f$ ~; n; @/ p$ L& E
服务器和空间的稳定性需要一定的技术实力来保障,一些没有实力的空间商,可能无力 + T" {( _- a. R8 O; b, S; s( ^$ V
提供良好的服务,服务的稳定性无法保证。甚至有空间商为了节省资源,故意屏蔽掉
2 N" Z: ?$ {) p# zBaiduspider 的抓取,导致网站无法被百度网页搜索收录。
* ~% q y6 u4 Z! Z5 K# T" a7 U# j(2) 保证用户的访问速度和稳定性
# g2 [- p5 O, y8 x" N) H$ X(3) 根据网站规模和要提供的服务来决定选择购买何种空间(服务器)
+ g* K3 u1 Y: ?5 C通常空间都会有流量、连接数以及功能上的限制,因为是多个网站共用一台服务器,稳
- _- Y b4 q3 [ n, I8 B定性会受到影响,但价格便宜;服务器各种限制较少,可以更自主的管理,但价格较贵。可 6 M& T; u$ @8 I: g- q% N0 A; j
以根据自己的需求来进行合理的选择。
& G# o% [9 {9 ]5 U% U0 a(4) 根据用户群分布选择接入商
8 g: w" {. ?) S& o2 k由于互通问题的存在,选择接入商也很重要,如果用户群主要在联通,就尽量选择联通
?! n/ ?) R* `4 U; H, a访问较好的接入商,如果用户群主要在电信,则选择电信访问较好的接入商。如果用户群在 2 K @# Q% f c1 }$ u% T
全国,那就选择一家互通处理的比较好的接入商。 # a4 a; s4 Z0 e, z6 ?0 ?9 B$ v: R
6 百度搜索引擎优化指南 z) }* t6 }7 j2 }! U) u' T
购买之前,可以先找一两个空间商现有的客户网站,测试访问情况如何。
# B: G* }4 I7 H. g1 x2 面向搜索引擎的网站建设 ' M- S4 I' I/ B& c6 n& U, g
搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断,
+ j u# @* K+ H+ _也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的 2 B' |4 K! v9 ^3 ?
优化,同时也会让用户受益。 + Y$ h- p& ]# q: d5 t
面向搜索引擎的网站建设,主要分为三个部分:如何更好的让搜索引擎收录网站中的内 ; k5 S E5 N$ {9 K' V: J9 [8 T
容、如何在搜索引擎中获得良好的排名、如何让用户从众多的搜索结果中点击你的网站。简
/ P7 Q/ k- Y' t) X; m单来说,就是收录、排序、展现。下面我们将从这三个方面分别介绍。 - Y ]% E {, B: m1 I- J) Y
2.1 良好收录 5 P* w, O) e2 \+ h* C/ @4 B0 \- w
2.1.1 机器可读 7 n$ N9 g/ L9 Z/ f- q( r7 A. ^5 q
百度通过一个叫做Baiduspider 的程序抓取互联网上的网页,经过处理后建入索引中。
! E) s- [0 T4 P1 h4 s; J7 h目前Baiduspider 只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、 4 d* q, v' i" }. X4 a
图片中的文字,百度无法识别。 ! K- l$ M+ m- I& R' J3 @5 w
建议使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接,搜索引擎 ) K8 Q2 K9 ~& j# q' P
暂时无法识别Flash、图片、Javascript 中的内容,这部分内容无法搜索到;仅在flash、
, R: B6 f! \! K1 U: }' G+ B$ ~Javascript 中包含链接指向的网页,百度可能无法收录。 0 z2 F9 X: A4 o+ P' K q4 s! t9 a
冘 使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接
# I$ {8 @' n7 m冘 如果必须使用Flash 制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页
- ^3 ~8 [# K" y N; S- D; n" u使用文本链接指向文字版
( q* }' @ r" k+ K4 M, H- F冘 Ajax 等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看”
( N7 F g9 n5 f0 h; N j0 [/ R+ G- {4 v到的导航及正文内容放到Ajax 中
* I: L( A \! P, P2 X" P& U# H6 ` z" d冘 不使用frame 和iframe 框架结构,通过iframe 显示的内容可能会被百度丢弃 4 [ ~, _0 i. |2 L1 A
我们建议:
( |" T6 V( f4 N! Z7 百度搜索引擎优化指南
, ^- T( Y6 A9 S# k# r* Z上面例子中,虽然网页上提供了很丰富的信息,但由于信息都在falsh 中,搜索引擎无法提取,对
, ?% q) C' d4 E- w, z/ b7 U搜索引擎来讲,这个网页没有任何内容。
# A7 {9 A) U" @8 ?2.1.2 网站结构 ! N/ D; c4 P; K2 M9 }
网站应该有清晰的结构和明晰的导航,这能帮助用户快速从你的网站中找到自己需要的
$ `2 b; l; o c F, M" p& U: R内容,也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。
( ^) c6 y& B( H网站结构建议采用树型结构,树型结构通常分为以下三个层次:首页——频道——文章 # l$ t7 c; Z3 o
页。象一棵大树一样,首先有一个树干(首页),然后再是树枝(频道),最后是树叶(普通
; [. s6 G" R, I# y F7 Y1 |( ]内容页)。树型结构的扩展性更强,网站内容变多时,可以通过细分树枝(频道)来轻松应
% P0 ^+ |' Z& h( f对。 " D% d4 P. u; K4 A% b, }0 \
理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理 . \7 C1 B s+ o$ C
起来,会更简单。
0 v5 K0 k! M/ f) B: M同时,网站也应该是一个网状结构,网站上每个网页都应该有指向上、下级网页以及相 3 h7 Q; D" b3 M% b1 m9 l
关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接、普通内容页
/ p; G8 v# i% I v3 u4 f有到上级频道以及首页的链接、内容相关的网页间互相有链接。 ! j; T0 V6 S9 D E& ?
网站中每一个网页,都应该是网站结构的一部分,都应该能通过其他网页链接到。
& s/ ?5 f' W* i3 \6 T! e总结一下,合理的网站结构应该是一个扁平的树型网状结构.........。
/ ]( C( u2 b* k3 ?5 i$ X+ t冘 确保每个页面都可以通过至少一个文本链接到达。
P. h* e1 S( ?* S& B3 _, `冘 重要的内容,应该能从首页或者网站结构中比较浅的层次访问到。 : C* }. H, i3 H& ~0 H
我们建议:
2 c3 D( U% |0 I& p9 x+ J' T8 百度搜索引擎优化指南 9 \3 F0 D4 S1 l: x2 G
冘 合理分类网站上的内容,不要过度细分。 % a7 \4 Z& t; A) M
网站应该有简明、清晰的导航,可以让用户快速找到自己需要的内容,同时也可以帮助
2 ]0 w& H6 P* L" p j* P& g! u5 g" b4 P搜索引擎更好的了解网站的结构。 5 R; A1 P% E* h0 B) s9 {. v9 E: ~
冘 为每个页面都加上导航栏,让用户可以方便的返回频道、网站首页,也可以让搜索引擎
5 i: O0 y* L/ Z方便的定位网页在网结构中的层次。
! E' {; J% K2 ]) _8 r+ ]1 L冘 内容较多的网站,建议使用面包屑式的导航,这更容易让用户理解当前所处的位置:网
# Q& Y1 J6 P* p% ^站首页> 频道> 当前浏览页面
' C) e% i5 v. E, G1 ^通过面包屑导航,用户可以很清楚的知道自己所在页面在整个网站中的位置,可以方便的返回上 . m5 N) b( P6 S( p
一级频道或者首页也很方便。 2 Z' z! r& u: d; `
冘 导航中使用文字链接,不使用复杂的js 或者flash + h" ^) h7 k# N% m
冘 使用图片做导航时,可以使用Alt 注释,用Alt 告诉搜索引擎所指向的网页内容是什么
1 [, E3 P: m0 q& W9 q7 ]1 K' ?2.1.3 子域名与目录的选择
- o- b6 l6 h. U: C! d选择使用子域名还是目录来合理的分配网站内容,对网站在搜索引擎中的表现会有较大
- O5 @/ \5 y" D+ `0 c3 K0 B的影响。
: z& ]; m* x, @" s- Y( P冘 在某个频道的内容没有丰富到可以当做一个独立站点存在之前,使用目录形式;等频
3 {# F4 N/ Y, i# f i* p道下积累了足够的内容,再转换成子域名的形式 ' H* U/ O- x+ v8 s! {! s
一个网页能否排到搜索结果的前面,“出身”很重要,如果出自一个站点权重较高的 ' @5 l/ W! |% K* m
网站,那排到前面的可能性就越大,反之则越小。通常情况下主站点的权重是最高的,
# |" a: r# J' S, _! l: G$ e2 K子站点会从主站点继承一部分权重,继承的多少,视子站点质量而定。
2 }( i/ ^- A8 m& P8 g在内容没有丰富到可以做为一个独立站点之前,内容放到主站点下一个目录中能在
$ B& {1 B3 {4 M5 k/ j; e搜索引擎中获得更好的表现。 7 G7 u) }6 ]: s. ?, l
冘 内容差异度较大、关联度不高的内容,使用子站点形式 7 q- }6 q$ [" C/ h- T
搜索引擎会识别站点的主题,如果站点中内容关联度不高,可能导致搜索引擎错误
1 v9 u" _( N( k, y8 u5 h$ [. q的识别。关联度不高的内容,放在不同的子域名下,可以帮助搜索引擎更好的理解站点 / D: M/ q, r7 `& s
的主题。 ! o$ W+ b( `& J6 ~% w# k. H
冘 域名间内容做好权限,互相分开,a. example.com 下的内容,不能通过b. B4 w) l# H6 w" A
example.com 访问
$ s; A9 A. a: i+ `4 X& r子域名间的内容可以互相访问,可能会被搜索引擎当做重复内容而进行除重处理, - P' ~2 s. K9 J, g, Y8 {
我们建议: , w3 U5 G& v5 R y' h' {3 b
我们建议:
$ R/ z5 F6 c9 O) U3 x9 百度搜索引擎优化指南
3 {: c+ |3 g4 m9 Y1 h* G保留的url 不一定是正常域名下的。
: N4 T/ F3 C9 ?, \冘 不要滥用子域名
) R. l* L! h D- e" G, B! l无丰富内容而滥用大量子域名,会被搜索引擎当做作弊行为而受到惩罚。
|