百度搜索引擎优化指南2.0[网页版]
如果您有SEO优化、网站建设需求请致电:18510193015
{
"title":"百度搜索引擎优化指南 2.0 伪原创",
"content":" 写在最前面:这是一份来自百度的 SEO 优化教程 ——《百度搜索引擎优化指南 2.0》,此前仅提供 PDF 文件下载,为方便各位站长学习查阅,现整理成网页版,文章版权归百度官方所有。
前言:依据 DCCI2010 年中国互联网站长生存与发展状况调查数据,超半数中国互联网站长月收入在 500 元以下或无收入,主要盈利模式仍是广告,众多互联网创业者面临巨大生存压力,其发展状况令人担忧。如何改变这一困境,成为关乎互联网生态圈长足发展的重要议题。对于互联网创业者而言,网站流量关乎网站成败,互联网创业者俱乐部由百度发起成立,旨在助力互联网创业者健康发展、扶持创新力量、拓展发展空间,为热爱并立志投身互联网的创业者搭建非盈利平台。首次发布的《搜索引擎优化指南》旨在帮助创业者在创业初期步入正轨,以更科学合理的方式增加网站在搜索引擎中的收录数,提升流量,为未来发展奠定基础。通过该指南,创业者可获得明确正规的搜索引擎优化标准,实现合理可持续的流量提升,获得长久稳定发展,并促进整个行业良性发展。
搜索引擎优化,指为提升网页在搜索引擎自然搜索结果中的收录数量与排序位置而进行的优化行为,目的是从搜索引擎获取更多免费流量,同时更好地展现自身形象。而 SEM既包括 SEO,也涵盖付费商业推广优化。
SEO 自 1997 年左右出现以来,逐渐分化为两类行为:一类为 “白帽 SEO”,可改良规范网站设计,使其对搜索引擎和用户更友好,获取合理流量,搜索引擎鼓励支持此类行为;另一类是 “黑帽 SEO”,利用搜索引擎策略缺陷获取更多用户访问量,但这是以伤害用户体验为代价的,搜索引擎会采取策略进行遏制。
搜索引擎与 SEO 行为是良性共生关系,比如部分优质网站采用 Flash 或 Ajax 制作,搜索引擎难以爬取索引,建站者了解 SEO 原理后,可对网站合理优化,让优质资源更好发挥检索效果,改善用户搜索体验。同时,对于中国这样的新兴市场,传统中小企业对触网及互联网营销经验不足,互联网创业者对 SEO 也存在诸多矛盾看法和猜想。让更多人了解搜索引擎工作机制,引导合理 SEO 行为,让原创优质内容创业者获更多流量,使抄袭抓取内容的建站行为受到警惕,是百度作为中文搜索领域领导者的责任义务,只有这样才能有效支持互联网创新力量,促进互联网生态圈健康有序发展。
需要指出的是,本指南虽听取了部分站长意见建议,但仍有很大提升空间。未来,我们将通过互联网创业者俱乐部平台收集更多建设性意见,不断完善该指南。
目录:
前言
目录
前期准备
面向搜索引擎的网站建设
网站运营
目标 = 转化率
搜索引擎流量分析
网站信任度
不断强化品牌概念
作弊与惩罚
百度如何定义作弊
作弊会受到怎样的惩罚
改正后能否解除惩罚?
关于百度的十万个为什么
联系和反馈
前期准备:
域名和服务器空间是网站建设的基础。
域名注册:
域名是用户对网站的第一印象,易记的域名能提高用户回头率,方便用户推荐。建议注册简短且与网站主题或名称呼应的域名,方便用户联想网站内容,可选用公司名称、商标、网站名称或产品信息等注册域名。域名后缀虽对百度网页搜索无影响,但应考虑用户记忆成本,常见后缀如.com、.cn、.net 等更易记忆,不常见后缀可能让用户产生不信任感,增加判断成本。
服务器、空间租用:
服务器和空间的速度稳定性直接影响网站用户体验和搜索引擎抓取。应选择有实力的正规空间商,以保障服务稳定性,避免部分空间商为节省资源屏蔽百度蜘蛛抓取,导致网站无法被收录。同时,要根据网站规模和服务需求选择合适的空间或服务器,空间价格便宜但受流量、连接数等限制且稳定性受影响,服务器限制少、管理自主但价格较贵。还需根据用户群分布选择接入商,若用户群集中在联通或电信,可选择对应接入商,若用户群全国分布,则选互通处理较好的接入商。购买前可测试空间商现有客户网站的访问情况。
面向搜索引擎的网站建设:
搜索引擎只是网站的普通访客,其对网站的抓取方式和价值判断从用户角度出发,对搜索引擎的优化也能让用户受益。面向搜索引擎的网站建设分为三个部分:收录、排序、展现。
良好收录:
机器可读:
百度通过 Baiduspider 程序抓取网页,处理后建入索引。目前 Baiduspider 只能识别文本内容,无法处理 flash、图片等非文本内容,其中的文字也无法识别。建议使用文字展示重要内容和链接,避免使用 flash、图片、Javascript 等,以免搜索引擎无法识别,导致内容无法被搜索到,仅在其中包含链接指向的网页也可能无法被收录。
网站结构:
网站应具备清晰结构和明晰导航,帮助用户快速找到所需内容,也便于搜索引擎理解网站层次。建议采用树型结构,分为首页、频道、文章页三个层次,扩展性强。理想的网站结构应更扁平,层次尽量少,便于搜索引擎处理。同时,网站应是网状结构,每个网页都应有指向上、下级网页及相关内容的链接,确保每个页面都可通过至少一个文本链接到达,重要内容能从首页或较浅层次访问,合理分类内容,不过度细分,为每个页面添加导航栏,使用文字链接,用图片做导航时添加 Alt 注释,告知搜索引擎指向内容。对于内容未丰富到可独立建站的频道,采用目录形式,积累足够内容后再转换为子域名。子域名的使用要谨慎,避免滥用被搜索引擎视为作弊行为而受惩罚。
规范、简单的 url:
创建描述性好、规范简单的 url,便于用户记忆和判断网页内容,也利于搜索引擎抓取。网站应规划合理的 url,同一网页只对应一个 url,避免多种 url 形式分散权重,若存在多种 url,可通过 301 永久跳转、禁止蜘蛛抓取等方式处理。url 应尽量短,正常动态 url 对搜索引擎无影响,但要减少变量参数,避免添加不能被系统自动识别的字符,可利用百度提供的 URL 优化工具检查 url 友好程度。
利用站长工具:
百度站长平台提供多种工具,如 Sitemap 可提交网站内容,让百度更全面快速发现链接,提高收录效率;Ping 针对 blog 内容提交,通知搜索引擎有新内容;死链删除可提交死链列表,提升网站质量。此外,平台还提供 URL 优化工具和网站安全检测工具,帮助站长优化网站。
网站安全检测:
网站被黑是指黑客利用网站程序、设置等安全漏洞或管理员疏忽进行篡改。处理网站被黑可分析系统日志、检查文件、关注引用资源、检查新增文件目录等,防止被黑可定期检查服务器日志、关注文件修改、下载补丁、修改关键文件默认文件名、提高密码强度、关闭不必要服务端口、设置防火墙等,若问题反复出现可重装系统并上传备份文件,缺乏专业维护人员可向安全公司咨询。
百度搜索框提示功能:
百度向站长开放免费 “百度搜索框” 代码和 “百度搜索框提示” 代码,提升用户网站搜索体验。
改版 / 换域名:
网站改版或换域名需考虑老用户不流失,可将旧网页 301 永久重定向到新网页,传递权值,减少流量损失。若非必要,不要完全更换整站内容,改版或换域名时应将旧页面重定向到对应新页面,更换域名后维持旧域名稳定访问一段时间,提交新 URL 给百度帮助调整。
合理的返回码:
百度爬虫根据 http 协议规范设置逻辑,站长也应参考设置返回码。404 表示网页失效,会从搜索结果删除;503 表示网页临时不可访问,百度会反复尝试抓取;403 表示网页当前禁止访问,百度也会反复检查;301 表示网页跳转,适合站点迁移、域名更换等情况。
良好排序:
涵盖网页上主要内容的 title:
网页 title 用于告知用户和搜索引擎网页主要内容,是搜索引擎判断网页内容权重的主要参考之一。每个网页应有独一无二的 title,描述网页主要内容,主题明确,避免罗列无关信息,重要内容放靠前位置,使用用户熟知语言,若有中英文名称,选用用户熟悉的做标题。
良好的内容建设:
网站内容建设应以服务核心价值为主,提供对核心价值有帮助的内容,符合网站主题,面向用户提供原创内容。如 it 新闻网站不应放美女图片,sns 网站可利用人名搜索资源吸引新用户。
写好锚文本:
锚文本是做链接时的描述文字,用于告知用户链接指向网页主题,描述越清楚越能吸引用户访问。搜索引擎刚发现新网页时,锚文本是唯一参考因素。
为图片加 alt 说明:
在图片无法显示时让用户了解图片信息,也让搜索引擎了解图片内容。资源丰富的内容可做成专题形式提供给用户,利用用户投票评论判断资源质量,管理好 web2.0 产品,避免被作弊者利用影响站点权重。
赢得用户对网站的推荐:
互联网上相同内容服务的网站众多,推荐是决定网站在搜索引擎排名的关键因素。推荐形式多样,如即时通讯推荐、论坛转帖、博客介绍、友情链接等。适当鼓励引导用户推荐网站,对搜索引擎表现有很大帮助。
良好展现:
吸引眼球的 Title:
用户在百度网页搜索中看到的 title 是摘要的重要内容,主题明确的 title 能帮助用户判断网页内容是否符合需求。标题应包含重要内容,避免过多额外描述,使用用户熟知语言,若网站用户熟悉可加入网站名称,增加吸引力和信任感。
善用 Metadescription:
Metadescription 是网页内容的精练概括,与网页内容相符时可能被百度用作摘要选择目标,但不影响网页权值。网站首页、频道页、产品参数页等适合使用 description,应准确描述网页,为每个网页创建不同描述,长度合理。
网站运营:
目标 = 转化率:
从搜索引擎获取流量的最终目的是提升网站核心价值,转化率是衡量搜索引擎收益的重要指标。不同类型网站核心价值不同,内容型网站是忠实用户,SNS 网站是注册用户,电子商务网站是卖东西。
搜索引擎流量分析:
搜索引擎用户在网站上的后续行为决定其是否转化为忠实用户,分析用户行为可为改进服务提供依据。可通过跳出率、退出率、用户停留时间等指标分析用户行为,了解用户需求是否得到满足,进而改进服务。
网站信任度:
网站信用度是用户对网站的信任程度,是用户在网站活动的基础。页面美观整洁、有风格,让用户了解网站背景,提供详细联系方式,展示用户评论反馈信息,强化网站品牌,可提高网站信任度。
不断强化品牌概念:
互联网品牌建设是通过优质内容服务换取用户信任,让用户从搜索引擎过客变为忠实用户。在满足用户需求的同时适当宣传品牌,有助于用户选择点击,促进口碑传播。
作弊与惩罚:
百度如何定义作弊:
任何利用搜索引擎策略缺陷、恶意获取不符网页质量排名、影响搜索结果质量和用户体验的行为都被视为作弊。作弊形式多样且不断发展,基本界定法则是看其是否影响搜索系统和用户体验。
作弊会受到怎样的惩罚:
任何损害用户利益和搜索结果质量的行为都会受惩罚,惩罚原则是轻者轻罚、重者重罚。对用户体验和搜索结果影响不大的,去除作弊部分权值;影响严重的,去除权值并降低网站权重,甚至从搜索结果中清理。
改正后能否解除惩罚?
惩罚目的是让互联网洁净,百度欢迎改正作弊行为的网站,有完善流程定期检测,大部分修正作弊行为的网站在观察期满后会自动解除惩罚。
关于百度的十万个为什么:
百度商业推广和自然搜索结果的关系是什么?
百度商业推广和自然搜索由独立部门运营两套独立系统,参加商业推广的网站在自然结果中一视同仁,商业推广和自然搜索是两个独立系统,商业结果在前,自然结果在后,构成百度搜索结果。
更换空间怎么办?
开通新空间,完整迁移网站并保持流畅访问,更新域名服务器指向新空间 ip,保证旧空间持续访问一段时间,关注新空间访问日志,待百度蜘蛛抓取完全迁移后停止旧空间服务。
百度是否支持 nofollow?
百度支持两种写法的 nofollow,带有 nofollow 属性的 url 不会传递权值。
百度支持不支持 https 协议?
百度目前只能收录少部分 https 网页,大部分无法收录。网站首页和对所有用户公开的内容页面建议不使用 https 协议,若必须使用,可做 http 可访问版方便百度收录。
Site 语法查到的结果数是百度收录的网页数量吗?
site 语法得到的结果数只是估算值,仅供参考,其初衷是让用户设定约束搜索范围,实现精准搜索,结果数和常规搜索一样都是估值,并非精确值。
修改网站标题是否会对网站排名带来消极影响?
title 是重要内容,大幅修改可能带来大幅波动,应慎重对待,按推荐写法将页面主旨反映在标题中,若无必要尽量不做大幅修改。
修改首页的 metadescription 是否会受到惩罚?
metadescription 只是摘要选择目标,修改只会影响摘要,鼓励通过其撰写网站简介,但过于频繁修改未必能及时反馈在摘要中。
百度建议 URL 静态化吗?
URL 动态或静态对百度无影响,百度没有歧视动态 url 的策略,现在能较好解决动态 url 中参数过多易制造 “黑洞” 的问题,但仍建议减少动态 url 中的变量参数。
百度支持哪些 Robots Meta 标签?
百度支持 nofollow、noarchive 两种 meta 标签,可防止搜索引擎显示网站快照和追踪链接不传递权重。
站点启用 CDN、反向代理、开启 gzip 压缩等服务会不会影响搜索引擎收录?
百度蜘蛛对站点的抓取方式和普通用户访问一样,只要用户能访问到的内容就能抓取到,选择有实力的服务商和成熟技术不会影响收录,不成熟技术可能导致访问不稳定,影响搜索引擎抓取。
百度对使用海外空间的中文网站有歧视吗?
百度对海外站点无歧视,但百度蜘蛛服务器在国内,国内普通用户访问受限的内容百度蜘蛛也无法抓取,只要国内能正常访问,就一视同仁。
百度如何对待一个主题完全更换、改版的网站?
如果内容发生根本性变化,会被视为全新网站,旧有超链失效。
联系与反馈:
可通过投诉反馈中心把问题反馈给百度,虽无法逐一回复,但会有专人整理并转交给相关工程师分析。"
}