我们用12520个热词测试了百度搜索,发现了这些规律
如果您有SEO优化、网站建设需求请致电:18510193015
百度近期又有新动作,其搜索结果的显示方式发生了改变。自昨日中午起,原本显示域名之处被名称与图片所替代,除非进行点击跳转,否则用户难以从域名判断信息的真实来源。\n\n 例如,在搜索关键词 “特朗普” 时,相同的搜索结果与位置,前一天还显示域名,昨天却已显示 “环球时报评论”。需注意的是,仅新闻资讯类网址呈现这种变化形式。\n\n 修改后:\n\n 你或许会认为 “环球时报评论” 会导向 “环球时报”,但实际指向却是环球时报百家号。自媒体与机构媒体,是 “百家号” 还是 “网站”?让人难以分辨。\n\n 修改前:\n\n 模糊的界限 \n\n 从 “信息来源” 角度看,如同身份证一般,“域名” 具有唯一性。诸如 gov、edu、org 等后缀有着严格的注册标准。\n\n 这次样式变动,一是使信息来源变得模糊,背后究竟是谁在筛选信息,谁来为真实性把关?二是模糊了百家 “号” 与 “网站” 的差异。\n\n 这并非百度首次模糊界限。曾在百度导航栏设有 “新闻” 选项,在 2017 年上半年,“新闻” 悄然变为 “资讯”。\n\n 百家号 “霸屏”?\n\n 两天前,自媒体 “新闻实验室” 指责百度第一页搜索结果半数以上会指向百度自家产品,尤其是百家号。\n\n 面对指责百度倍感委屈,声明称百家号全站占比小于 10%。副总裁沈抖在接受采访时表示 “问心无愧”。\n\n 按 “全站占比” 统计是否有意义?\n\n 上海交通大学媒体与传播学院魏武挥写道:“这种回应有逃避问题之嫌:方可成批评的是第一页结果,百度回应的是‘搜索结果’,可理解为全部结果。但通常情况下,除非有特殊目的,很少有用户会对三页之后的内容感兴趣。”\n\n 搜索引擎用户行为研究表明,92% 的用户在搜索时会点击前 5 个位置。点击次数到第三页急剧下降,第五页之后几乎无人点击。这与我们的实际体验相符。因此,相较于 “占比”,更为关键的概念是 “排序”。10% 的内容在前 10% 的位置展示与在后 10% 的位置展示,效果截然不同。\n\n12520 个热词背后 \n\n 于是,我们使用 12520 个搜索热词在百度搜索上展开测试,探究百家号或其他百度号,包括百科、贴吧、文库等网站在搜索结果第一页所占比例,以数据判断百度是否被冤枉。\n\n 结果显示,50.3% 的关键词在第一页有一半以上的结果指向百度自家网站,其中 59.3% 指向百家号。也就是说,若第一页有 10 个链接为百度自家网站,6 个便是百家号。若将范围稍加扩大,89.8% 的关键词在第一页结果中包含百度自家网站,84.5% 有百家号。\n\n 百家号不仅在页面上作为独立搜索结果分散分布,还存在一级链接 + 5 个副链接的整块显示形式。作为中文互联网搜索最大的流量入口,2018 年第一季度百度的市场份额占比达 80.09%。\n\n 什么样的关键词容易出现百家号结果?\n\n 依据我们的热词搜索结果,百家号占比位居前 1% 位置的关键词是:\n\n 百家号占比排在前 1% 位置的关键词,人名、娱乐、健康、体育、生活知识等类别的关键词最易出现百家号。搜索精准的网站名、查询工具类的关键词出现百家号的概率较低。\n\n 在百度更改搜索结果中百家号的样式后。原有的测试方法连计算机都无法从首页源代码中获取真实的链接,必须点击进入才能知晓到底是什么网站。我们变更方法后重新测试,结果与首次测试一致。尽管样式改变,但排序算法依旧如初。\n\n 搜索引擎的 “把关” 逻辑 \n\n 搜索引擎仿若我们在互联网时代的眼睛,在很大程度上决定了我们将看到何种内容、产生何种思考。有了互联网之后,“信息平等” 看似近在咫尺,但 “把关人” 始终存在,只不过在搜索引擎上,从人转变为机器。\n\n 搜索引擎究竟依照何种规则排序?\n\n 追本溯源,这实则是一个 “大家都在看什么” 的数学问题。\n\n 上世纪 90 年代,最原始的排序方法是 —— 关键词出现次数越多越排在前面。显然,排在前面的极有可能是重复关键词的垃圾网页。\n\n 谷歌主导互联网搜索后,一种新的排序方法应运而生 —— 链接流行度,一个网页被其他网页链接得越多,排序越靠前。\n\n 此后排序算法持续升级,纳入了关键词突出程度、网页点击量、停留时间、相似关键词等因素综合考量。排序算法至今都是各公司的 “核心机密”,“大家在看什么” 的朴素算法依然是排序的核心与基础。\n\n 在信息流出现之后,排序算法又经历了一次革新。决定什么排在前面的不再是 “大家都在看什么”,而是 “你想要看什么”。算法会依据你的互联网使用行为来推测你的喜好,将你喜爱的相似内容自动排在前面推荐给你。百度如此,谷歌如此,几乎所有的搜索引擎都在做这件事。\n\n 在百度这一模式被称为 “搜索引擎 + 信息流” 的双引擎分发战略。该战略在 2018 年为百度带来了超过 1000 亿元的收入,第二季度移动端净营收占比从去年的 5% 提升至 77%。信息流及 AI 业务占到百度核心近 20% 收入,同比增长则超过 150%。\n\n 如此高额的盈利能力,其中一个重要基础就在于借助百家号实现了用户的最终停留。\n\n 主动搜索行为和信息流推荐同时掌控分发渠道,190 多万个百家号构成了百度建立的庞大内容池。自家的引擎推荐自家的内容,流量从百度搜索来,到百度号去。\n\n “把用户留在自己的网站上”,本无可厚非。根据搜索引擎专家 RandFishkin 的统计,在谷歌上,12.6% 的点击去往排名前 100 的大型网站,剩下 87.4% 的点击去往普通站点,其中又有 11% 的点击去往谷歌自己的网站 —— 包括地图、邮箱、图书等。\n\n2016 年的魏则西事件或许让百度意识到搜索引擎需要承担更大社会责任。然而,从竞价排名、贴吧广告、信息流推荐,再到百家号 “霸屏” 来看,百度对搜索引擎的 “排序” 逻辑似乎并未改变。