搜索关键词加个VS有何用?学下棋、追剧都不在话下,澎湃号·湃客,澎湃新闻,ThePaper
如果您有SEO优化、网站建设需求请致电:18510193015
以下内容选自 Medium,作者是 DavidFoster,由机器之心编译,参与编译的有 Panda、张倩。
我们在使用搜索引擎时,都知道引号、星号、加减号等符号能助力我们更快找到想要的结果。那你有没有试过在搜索词后面加个「VS」呢?最近,有位 medium 博主分享了「搜索词」+「VS」的奇妙用法。利用这个技巧创建的 egograph 能在学习下棋、购买宠物甚至追剧等活动中发挥作用。
你是否曾在搜索引擎里输入一个关键词后再加上「vs」,然后观察它自动匹配出的内容呢?
事实证明,这是个有趣且实用的技巧,能帮我们快速找到感兴趣事物的其他对应或替代选项。
不仅如此,当我们想要了解一项技术、一款产品或一个概念时,这个技巧也能提供有效帮助,原因主要有三点:
学习新事物的最佳途径是了解它与熟悉事物的异同。当在搜索引擎返回的列表中看到熟悉的事物时,我们会立刻产生「原来如此」的感觉。
操作十分简单,短短几秒钟就能完成。
输入「vs」后,搜索引擎会认为我们要对「vs」前后的事物进行直接比较。我们也可以使用「or」,但「or」表达的比较态度不如「vs」强烈,此时谷歌返回的可选内容可能会偏离我们的预期,比如:
「bert or」返回的结果大多和儿童节目《芝麻街》相关,而「bert vs」返回的结果则是和 BERT 模型相关的内容。
基于这一观察,如果将谷歌自动填充的关键词继续用「vs」进一步搜索并持续下去,就能得到一个由关键词连接而成的图网络 —— 自我中心图:
这种技巧可以很好地用于创建技术、产品或想法之间的心理映射图,让我们了解它们之间的关联。
我们可以自己构建这样的图网络。
vs 技巧自动化:
可以使用下面这个 URL 来获取 XML 格式的自动填充建议。不过这个看起来不太正式,所以最好不要大量查询。
http://suggestqueries.google.com/complete/search?output=toolbar?gl=us&hl=en&q=
其中,output=toolbar 会以 XML 格式返回响应结果,gl=us 设定国家或地区,hl=en 设定语言,q = 是你想要自动填充的关键词。
gl 和 hl 可以分别使用标准的两字母国家地区代码或语言代码。
现在就来试试吧。
首先选择一个初始关键词,这里我们选择 tensorflow。
先将 q=tensorflow%20vs%20 放到上述 URL 的相应位置:
http://suggestqueries.google.com/complete/search?output=toolbar&gl=us&hl=en&q=tensorflow%20vs%20
然后访问这个网址。
这时我们会得到返回的 XML。现在需要依据一些标准来判断是否保留各个自动填充建议。
这里使用的标准是:
自动填充的关键词不应包含我们输入的搜索关键词,即 tensorflow;
自动填充的关键词不应重复,比如 pytorch;
不应包含有多个 vs 的选项。
筛选后,我们得到 5 个合适的关键词,然后舍弃其他的。
这只是清理返回建议列表的一种方法,也可以包含仅有一个词的返回项。具体采用何种方法要根据具体用例来决定。
使用这套标准后,我们可以得到以下 5 个经过加权的连接:
然后继续。把这 5 个关键词加上「vs」,再次通过上述 URL 搜索自动建议,同样在过滤后保存前 5 个连接。
如此不断重复,扩展 target 列中尚未被探索的词。
操作足够多次后,我们可以得到一个包含加权边的表格,而且很适合用图来可视化。
自我中心图:
前面提到了自我中心图。下面是 tensorflow 的自我中心图。这里的自我中心图是指所有节点与 tensorflow 节点的距离小于特定值的图。
那么这里的距离是指什么呢?
先来看这个图:
我们已经知道从关键词 A 到关键词 B 的边的权重,根据自动建议列表取值 1 到 5。为了得到无向图,只需要将两个方向的权重加起来就行,此时权重范围为 1 到 10。
那么,每条边的距离就简单地等于「11 - 权重」。选择 11 是因为边的最大权重为 10,此时两个关键词都出现在彼此的自动建议列表最上方。基于这个定义,关键词之间的最小距离为 1。每个节点的大小和颜色由边的数量决定,这表示其出现在自动建议列表中的次数。所以,节点越大,这个概念就越重要。
上面的自我中心图半径为 22,表示以 tensorflow 为起点,抵达任何一个节点的距离不超过 22。如果把半径增大到 50 会怎样呢?
很不错吧?这个图包含了 AI 工程师需要了解的大多数已有技术,而且是按逻辑进行聚类的。
而这一切都始于一个关键词。
怎样画出这样漂亮的图呢?
它的 GUI 简洁易用,能让我们轻松构建图网络和其他图表。值得一试。
如何构建给定半径的自我中心图呢?
这要用到一个 Python 软件包:networkx,其中有一个好用的函数:ego_graph。需要指定半径作为该函数的输入参数。
ego_grap:https://gist.github.com/davidADSP/35648e480685c6b57ce1efad50170c26#file - ego_graph - py
这里还用到了另一个函数 k_edge_subgraphs 来移除一些偏离主题的关键词。
例如,storm 是一个开源的分布式实时计算系统,但同时也是漫威宇宙的一个角色。如果在谷歌搜索框里输入「storm vs」,猜猜会出现什么结果?
k_edge_subgraphs 函数可以发现无法被少于或等于 k 次切割分开的节点分组 —— 一般来说 k = 2 或 k = 3 效果较好。仅保留 tensorflow 所在的子图就能确保我们接近目标,不会偏离到幻想世界。
使用自我中心图来组织日常生活:
不再看 TensorFlow 的例子了,来看另一个自我中心图:国际象棋的西班牙开局。
这个技巧能让我们快速得到最常用开局思路的图,便于组织研究。
现在来点好玩的。
吃得更健康!
羽衣甘蓝很健康,但可能想换个口味?那就用「kale vs」找到 kale 的自我中心图来寻找新的健康食材吧。
想买只宠物狗!
但狗狗品种那么多,时间有限,选哪个好呢?
寻找真爱!
宠物狗和甘蓝还不够,还想找个伴侣?这里有个约会应用 coffeemeetsbagel 的自我中心图。
甚至还可以用这个技巧来找可能爱看的剧,比如下面这个英剧《The Office》的自我中心图。
原标题:《搜索关键词加个「VS」有何用?学下棋、追剧都不在话下》
列举一些在搜索时加“VS”能得到有趣结果的例子