AI搜索大热,谁走在最前面?
如果您有SEO优化、网站建设需求请致电:18510193015
最近浏览 AI 新闻,大幅版面皆与 AI 搜索相关,AI 巨头们自文生视频的 Sora 起便在搜索领域展开角逐。这不禁让我回想起前些日子难住 Kimi 的一个问题:100ml 咖啡粉大约等同于多少 g 咖啡豆。事情是这样的,双十一期间我购入一包 250g 的咖啡豆,前往咖啡店将其研磨成粉用于手冲咖啡。我的朋友想要品尝,且执意与我 AA,但我们手头没有秤,难以计算。最终他拿来一个以 ml 计量的容器,装了 100ml。于是我打算偷懒询问 Kimi,Kimi 作答后,我即刻截屏。Kimi 浏览 35 个网页后告知我,100ml 的咖啡粉大约对应 285.71 克的咖啡豆。而我所购咖啡豆仅 250g。我表示这太过棘手,几经劝说,朋友最终放弃与我 AA。因此,今日撰写测评,我将以 “难题” 作为提示,测评一下 AI 搜索哪家更为出色。提示:100ml 咖啡粉大约是多少 g 咖啡豆?参与测评的选手包括月之暗面 Kimi、字节豆包、秘塔 AI 搜索、Perplexity 以及 ChatGPT。月之暗面 Kimi首先给 Kimi 再次机会,此次使用的是 Kimi 探索版,其主打解决复杂搜索问题。约 15 秒后,Kimi 给出答案。在 Kimi 的表述中,100ml 咖啡粉前面需要 20g 咖啡豆,后面需要 67g 咖啡豆,这让我觉得它似乎并未理解这 100ml 究竟是指咖啡粉还是制成的咖啡。再看 Kimi 的工作流程,它对我的问题进行搜索,灰色字显示,Kimi 采用的是关键词搜索法。在右侧搜索栏中,Kimi 搜索到最多的是咖啡的粉水比,与问题毫不相干,给人一种以上帝视角给出答案却无具体路径的感觉。这令我颇感失望。我调整措辞再次尝试。开启新的对话,依旧使用探索版,将提示改为:把 250 克咖啡豆磨成粉,用来做手冲咖啡,取出 100 毫升咖啡粉,请问这 100ml 咖啡粉是由多少克咖啡豆制成的?Kimi 看似朝着答案靠近,右侧搜索栏也看似逐渐正确,但我点开右侧链接,前 5 个链接里均未找到 Kimi 所参考的密度信息。此外,前三个链接皆源自一个咖啡爱好者分享的帖子,信息来源的可靠性或许正如其所言:内容由 AI 大模型生成,请仔细甄别。字节豆包豆包的左侧功能区专门为 AI 搜索预留一个模块,输入提示后,约 8 秒钟便给出答复。虽豆包的工作流程也是理解问题 - 搜索网页 - 找到来源 - 总结陈述,但从结论来看,豆包起初并未理解问题,只是依据搜索到的信息交出一份敷衍的答卷。值得称赞的是,豆包在总结文本中添加了来源引用标注,使文本更具可追溯性。那么我们也对豆包友好一些,开启新的对话,使用更为确切的提示进行搜索:把 250 克咖啡豆磨成粉,用来做手冲咖啡,取出 100 毫升咖啡粉,请问这 100ml 咖啡粉是由多少克咖啡豆制成的?豆包表示,由于缺少咖啡粉的密度数据,无法直接换算出对应的质量,搜索的网页数量从 5 个变为 6 个,虽有进步但仍显懈怠。于是,我尝试深入搜索,等待 30 秒后,豆包输出一篇 1500 字长文,向我讲述诸多道理,包括 250 克咖啡豆磨粉后的粉量范围、手冲咖啡用的咖啡粉量估算等等信息,但均未涉及毫升与克重的换算。秘塔 AI 搜索秘塔 AI 近期备受关注,此次经过约 16 秒的等待,秘塔给出自己的答案。不得不说,秘塔 AI 的表现令人眼前一亮。它不仅在文本陈述中展示了搜索的完整路径,还精准锁定我的问题所对应的内容,给出相应答案。这与人类使用搜索引擎查找信息的过程极为相似。在秘塔的搜索栏中,还设有全网、文库、学术、图片、推荐等板块,可满足不同搜索类型的需求。另外在右侧可以看到,秘塔甚至已准备好下一步为我生成 PPT。总体而言,秘塔 AI 展现出卓越的问题理解能力,我也无需进一步明确提示,其回答流畅直接。PerplexityPerplexity 是一家总部位于美国的 AI 初创公司,创立于 2022 年,公司创始人阿拉温德・斯里尼瓦斯来自 OpenAI。据悉,Perplexity 在 AI 搜索领域表现出色,尤其是在答案引擎方面优势显著。2023 年 10 月,Perplexity 完成一轮融资,估值达 5 亿美元。此外,软银集团愿景基金二期计划向 Perplexity 投资 1000 万至 2000 万美元,对 Perplexity 的估值为 30 亿美元。近期,Perplexity 正在进行新一轮融资谈判,期望将其估值提升一倍以上,达到 80 亿美元或更高。Perplexity 在 8 秒钟即给出答复。但从答案来看,Perplexity 也认为我要饮用 100ml 的咖啡。考虑到中英文理解的难度,我修改提示再试:把 250 克咖啡豆磨成粉,用来做手冲咖啡,取出 100 毫升咖啡粉,请问这 100ml 咖啡粉是由多少克咖啡豆制成的?Perplexity 的答案立即得到改善。ChatGPT再看 ChatGPT,输入提示后,ChatGPT 在 13 秒左右给出答案:ChatGPT 言简意赅,答案简洁明了。首先其理解问题的能力较强,其次算法逻辑在 5 位选手中独树一帜,虽数值与上文有所差异,但也在合理范围之内。似乎也无需我进一步明确提示。AI 搜索与传统短查询此次测评选取的提示,指向近期 AI 领域热门的数学推理能力与 “搜索引擎替代说”。10 月 31 日,OpenAI 发布了 ChatGPTSearch,引发全球热议,即生成式 AI 是否将就此改变人们获取信息的方式?谷歌作为传统搜索引擎更是首当其冲,许多人认为 OpenAI 的搜索引擎或将成为未来的 “Google 杀手”。国内多款大模型也先后推出 AI 搜索版,它们能够直接提供实时答案,助力用户避开大量广告和 SEO 优化的文章,快速找到所需信息,并以相对简洁的格式呈现答案,同时附上信息来源的链接,引用的标注也可对 AI 生成的文本进行快速校验。然而,无论哪一家,距离技术成熟都尚有很长的路要走。这并非仅仅是 AI 不够 “聪明” 的问题。更为深层次的问题在于,AI 搜索采用的是关键词搜索,而传统搜索引擎如 Google 最常使用的功能是导航型检索。四个字以内的简短查询占据了 Google 搜索的大部分,这些通常是用户知晓但不愿逐字输入的网址,或者只是通过关键词快速定位目标网页的搜索。例如 “上海天气”、“白色 T 恤”、“咖啡馆营业时间”、“附近自习室” 等等,这些查询使谷歌成为数十亿网民上网的入口。我输入 “白色 T 恤” 想要购物,但豆包却向我解释了几种白色 T 恤的款式、面料和设计。大语言模型或许并不适合处理这些短提示。它通常需要完整的问题才能有效回答,因为完整问题能构建强大的统计模式。AI 搜索并不清楚,搜索 “白色 T 恤” 的人可能是想购物,而不是了解这种衣物的材质。对于这些问题,用户可能需要像我修改提示那样,一次次地将其具体化和精确化。OpenAI 发言人 NikoFelix 在一份邮件声明中表示:“使用 ChatGPTSearch 时,我们观察到用户比以往使用其他搜索工具时更倾向于以自然语言提问。同时 —— 网络导航查询 —— 通常较短且相当常见。我们计划随着时间的推移改进这些查询类型的体验。”Perplexity 也曾被吹嘘为 “Google 杀手”,但它在短查询方面也遭遇同样的问题。PerplexityCEOAravindSrinivas 曾谈及用户对其产品与 Google 搜索的不同使用方式,“在 Google 搜索中的查询字数中位数在 2 到 3 之间,而在 Perplexity 上则在 10 到 11 之间。所以显然,用户在 Perplexity 上直接提出问题的频率更高。而在谷歌上,用户通常输入几个关键词快速找到特定链接。”但换个角度看,这意味着,AI 搜索在回答长问题时表现相当不错。类似 “美联储继续宣布降息,对全球经济将产生什么影响?” 这样的复杂问题,谷歌往往难以回答,而 AI 搜索可以快速从多个网站获取信息并提供一个合理的答案。要真正替代 Google,AI 搜索需要改进人们日常生活中更为常用的短查询。但问题在于,AI 搜索为何非得替代 Google 不可呢?AI 搜索在提供被传统搜索掩盖的信息方面填补了一个新空白,这本身便具有价值。深耕知识性长问题,另辟蹊径,又有何妨?