为什么搜索赛道不乏进攻者却鲜有成功者? IT业界

在11月15日的“今日活力的头条创造者大会”上,新任《今日头条》首席执行官朱文佳在演讲开始时谈到了头条进入整个网络搜索领域的话题。从2017年组建团队到2018年低调发布,再到今天直言不讳的“瞄准第一件事”,标题今天进入搜索领域的意图无疑是非常明显的。

但20年后,百度和谷歌仍然是在国内外搜索市场上地位稳定的两大巨头。据国家统计全球统计(StatCounter Global Stats)称,过去12个月,百度一直保持着中国搜索引擎市场份额的80%左右,而谷歌占据了海外市场份额的近90%。

经济学的基本原理从一开始就告诉我们,从来没有一个市场有绝对高的壁垒,因为高壁垒会带来超额利润,自然会吸引更多的玩家进入,但是为什么搜索市场价值很大,而谷歌和百度是大浪淘沙后仅存的两个——因为罗马不是一天建成的。

为什么每个人都想做搜索?

在国内搜索市场,标题不是第一家试图挤进搜索引擎市场的公司。在此之前,来自美国的谷歌、必应和雅虎,以及搜索引擎、搜狗、360甚至国内的搜索引擎用户,都曾试图进入国内搜索引擎市场。在国外,谷歌也面临来自雅虎、必应甚至许多硅谷企业家的挑战。

成立于1996年的搜狐最初定位为一个基于网络的信息分类和导航网站,甚至有“出去找地图,在互联网上搜索搜狐”的口号。然而,随着网络信息的爆炸式增长,这种人工信息分类的局限性逐渐变得明显,信息分类模式逐渐被基于机器人智能分类自动捕捉的信息技术所取代。

直到诞生于2000年的第一个真正的中文搜索引擎百度(Baidu)推出后,中文搜索才从搜狐和新浪门户的信息分类时代转变为一个可以基于搜索关键词自动主动获取信息的搜索时代。可以说,随着网络信息量的不断增加和人们对信息获取的相对明确的需求之间矛盾的解决,搜索引擎的需求也在不断发展。

二十年前,谷歌搜索只有2500万页的索引,只有一个小图书馆的书籍。现在,谷歌搜索拥有数千亿页的索引,并且每天执行数十亿次用户查询。它的服务覆盖190个国家,提供150多种语言,超过了世界上所有图书馆的总和。

如何从大量的信息中获得你真正需要的信息,那么搜索是人们从大量的信息中快速找到他们想要的信息的最重要的手段。只要信息量大,对搜索的需求自然就会增加。这就是为什么雅虎和搜狐等门户网站最初开发了自己的搜索引擎,也是为什么头条新闻自然而然地想到要进行搜索。

搜索引擎市场具有巨大的商业价值也是一个公开的秘密。互联网最大的价值是连接人,连接人和信息,而搜索是连接人和信息的关键入口,这种分发形式的准确性远远高于个性化推荐。因为一旦用户有了搜索行为,就意味着他对信息有明确的需求,这自然会产生更准确的商业价值。理解这一点让我们很容易理解为什么这么多公司想进入搜索市场。

罗马不是一天建成的,为什么搜索起来不容易?

搜索的诞生源于百度搜索引擎的理论和技术基础,源于其创始人李彦宏发明的专利超链接分析技术。这项技术是现代搜索引擎的重要技术基础,也影响了谷歌的两位创始人。可以说,搜索本身是技术发展的产物。

在20多年的发展过程中,搜索引擎的不断优化也是在技术的推动下完成的。在搜索引擎领域,一个非常重要的指标是“第一满意率”,即从用户的搜索结果中获得的能够满足用户需求的第一条信息的比例。李彦宏在2019年世界互联网大会上透露,百度搜索的满意度在2017年为16%,在2018年上升到37%,今天达到56%左右。

由此可以看出,搜索引擎并不像许多人认为的那样是过时和陈旧的技术。它仍然是不断迭代和优化的,这也直接关系到用户需求的变化和改善。对于用户来说,首要要求是能够搜索他们想要的结果,这就要求搜索结果更加用户敏感、准确和独特。因此,搜索经历了个人电脑和移动时代,从提供多样化的搜索结果到为用户提供独特的有利结果。搜索技术已经发展成为人工智能,能够让搜索理解用户。谷歌、百度和搜狗等搜索引擎公司都致力于开发人工智能技术。

更高的技术门槛——目前,许多移动产品只能提供最基本的站内检索服务,这还达不到搜索引擎的高度。如果你想做一个全网搜索,你需要解决通用人工智能(AGI)问题,也就是说,不管用户说什么,搜索引擎都能理解并提供习惯性的搜索结果,这需要大量的投资,也不容易做到。因为与具有相对窄数据量的站内搜索相比,全网络搜索所面临的用户搜索需求的多样性和复杂性不是一个数量级。

用户不是搜索网页,而是解决他们面临的问题,也就是说,获得结果。然而,这需要完全的生态支持。为此,百度加强了知识体系、内容和服务生态的建设,允许用户从搜索门户触及更多的内容和服务闭环,极大地丰富了搜索范围。谷歌的搜索引擎也围绕搜索引擎产品建立了一个完整的开环和闭环生态,从最初的一个到拥有超过10亿用户的八个产品。

尤其是在手机和个人电脑的内容和服务逐渐分离的当前,搜索引擎获取内容比以前更加困难,这需要一定的生态基础作为支撑。搜索引擎必须有一个完整的产品内容生态,以支持用户更有效地实现搜索目标,所有这些都需要长期积累。因此,在搜索引擎市场上总是有许多挑战者,但金字塔顶端总是有许多挑战者。

下一代搜索引擎会是什么样子?

进入人工智能时代,智能搜索正在突破“框架”的限制,从手机延伸到智能扬声器、智能汽车等场景,并将成为无处不在的超智能互动门户。搜索互动的方式正在发生巨大的变化。越来越多的人开始通过语音助手查询天气、地图和服务。下一代搜索引擎已经出现。

2015年,谷歌逐渐引入人工智能算法RankBrain,并将其应用于一些搜索结果。现在,该算法已经应用于超过55亿个搜索服务。在谷歌用来确定网页排名的数百个因素中,兰克布雷恩排名第三。据统计,用户在谷歌上输入的搜索词有15%以前没有被搜索引擎遇到过。通过RankBrian,谷歌可以分析和重新匹配这些术语,从而使搜索结果更加准确。但是兰克布雷恩真正需要解决的技术问题是人工智能的语义理解,也就是机器如何能读懂人。

百度长期以来也关注人工智能技术与搜索的结合。自2010年以来,百度一直致力于自然语言处理、机器翻译、语音、图像、知识地图、机器学习、数据挖掘、用户理解等技术的研发。在百度看来,智能搜索是搜索的必然趋势,百度也为此做了大量的技术储备。百度在语音交互领域也做了大量的布局。

除了谷歌和百度,搜狗在人工智能领域也非常活跃。智能语音转录、人工智能合成锚,以及将搜索逐步推广到智能问答……2016年正式提出人工智能策略的搜狗,也在根据自己的产品线和特点寻找人工智能和搜索引擎的整合点。在王小川看来,搜狗的未来在于“以语言为核心的人工智能领域的持续投资”。

至于必应,作为世界上市值最高的科技公司,微软从未缺席过人工智能领域。除了在其搜索引擎产品中使用人工智能使必应搜索更加自然和准确之外,微软的交互式人工智能机器“微软冰”(Microsoft Ice)的最终目的不是陪人们聊天和解闷,而是在未来提供更好的交互式搜索引擎服务。

人工智能和声音之间的互动给搜索带来了翻天覆地的变化。谷歌搜索主管本·戈麦斯(Ben Gomes)表示,通过将人工智能语音技术与搜索引擎相结合,“这将把全球最大的搜索引擎从基于关键词的搜索转变为更接近语言的搜索(语音搜索)。我们仍远未完全解决问题,但这是向前迈出的一大步…如果人们能得到更多的问题答案,他们会问更多的问题,这将为整个生态系统带来更多的流量”。

正如传播学学者麦克卢汉所说,“媒体就是信息”。信息形式的变化带来了不同的信息分配规则和结果。人们希望随时随地以各种方式获取信息。对这种信息发布方法的搜索也是多样化的。今年,谷歌向外界展示了增强现实、计算机视觉、语义识别和搜索功能相结合的奇妙效果。从最初的文本搜索、载体形式,到当前的图像搜索、视频搜索、语音搜索、增强现实搜索,未来的搜索有很多可能。

20多年的历史被认为是互联网产品的“高级时代”,但对于这种处于用户基本需求高峰的产品来说,20年可能只是开始。人工智能等新技术的影响才刚刚出现。罗马才刚刚出现,搜索的发展还有很长的路要走。

作者:君士坦丁堡·