自App Store出现以来,基于分类榜单的应用商店成为人们下载移动应用的首选方式,不少开发者为获得一个好的位置不惜花费巨额资金刷榜。国内尽管出现了数十家第三方应用商店,但大多也都是以人工推荐和分类排名为主要的分发方式,并无太多差异。
不过经历了过去几年的爆发式增长,如今Android与iOS的应用数量先后突破百万,人工推荐及分类榜单难以覆盖长尾应用,也无法满足用户日益差异化的需求;与此同时,应用搜索正悄然改变着应用分发领域。
原始的应用搜索
根据易观智库发布了《2013年第3季度中国移动应用分发市场监测报告》,目前移动应用分发由应用商店、手机浏览器和移动搜索三种渠道构成,其中应用商店的分发量超过80%。而在应用商店里,搜索正成为最主要的分发方式——360、豌豆荚和应用汇的相关负责人均向我透露,在各自的应用分发渠道里,通过搜索下载应用的比例都超过了50%,并仍保持着增长的趋势。
回顾互联网的历史,这个趋势并不令人意外。
在互联网走向民用的早期,分类目录、门户网站一度是人们找到新网站、页面进而获取信息最主要的方式,美国的雅虎,国内的搜狐、网易、新浪等也因此成为互联网泡沫时期行业热点。然而搜索引擎的出现为用户寻找页面、获取信息提供了全新的渠道,人们不再只能按照网站编辑提供的路径在网上“冲浪”,而可以随心所欲的用自己的关键词搜索到相关的页面,可接触到的信息范围迅速扩大,使用互联网的自由度也大幅提升。门户网站的地位被迅速取代,如今Google和百度无论是在网站流量、广告收入还是公司市值方面都远超以雅虎、新浪为代表的门户网站。
在360搜索高级产品经理、雷电搜索负责人何捷看来,搜索能给用户寻找应用带来更大的自由度,是个“刚需”:“推荐位毕竟很有限,而用户很多时候是有相对明确的需求的,推荐也无法满足。”
但与传统的垂直搜索不同,应用搜索并非网页搜索的一个分支。一方面,移动应用相对封闭,搜索引擎无法像抓取网页信息一样通过爬虫获取应用内部的信息,只能依据应用标题、应用介绍等极为有限的信息进行关键词匹配。另一方面,网页搜索算法的一个重要指标是链入链接的价值,例如Google的两位创始人就是基于该因子发明了PageRank算法;而在移动应用领域,除少数有合作的应用外,极少有应用会提供跳转到其他应用外链,因此网页搜索引擎的排序算法难以被运用在应用搜索领域。
正是由于这些差异,在网页搜索技术不断演进的今天,应用搜索仍显得相对原始:几家应用商店方面都表示目前的应用搜索算法主要还是基于关键词匹配。
何捷表示,360的搜索算法考虑的因素主要是用户的搜索请求与应用的名称、描述文本匹配度,以及应用的下载量和在全网里的热度等属性。豌豆荚则提供了其应用搜索算法中的关键因子:用于检索的包括应用标题、应用包名称、应用副标题、应用描述以及标签/分类;用于过滤、排序的则包括、是否是官方版、是否包含广告、是否有隐私问题、手机版本支持以及是否是优质。
对于知道应用名称并进行精确搜索的用户来说,关键词匹配的方式能快速帮他们找到所需的应用。但对于其他类型的搜索请求,基于该机制搜索引擎则难以给出令人满意的结果。
例如,一个对应用一无所知的应用希望无论搜索一款带有交友功能的应用,他可能会搜索“社交”、“约会”或“交友”(甚至“约炮”)等关键词,但在安卓市场和豌豆荚的搜索结果中,你只能看到一些名称、描述语或应用标签中含有这些关键词的应用,而看不到微信、陌陌这两款最流行的交友应用;而在App Store、应用汇与360手机助手中,这两款应用出现在了部分搜索结果中,但均排名靠后。
如果应用由多个相对独立的子模块集成的,在这种搜索机制下就更难被检索到。Touch China的景点通是一个典型的例子,这家公司因开发故宫导览而成名,随后又陆续开发了全国各地多个景区的导览应用;不过为了提升应用的总下载量和在应用商店榜单上的排名,从去年起,Touch China将独立的景点导览合并在了景点通这个应用之下,用户可在应用内部下载各景点的导览包。
据Touch China副总裁张碧仿介绍,合并之后的景点通在应用商店榜单上的排名的确高于此前单独的景点导览应用,但搜索流量却受到了影响:不少用户并不知道“景点通”的名称,仍使用景点名称作为关键词进行搜索,但由于应用名称未包含这些关键词,景点通在这样的搜索结果页面往往排在较后的位置,甚至根本不会出现。
例如搜索“乌镇”,在App Store里景点通排在搜索结果的第10位,前面大多是名称中包含“乌镇”二字的应用。在国内的几家第三方引用商店里,360手机助手、安卓市场和豌豆荚的搜索结果页面没有出现景点通,应用汇则将景点通排在了第12位。
“不管是苹果的App Store还是国内的应用市场都还没有一个很好的搜索机制。”张碧仿表示,目前大多数应用市场尽管看到了搜索方面的需求,但还并未将工作重点从人工运营转到搜索方面来。
另一些应用相对容易被检索到,但它们的开发者仍希望搜索算法能做进一步的优化。
AVOS旗下的短视频交友应用玩拍上线后获得了不错的反响,在得到苍井空的推荐后更是人气暴增。对于应用搜索,AVOS运营经理王臣汉提出了一个或许是许多开发者共同的需求:他希望用户在搜索“美女”这样的关键词时能找到自己的应用,但又不希望在应用名称或描述中直接出现这样的关键词,引起部分用户的反感。在他看来,基于关键词检索的搜索引擎机制还无法很好解决这一问题。
优化搜索:机器与人工的较量
在用户与应用开发者对应用搜索提出更高要求的同时,应用分发渠道商们也注意到了目前的应用搜索机制面临的问题,并都在为提升搜索的转化率进行着尝试。
今年7月,360低调上线网页端的应用搜索引擎——雷电应用搜索。它最直观的特点在于能够借助360手机助手在网页端一键将应用安装到手机中;由于发布时间点的关系,不少评论认为它是360针对百度收购91的反击。不过此后,雷电搜索并未获得更多的关注;Alexa的数据也显示,雷电搜索的流量在其上线之后的几天内到达顶峰,随后逐渐回落,目前排名已跌至中国区2000名开外。
何捷解释说,360并未对雷电搜索做大力推广,而只是希望给用户提供一个补充性的选择,满足用户从网页端搜索应用的需求。他透露,这款产品由360搜索部门研发,其核心并非一键搜索功能,而是背后的雷电搜索引擎——它不仅应用在了雷电应用搜索上,也优化了360手机助手的搜索功能:“手机助手在使用了雷电引擎之后,搜索转化率有了相当大的提升。”
何捷称雷电引擎对于搜索结果的优化是全方位的,不过他重点谈到了借助网页搜索的数据给应用打标签:“我们引入了大量基于数据挖掘到的标签,以前搜不到的,现在都能搜到了;无结果的情况也大幅减少。”
标签大多由机器生成,在何捷看来,人工干预容易带来管理风险和其他负面影响,不同的人对于应用的理解也不一样,因此360对于人工运营“控制得相当谨慎”。
此外,雷电搜索还引入了点击调权的算法,用于改善搜索结果排序:“用户搜的人越多、点击行为越多,就会产生越多的数据,有利于我们提升搜索效果,其实就是用户在用脚投票。”
豌豆荚也在搜索算法中引入了标签机制,一方面由机器生成标签,另一方面也允许开发者自己提交应用标签,但后者需要经过审核。豌豆荚技术经理姚丛磊介绍说,豌豆荚设定的算法会分析应用的名称、介绍、用户评论等因子,并计算每个因子的重要性,“把里面比较重要的词做成标签,也会根据用户的点击反馈进行修正。”
负责应用搜索业务的豌豆荚软件工程师丁吉昌表示,豌豆荚作为创业公司,应用搜索团队只有10名员工,主要是研究算法的工程师,因此“大多数事情会交给机器来解决”。而在人工操作方面,豌豆荚的员工除了审核开发者提交的信息,还会对数据进行分析,以改进算法。“如果一个关键词的转化率特别低,我们就会人工分析一下,问题是什么,怎么解决。”
应用汇同样试图建立非精准的搜索关键词与应用之间的联系,“比如说你在应用汇里搜‘吃饭’,就能看到大众点评这样的应用,这就需要你做更进一步的语义关联”。应用汇CEO罗川表示,语义关联的信息来自于开发者的描述、用户的评论以及第三方报道等渠道,“总之你要获得关于App更精准的信息,并把这些信息与App建立起有效的连接”。
与360、豌豆荚主要通过机器打标签的方式不同,应用汇更多选择由人工操作。“这里面逃避不了人工做的事情,”在罗川看来,尽管由机器处理效率更高,但由于应用的封闭性,目前用机器打标签的仍不够准确和智能,而人工的运营有助于提升语义关联的准确性,进而提升用户使用非精准关键词搜索时的转化率。在前文所述的案例中,通过“社交”、“交友”微信和陌陌,或者通过“乌镇”搜索景点通,应用汇的搜索结果都好于其他几家第三方应用市场,这在一定程度上说明由人工建立语义关联在目前的条件下仍有一定优势。
但基于标签的搜索仍旧只能对用户的搜索请求进行较为精准的匹配,如果用户不能把自己的需求提炼成精确地、标签式的词语,这一机制同样效果欠佳。如何能让用户以更接近自然语言的方式搜索应用呢?
美国的创业公司Quixey就因为将语义搜索引入应用搜索而备受关注,前不久刚刚完成了新一轮5000万美元的融资,由阿里巴巴领投。作为搜索引擎,Quixey并不提供应用下载,而是在搜索结果上直接提供应用在App Store、Google Play、Windows Phone Store等官方商店的链接。
它的特色在于用户不再需要提炼精确的关键词,可以更加随意地使用短语或句子搜索。其官网上给出了“和朋友聊天(chat with friends)”、“把我的手机用作手电筒(use my phone as a flashlight)”、“准备一场面试(prepare for an interview)”等搜索请求案例,而采用这些短语搜索所得到的结果中有许多应用名称也并不包含这些短语内所含有的单词,例如搜索“和朋友聊天”便会出现AIM、雅虎通、ChatOn等IM应用。
对于语义搜索在中文应用搜索领域的前景,国内的应用商店却有着不同的看法。
丁吉昌透露豌豆荚在语义搜索方面进行了尝试,也在招聘有相关背景的工程师,但尚未取得实质性的突破。他用一个案例描述了用户对于语义搜索的需求:一次去东莞调研,在和当地工人的聊天过程中他得知许多用户搜索神庙逃亡这款游戏时最常用的关键词是“猩猩在后面追”,这令长期呆在办公室里他大感震惊。“回来后我们就把这个关键词和相应的游戏建立了关联,但还有很多类似的案例目前还难以解决。”
我实际测试了一下:在Google或百度等网页搜索引擎上搜索这个关键词,会出现百度知道等UGC页面的信息,让用户知道游戏的名称;而在大多数应用市场里使用这个关键词搜索则看不到神庙逃亡的应用。
罗川对Quixey所做的工作十分赞赏:“他们做了大量的语义搜索,能够让你用更智能化的方式来进行检索。”不过在他看来,由于中文用户更习惯用名词搜索,而不是像西方用户一样用自然语言检索,目前中国应用搜索领域对于语义搜索还没有出现明确的需求,“在我们可见的范围内语义搜索还不会成为主流”。
何捷对于语义搜索也较为谨慎,他认为Quixey作为一家创业公司,需要通过一些新的东西来吸引融资,但实际上它的很多搜索词是“编出来的”,并非用户真是的搜索需求;而360则首先要尊重用户长年养成的搜索习惯,不宜贸然对搜索方式做大都调整。
未来:应用内搜索 VS Web App
标签、语义搜索能帮助部分用户找到自己需要的应用,但由于应用的封闭性,这些搜索方式所分析的数据仍旧是应用的外部数据;而用户下载应用真正需要的确是应用内部的功能和内容,因此仍旧有需要问题是现有的搜索机制无法解决的。
王臣汉用他父亲的例子说明了这个问题:“有次我父亲拉肚子,打电话问有什么办法能在手机上查到吃什么要,我给他推荐了应用助手这款应用;但让他自己搜索,他肯定不知道应用的名称,只会搜‘拉肚子吃什么药’;而他真正需要的也不是那款App,而是App里的答案。”
丁吉昌也用一个他观察到的例子说明了用户的需求:“你搜索郭德纲,可能是想找一款郭德纲的应用,但你真正想看的很可能是郭德纲的相声,即便下载应用最后也还是为了看相声。”
为打破应用间的壁垒,将所谓的信息孤岛连接起来,一些企业开始尝试对应用内的信息进行检索,即应用内搜索。
在Google最新推出的Android 4.4种,一个名为App Indexing的功能成为了亮点:用户在手机端打开Google搜索的应用,便不仅可以搜索到Web端的信息,也可以搜索到本地应用内部的信息。目前已有Allthecooks、Expedia、 IMDb、OpenTable等12款应用支持该功能,如果用户装了IMDB的应用,在Google搜索中搜影评信息时则会在搜索结果的最前端出现IMDB应用里的影评信息,同时还会提供打开该应用的链接。
事实上,在国内这一功能已不算新鲜。
百度早在去年就宣称正在研发应用内搜索,今年3月正式发布了这一功能。与Google的App Indexing类似,百度的应用内搜索可以检索到本地应用内部的信息,例如音乐、地图、电影等;不同于前者仅支持在Google的App里搜索,后者不仅支持百度的App,也支持在第三方浏览器中通过百度进行搜索,适用范围更广。
百度推出这一功能时提出的目标是“激活僵尸应用”;然而正式发布之后,百度并未继续推广,目前支持该功能的也主要局限于百度旗下的地图、音乐和爱奇艺等应用,鲜有第三方应用,似乎该功能已陷入停滞。我曾向百度方面求证该业务的进展,但并未获得答复。
在王臣汉看来,百度推应用内搜索面临的主要问题是流量的分配。他以百度在网页端推出的框计算为例,表示第三方开发者会因为担心百度将流量和用户导到自己的产品上而不愿将内容开放给百度,导致该功能因缺少支持而形同虚设。
在豌豆荚负责应用内搜索的姚丛磊也表达了类似的看法:“百度并没有公布应用内搜索的标准和技术流程,他们会把流量导到自己的App上。”
豌豆荚的应用内搜索功能推出于今年9月,首先上线的是视频搜索。在豌豆荚的App里搜索“变形金刚”,页面最上方出现的不是相关的应用,而是《变形金刚3》电影的入口,进入之后不仅可以直接播放或下载观看,还可以直接浏览到豆瓣影评的内容;在点击播放按钮后,屏幕上会弹出选择播放来源的提示窗,可选的来源包括快播、优酷、腾讯视频等应用,选择之后即可开始观看。
姚丛磊表示,豌豆荚之所以选择从视频领域切入应用内搜索是因为许多视频网站的内容主要为Web端优化,手机应用的体验则不够好,同时各大视频网站的内容资源也不尽相同,用户需要一个统一的入口来更方便地寻找到他们需要的视频资源。
不过在百度视频和快播被几大视频网站指责盗链、盗播并遭到起诉之后,豌豆荚的视频搜索是否会面临同样的情况呢?
对此,姚丛磊称,豌豆荚作为一家创业公司,希望能通过为第三方开发者提供价值的方式吸引他们与豌豆荚合作,因此不会做类似百度视频的事情:“我们是要去帮用户发现内容,然后把用户带到提供内容的App里面,而不是把流量全部放在我们这儿。”
从产品层面比较豌豆荚的视频搜索与百度视频的应用也可以很直观地看到二者的区别:使用前者播放影片调用的是相关应用内嵌的播放器,因此相同的视频内容选择不同的视频源,播放器的外观也会不同,如果没有安装某款视频应用,豌豆荚还会在播放结束时弹出安装提示;而使用后者时,无论视频来源于何处,调用的都是百度的播放器。
豌豆荚计划从视频搜索起步,探索应用内搜索的行业准则,并推广到其他领域;由于不同类型应用的内容组织方式各不相同,相互之间也没有链接,他们需要对海量异构数据进行索引,并结合应用的“基因库”与用户的搜索请求对应用的内容进行筛选,研发工作面临着相当大的困难。
在何捷看来,应用内搜索面临的另一大困难是业界缺乏统一的标准:“网页搜索为什么能成功?主要是因为网页的信息都在网上摆着,我们主动去抓取就好了,你作为网站不用主动做什么事情;应用内搜索则需要找很多人去合作,效率就比较低,也很难大规模扩展开。”
不过他也表示应用内搜索可能是未来的一大趋势,因此360目前也已着手在这个领域进行探索,但产品尚处于筹备期,不便透露更多细节。
如果将应用内搜索和语义搜索相结合,那么搜索“拉肚子吃什么药”便可以直接找到问题的答案,搜索“郭德纲”也将可以直接看到郭德纲的相声内容。
如果再结合图片、语音搜索呢?
或许当你坐在公交上,看到身旁有人在玩一款让你从未见过却又十分感兴趣的游戏,你不再需要问他游戏的名称,只需对着他的手机拍一张照片或者录一段游戏的声音,搜索引擎便会为你找出那款游戏。
随着技术的演进,应用搜索还将解决更多我们如今在搜索应用时难以解决的困难,并带来一些我们现在无法想象的奇妙场景。
不过这一趋势或许会受到Web App的冲击。由于Web App大多基于HTML 5生成,搜索Web App所用到的技术与网页搜索相通;而由于其开放性,语义搜索、应用内搜索的难度也会有所降低。
在王臣汉看来,尽管目前Web App的性能还难以达到Native App的水平,但几年之后Web App很有可能成为主流,那么在应用搜索、应用内搜索方面的研发投入可能将付之东流,这会使得应用商店们更加谨慎。
事实上,百度近期的举动也显示出其正在将重心转向Web App。
在2012年Q4至2013年Q2三个季度的《百度移动互联网发展趋势报告》里,百度均提及了用户需求正在从Native App向移动搜索迁移的趋势,以及Web App和轻应用的广阔前景。百度移动云事业部首席布道师张辉也曾表示百度将兼顾Web App和Native App,并强调搜索是Web App的主要分发渠道。
在减少对于应用内搜索推广力度的同时,百度也在通过不同渠道大力推广轻应用的概念。在百度的定义里,轻应用具备Web App无需下载、即搜即用、易于检索与智能分发等特性,同时还具备接近甚至超越Web App的用户体验。
作为轻应用的第一批开发者,张碧仿表示Web App很好地解决了用户无法通过搜索景点名称找到景点通的问题,“用户在手机浏览器里打开百度搜索‘故宫’就可以有我的结果,自然流量还不错”。
他很看好Web App的前景,但也表示Web App较为适合景点通这样的启动频次较低的应用,“像大众点评、百度地图和高的地图的Web App都做得不错,但用户还是习惯使用Native App”。
与百度不同,其他的应用分发渠道商对于Web App的态度则相对谨慎。
罗川看好Web App解决应用内搜索的问题。他直言目前所谓的应用内搜索是个“伪命题”,因为它针对的都是内容和信息类的服务,“随着带宽和浏览器功能的增强,非常自然的可以转化为Web App,比使用特定的数据交换协议更简单,也更高效”。
不过他认为,未来即便未来Web App逐渐普及,包括大型手游在内的部分应用依旧很难迁移到Web端,“在网页游戏最火爆的时候,端游依然大行其道,它有着不可取代的优势”。因此目前应用汇仍将搜索工作的重心放在提升Native App的转化率上。
360也在360手机浏览器和360手机助手等渠道推出了轻应用专区,不过何捷表示,相比百度的高调推广,360的态度是“谨慎关注,看一下市场的反应”,因为“目前轻应用想完全达到(Native) App的水平还是有相当的难度”。
姚丛磊则将轻应用称为百度的一场赌局:“他们在赌将来用户使用手机的基本单元不是客户端应用,而是Web应用。”他认为这一变化在接下来几年还不会很快发生,因此基于Native App的应用搜索和应用内搜索依旧有投入的价值:“我们不会等,而是尽快把事情做起来。”