6月18日,WAW团队有幸受邀前往携程在临空Soho的新大楼观摩了携程技术创新产品。
从我们对整个大数据行业的观察来看,传统的网站分析已经远远不能满足移动互联网企业的需求。从总的方面看,携程的策略是通过对用户在行前探索、出行规划、价格比较、预订、行程中、回程到结束的整个在线旅行进行了非常个性化的产品创新。
我们注意到每一个环节的产品设计和技术布局都充分利用了携程自有的数据和外部有价值的数据。
行前探索
携程今年1季度的移动端收入已经占到全部的70%,这是移动站和移动APP合力的原因。无论是在移动端还是PC端,用户在访问任何一家公司的网站或者打开App之前,必定会经过外部的渠道(Online或者Offline),这些在线探索的渠道来源往往包含了很多有用的数据,比如用户通过搜索引擎查询的关键字,或者用户通过特定的PPC广告到达移动站,乃至用户通过合作APP的推广页面打开了APP等。
在用户到达网站或者APP后,会产生大量的用户行为数据。以酒店为例,通过页面数据的分析,一般我们可以发现有些用户会大量阅读评论,有些会注意浏览照片,有些会对酒店位置比较在意,这些数据直接用于实现个性化推荐功能。
携程的个性化推荐功能可以服务于携程的各个业务部门。携程根据获取到的用户信息,分析出用户兴趣,推荐适合的产品。
信息来源于两部分:
1)用户行为数据,比如浏览历史,订单历史
2)用户注册信息,性别,年龄等
不同设备上的用户行为数据可以通过用户在携程的UserId进行关联(必须注册过,并且曾经登录过),这与我们的判断一致。
如果无法获取到用户行为数据以及注册信息(比如新访客),个性化推荐会推荐一个默认版本:通常是最热门的产品。
携程对于用户偏好分析:
携程用户意图分别按照城市主题,目的地偏好,产品偏好,酒店偏好及度假偏好进行分类,根据算法,按照特定的排序规则推荐分属各类别的相应产品:
用户行为的发生时间:
携程会把用户行为的发生时间分段(每十分钟一段),每段时间内的行为数据赋予不同的权重,最近10分钟内发生的行为权重最高,依次呈阶梯衰减。也就是说,用户看到的产品推荐,跟他近十分钟内在携程上的行为最相关。
这些外部和内部的数据都是用户的行前探索数据,通过技术手段采集并利用集群进行存储后,可以输出给CRM系统做用户的标签。
要注意的是,如果要能做到对最近十分钟的用户行为数据实现产品推荐,所有的外部数据和内部数据的采集必须实时,对携程这样体量的公司来说,每天的数据存储量早就达到3TB以上,所以必须应用到数据集群、Spark和Hadoop等大数据存储方面的前沿技术。
目前对于应用等级高的数据,携程已经采用T+0的策略,对于应用等级比较低的(比如数据报告),也实现了T+1,这对大部分企业还在使用T+7甚至T+14的业务数据用于企业重要决策敲响了警钟。
出行规划、点评和比价
携程目前的全站搜索(网站+App)已经能够实现绝大部分产品和主要纬度的站内搜索,比如按照商圈、品牌、酒店名等提供酒店搜索,通过景点名称和主题进行门票搜素等。
同一个用户,当他在PC上使用一个网站进行行程规划时,往往是提前很多天进行行程规划,并做价格比较,也会花很多时间看点评。
酒店点评优化:
在酒店点评优化上,携程通过一系列算法,判断每条酒店点评的质量,并把高质量的酒店点评放在了最前面,经过优化过的酒店点评的页面(或者酒店详情页)的用户参与度的指标有明显提升。
另外优质原创的点评内容会引来更多的用户点评,即UGC内容,这对于PC端和Mobile端的SEO大有好处,可以引来很多长尾的自然搜索流量。
同一个用户,当他在PC上使用一个网站进行行程规划时,往往是提前很多天进行行程规划,并做价格比较,也会花很多时间看点评,但不会马上预订。这些搜索行为和点评阅读行为的背后反映的就是真实用户的出行规划意图。
但是在Mobile端,很多预订是即时发生的,用户没有时间和耐心做大量的阅读和判断,携程聪明的地方就是应用同一用户的行为数据在Mobile端做精准推荐,这样可以有效提升转化率。
再来说说全网比价:
携程酒店比价页面除携程之外的酒店的数据有两种来源:
1)携程自己的爬虫到别的网站上去抓
2)携程的partners自己提交数据
其中通过第一种抓到的价格数据肯定会有时间差,相对价格不一定那么准确;通过第二种方式也会有时间差,因为不可能用户到达携程的酒店列表页的时候,携程就去请求合作伙伴的数据接口。合作伙伴自己推送数据或携程请求数据都是按照一定的频率进行,所以房价和房态也会有一定的时间差,但是用户并不会在乎。
携程获取到价格数据之后,会进行两层匹配:
1)酒店名称
2)酒店房型
据旁边解说的工作人员说,这个功能很长时间才完成。
我们觉得,携程越来越像Meta Search,另外,携程抓取价格应该早就开始了,监控竞争对手的酒店房价,确保携程自己的价格优势,一旦发现竞争对手的价格更低,携程就可以找酒店去谈判了。
很容易理解,这些比价行为数据只要被捕捉了,携程可以知道特定用户的价格敏感区域、酒店品牌喜好等,帮助进一步细化用户的画像。
同时熟悉旅游行业的朋友可以联想到携程控股的众荟在利用携程独家开放数据方面的独特优势,如果众荟可以有偿使用携程的全站搜索数据和比价数据,输出为提供单体酒店或者酒店集团的数据产品,用于竞争对手分析和收益管理,这些数据的参考意义还是很大的。
评论
未登录
游客
2015-06-23
有幸参加过waw在北京必帮咖啡的活动,讲师专业,听众积极,都是积极向上年轻好奇的面孔,程序猿占比很高,希望有更多的程序猿具备接地气的商业头脑,成为技术驱动变革大时代的领路人。
游客
2015-06-23
这些大部分在去哪儿都实现过很久了,我们还有一些更新的技巧没法剧透呀。