【双11背后的技术】内容+:打造不一样的双11

选自《不一样的技术创新——阿里巴巴2016双11背后的技术》,全书目录:

本文作者:建瓴,神照,随喜,志向,元超

1. 站上风口的内容经济

内容永远是最优质的流量入口。如果不是,那说明你没做对。

 今年是淘宝全面内容化、社区化的元年;今年的双11,也是一场具有丰富内容、精彩互动的购物狂欢。从必买清单、大咖直播,到KOL草地、人群市场,双11零点时分经历的淘宝网红经济爆发,都是今年独特而又亮丽的风景线。

用户越来越注重消费内容的质量,也逐渐愿意为非功利化的优质内容买单;相反,那些关联性的内容,必将越来越被用户排斥。在淘宝,内容化的口号虽然是近一两年才提出来,但处于风口的这头“猪”其实已经养了很多年了:清单、问答、直播等业务固然给我们带来了更加丰富的互动内容形态,然而商品、店铺详情页上的图片文字,何尝不也属于泛内容的范畴?我们今天说内容化,本质上是内容形态的进化,从过去单一、简陋、缺乏用户亲和力和参与感的内容,向着更丰富、更专业、用户更加喜闻乐见、转化效率更高的形态去进化。猪已肥,风正来。

 

兵马未动,粮草先行。我们从去年开始着手建设服务于淘系内容业务,从创作沉淀、到管理投放、到前端建站、到数据反馈的一整条闭环链路,在今年新推出的内容型导购产品、以及双11购物狂欢节的各大会场中,都获得了广泛的应用和良好的效果。这条链路包括:

  • 创作者平台:服务于达人、商家等的内容创作者,提供认证进驻、内容发布与管理、粉丝互动运营、参与营销任务、权益与成长、效果数据反馈、以及V任务等商业化体系搭建等功能;
  • 内容平台:服务于内容业务方,聚焦在核心内容数据链路、统一发布端、统一详情页、内容抓取、内容质量与组织 、筛选投放、分佣结算的基础能力的建设;
  • 导购平台:服务于淘宝行业和导购产品,对内容、商品进行再加工再组织,赋能各种导购场景的高效搭建。

接下来,我们具体介绍这条内容链路,以及在双11大促期间的应用案例。先从位于这条内容链路核心的内容平台开始说起。

 

2. 蜂巢内容平台简介

蜂巢(Beehive)内容平台诞生的背景,是以爱逛街、极有家、iFashion为代表的一批内容导购产品迅速崛起、获得越来越多用户的青睐。然而业务野蛮生长的同时,也带来了一系列的问题:

  • 内容业务的研发需求得不到快速满足,背后是多项目多系统的井状独立部署,每个业务都独立建设内容模型和能力,不同业务之间无法重用,导致开发和维护成本很高;
  • 内容与创作者沉淀不足,缺乏规模化,主要原因是缺乏平台化的创作者进驻、管理以及内容创作工具,不同业务场景的内容也没有进行标准化和结构化沉淀;
  • 内容的触达场景和影响力有限, 缺少分类、打标、检索、推荐等丰富的内容浮现机制,不同业务场景之间的内容无法互通、共享;
  • 内容的商业价值有待更充分地发掘,基于内容产生互动等场景下的丰富的多方分佣机制有待探索。

 

与从某个成熟业务沉淀出来并推而广之的路线不同,蜂巢内容平台与生俱来地就肩负着承载淘系多个不同的内容业务的使命。从着手平台架构设计的第一天开始,研发团队就在对来自不同业务的内容数据进行标准化建模,对内容能力抽象共性的需求,目标就是为了提供通用的服务能力、实现“搭积木式”的快速迭代。

那么,为什么叫“蜂巢”?有如下寓意:

经过一年多时间的建设, 经历了从1.0到2.0的版本升级,目前蜂巢已经成长为一个快速构建内容业务的核心技术平台,提供稳定高效的数据服务,灵活可扩展的应用逻辑及商业化能力,满足业务在内容生产与审核、存储与组织、分发与流通、互动营销等方面需求。已经沉淀了数亿内容,支持包括淘宝头条、必买清单、淘宝直播、微淘、和垂直行业等近百个业务、1000多个线上场景,每天为数千万消费者提供丰富、实用的消费资讯。

 

2.1 赋能内容创作者

双11大促期间,绝大部分内容是由专业的内容创作者生产并提供的,我们称之为达人。达人招募、内容生产、和效果反馈,都在达人平台(daren.taobao.com)上进行。

这次大促有很多会场,每个会场背后是不同的业务方。大促准备过程中,每个业务方有各自的诉求,变化也很频繁。面对这种情况,我们把内容体系抽象成了若干可定制化的模块,通过配置和SPI,让运营小二在后台自主完成业务接入和变更,极大地提高了工作效率。

在达人平台,每个业务方表现为一个渠道,渠道内可定制招募流程、达人准入门槛、审核权限、层级和权益,这些都由业务方负责总体运营的小二操作。一个业务方在不同场合对内容要求也可能有差异,这就需要在渠道内配置不同的频道。以“必买清单”为例:日常的“攻略”、“双11预售会场”和“双11清单会场”就是三个不同的频道,有各自不同的门槛、生效时间、以及审核流程。另外,同样是清单,但大促会场和日常活动在标题长度,宝贝数限制上都有不同,所以达人平台也在频道层级提供了定制编辑器的能力。同一渠道下所属频道的配置互相独立,相关运营小二互不干扰。

 

作为内容编辑器和发布数据链路的提供方,Beehive平台提供了统一、灵活的内容发布相关组件,以及供业务定制的扩展点机制。当一个业务方需要内容发布相关能力时,只需要定制下相对应发布表单,即可快速实现内容发布需求,而不需要业务方过多地关注底层的内容模型细节。以上述必买清单为例,运营小二可以基于发布组件去配置三个不同的频道,达人也可以把所创作的内容灵活地投稿到这些频道中。

依靠平台化的内容链路和强大的配置能力,在今年双11过程中,团队只用很少的开发资源,就支持了清单、人群、爱逛街、有好货、KOL、和淘宝头条等首屏会场,以及若干行业会场的内容生产,取得了真正赋能创作者、支持业务快速搭建的良好效果。

 

2.2 优质内容的个性化分发

在已经沉淀的近6亿内容中,如何去芜存菁、发掘和浮现优质内容,并通过定制化或者个性化的规则机制进行内容的跨业务流通、多场景实时分发,是我们建设内容链路的一个核心能力。

 

下面就以今年双11手机淘宝“我的资讯”模块为例,具体介绍内容质量和分发体系,是如何构建并帮助业务选择并获取到优质的内容数据、最终完成个性化输出。“我的资讯”模块如图:

作为双11会场透出的内容,要求是非常高的:一方面要求内容里的商品有一定比例是参加双11大促的商品,另一方面也希望内容的图片精美、文字优雅。业务方都希望内容有较好的使用效果,因此我们将内容的质量体系分成了两个方面:

  • 内容健康分:也就是内容自身的质量。内容从组成元素上看,有三个基本的部分:文本,图片和商品,我们基于这三个维度,设计了17个健康分的指标,以细化内容质量;
  • 内容效果分:主要刻画内容被使用的效果,从停留时长、商品点击率、曝光机会等25个维度去刻画;对于新发表的内容,为了解决冷启动的问题,我们也通过机器学习的方法,完成了效果预测分,作为内容效果分的一部分,供创作者和业务方参考。

 

在双11我的资讯会场中,产品的要求是:资讯下的商品有半数及以上的双11商品,以及对KOL达人的内容进行加权。按这个条件初步筛选出来的内容非常多,有数千万条,然而其中大部分作为“资讯”都是不合适的,比如相当一部分的文本描述较短,图片可能带有牛皮癣,另外还有时效性等问题。后来用上了内容健康分中图片、文本等一些维度进行二次过滤,质量提高了很多。

 

有了质量体系以后,内容的流通和分发就更灵活了,运营可以使用内容分发系统 - 点将台,功能架构图如下:

从上图可以看出,一方面,点将台集合了各种内容来源,通过标准化和内容多维度的打标,结合内容质量体系,提供数百个筛选内容的维度,帮助业务方很灵活地选出所需要的优质内容;另一方面,也提供了在线、离线、个性化投放、消息队列等强大的输出能力。正是因为有了这样的能力,今年双11“我的资讯”会场,即是通过点将台完成内容的筛选、分发、个性化投放,最终呈现给用户。

 

3. 内容消费促进导购升级

“万能”的淘宝,在面对海量消费者强烈的多样性诉求下,势必需要在各个垂直行业以不同的心智去连接消费者;而淘宝导购产品作为建立用户粘性与认知的桥头堡,必然也需要在做好“多样”的同时兼顾“效率”,这就对整个平台提出了很高的要求 。所以2016年,淘宝在多年导购业务经验积累下,整体抽象出内容/建站/流量/效果等核心的导购产品要素,提出了面向整个导购业务域的平台化升级战略,逐步将传统烟囱型的导购产品升级转型到平台化架构中,以求在提升产品迭代效率与整体导购域稳定性的同时,结合内容化、社区化的元素,在各行业中给用户呈现更酷炫的导购体验。

 

下面以几个典型的导购产品为例,“有好货”与“必买清单”是大家比较熟知的淘系导购产品。在今年双11中,首先它们都依托统一的平台化系统支撑,高效对接到统一的内容生产/分发链路,包括前述的蜂巢内容平台和达人平台;其次,结合淘宝沉淀的一体化营销会场建站能力,让前端团队能够以模块化方式快速完成页面的搭建,让运营团队可以直接通过横向运营工具,快速即时的完成对于导购内容(帖子、商品、店铺等)的筛选、聚合、与投放。

从系统角度,我们站在整个导购业务域的角度做出一套横向整体的稳定性方案,来面对双11零点这样的瞬时脉冲流量,相比于传统的垂直烟囱系统的设计方式,这无疑给容量规划、稳定性预案、统一兜底降级策略的实施,带来了革命性的提升。同时,我们还针对导购入口的个性化所见即所得运营、A/B test数据化运营支撑、无线端native化渲染进行单点突破,基于整个导购业务域产品诉求的抽象造出“轮子”,装上“汽车”,让所有不同体量、不同用户群、不同定位的导购产品同时受益,这一切对于研发效率以及稳定性保障带来的提升,尤其在今年大促中得到了体现。

 

正是在这样一套贯穿前后的平台化方案支撑下,今年整个淘宝导购产品矩阵成功地将日常状态下的用户心智与粘性,带到了双11当天,让用户简单清晰地完成浏览路径的选择,从而带来更好的点击/成交转化。

 

用户从导购业务进入,并最终到达内容曝光的阵地:内容详情页。不同业务方对内容详情页一定存在个性化定制的需求,然而经过我们的仔细分析后发现存在比较多的共性。在Beehive平台会对详情页的各个组件统一建模,提供了统一的详情页。详情页提供了一套内容相关的组件,业务可以快速基于已有的组件定制一个业务自身相关的详情,而不需要过多的开发代码;当一个业务存在组件定制需求时,业务只需要根据自身业务定制自己的组件或者服务,并注册到详情配置中心,然后由详情服务统一进行渲染。

 

在实现上,同一个组件在不同业务中很有可能信息的来源是不同的,比如创作者组件中,有的创作者信息来自达人,有的来自商家。内容平台通过对组件的建模,实现内容详情页在展现形态上的统一,同时也支持了数据的个性化要求。最后,通过GraphQL聚合能力来进行数据组装。业务方可以通过参数来决定哪些组件需要在详情页中出现。

面向未来,在我们逐步完成内容导购的数据闭环之后,统一详情页可以帮助我们积累大量的内容、商品消费数据反馈。在提升运营效率的同时,更有价值的是将传统人工的运营经验数字化,畅想真正的“智能化导购运营”来到的那一天,基于消费者、商家、内容生产者长年积累的海量结构化信息,再加上历史上运营经验的积累,将让机器站在整个平台的肩膀上,根据运营核心策略,自动构建出无数个垂直行业的“小有好货”、“小必买清单”、“小人群市场”,这将是我们接下来的目标。

 

4. 内容商业化  

在一个健康的内容生态系统中,创作者生产内容,业务方选择并使用内容,消费者消费内容,而平台方则需要提供合理的商业化机制,来促进创作者有可持续的动力,源源不断地产生优质内容,促进内容生态体系的整体繁荣。在内容链路上,商业化主要围绕达人身份体系及导购内容进行建设,目前提供的商业化能力包括CPS分佣和V任务。

 

4.1 CPS分佣

CPS分佣依靠阿里妈妈淘客联盟,给内容中包含的商品提供淘客CPS链接生成服务,和淘客CPS点击行为注册的服务。通过这两个服务,买家通过点击内容中展示的商品下单并完成交易后,内容的创作者、业务方、以及阿里妈妈都可以得到一定比例的佣金,这就是最常见的三方分佣机制。

 

CPS分佣能力由蜂巢Beehive内容平台提供。不但支持不同的业务方灵活地配置分佣比例,还创新性地引入了内容质量体系,作为动态佣金(奖金)的评判标准,这样更能激发创作者创作更多优质的内容

 

4.2 V任务

淘宝在内容展现的过程中大量引入了个性化,从而带来了较大的不确定性:如果仅依赖CPS分佣的变现方式,达人不知道自己生产的内容何时会被展现并获得收入,商家也不知道怎样定向找到与宝贝特点吻合的达人去做推广。V任务作为新一代内容变现平台,很好地解决了供需双方之间的不确定性问题。

在V任务中,一个"任务"就是达人和商家间达成的合约,约定达人要生产包含指定宝贝的内容并投放出去。内容的形式很丰富,包括帖子、清单、视频、直播等;订立合约的形式也很灵活,可以由商家发起达人响应,也可以由达人发起商家响应,甚至可以点对点邀约。这次双11大促中采用比较多的是后两种方式,这主要是因为大促期间,达人在有限的时间段内对自己生产的内容有更大的议价权。

 

创建完协议后,V任务会利用交易提供的履约能力,保证这份协议的履行。V任务还打通了所有数据链路,以保证签约、履行、反馈、和付款的完整流程,都能在线上自动完成。

 

达人执行每次任务的效果都会反馈到V任务上的达人指数中,通过大数据的积累,商家可以在此找到最适合推广自己宝贝的达人。而对达人来说,只要完成任务就能收到钱,避免了辛苦生产的内容因为没有被个性化系统选中展示从而没有收入的窘境,增加了确定性。正因为这两点,V任务在达人和商家间都广受欢迎。

 

通过CPS分佣和V任务等商业化机制,保障并极大地激发了创作者的热情,确保了内容生态体系源源不断有新的优质内容流入,商家的营销任务能得到更有效的执行,消费者也能获取更好的内容体验 。

 

5. 未来展望

金秋十月的云栖大会上,马老师第一次提出了“五新”的概念:新零售、新制造、新金融、新技术、新能源,在不久的将来将深刻影响全世界人民生活的方方面面。新零售有很多不同的表现形式,个性鲜明、富内容化、强调IP和互动的网红经济,就是新零售业态的一种。而新能源讲的就是越用越有价值的数据,通过历史数据的积累和价值发掘,在未来能够不断地拓展新的业务边界。

 

在过去的一年多时间里,我们很荣幸能作为平台化、系统性地去储备和使用内容数据这种新能源的第一代矿工,建设了从生产到沉淀再到消费的、端到端的完整内容链路,并成功经历了这次双11的战火洗礼,与各个合作业务一道用内容化打造了一个不一样的双11。

正如本文开头所说,高质量的内容代表着最优质的流量和关注度;与未来各种新的电商业务形态的结合中,内容将是催化剂。我们期望与各个合作团队一起,让内容大数据这种新能源,释放更大的能量。

时间: 2017-01-12

【双11背后的技术】内容+:打造不一样的双11的相关文章

【双11背后的技术】万亿交易量级下的秒级监控

选自<不一样的技术创新--阿里巴巴2016双11背后的技术>,全书目录:https://yq.aliyun.com/articles/68637 本文作者:郁松.章邯.程超.癫行 前言 2016财年,阿里巴巴电商交易额(GMV)突破3万亿元人民币,成为全球最大网上经济体,这背后是基础架构事业群构筑的坚强基石. 在2016年双11全球购物狂欢节中,天猫全天交易额1207亿元,前30分钟每秒交易峰值17.5万笔,每秒支付峰值12万笔.承载这些秒级数据背后的监控产品是如何实现的呢?接下来本文将从阿里

不一样的技术创新——阿里巴巴2016双11背后的技术

每年的"双11"是阿里技术的大阅兵和创新能力的集中检阅.2016年的"双11"背后,更是蕴藏了异常丰富的技术实践与突破. 历经1个月的编写,最终27篇精华技术文章入册<不一样的技术创新-阿里巴巴2016双11背后的技术>(以下简称<不一样的技术创新>)一书.这27篇"24K纯度"的技术干货,是阿里"双11"八年来技术演进结果的最新展示,凝聚了阿里工程师的智慧和创造力. 所有参与<不一样的技术创新&

【技术精华汇总】不一样的技术创新——阿里巴巴2016双11背后的技术

  每年的"双11"是阿里技术的大阅兵和创新能力的集中检阅.2016年的"双11"背后,更是蕴藏了异常丰富的技术实践与突破.  历经1个月的编写,最终27篇精华技术文章入册<不一样的技术创新-阿里巴巴2016双11背后的技术>(以下简称<不一样的技术创新>)一书.这27篇"24K纯度"的技术干货,是阿里"双11"八年来技术演进结果的最新展示,凝聚了阿里工程师的智慧和创造力.  所有参与<不一样的技

【双11背后的技术】基于深度强化学习与自适应在线学习的搜索和推荐算法研究

选自<不一样的技术创新--阿里巴巴2016双11背后的技术>,全书目录:https://yq.aliyun.com/articles/68637 本文作者:灵培.霹雳.哲予 1. 搜索算法研究与实践 1.1 背景 淘宝的搜索引擎涉及对上亿商品的毫秒级处理响应,而淘宝的用户不仅数量巨大,其行为特点以及对商品的偏好也具有丰富性和多样性.因此,要让搜索引擎对不同特点的用户作出针对性的排序,并以此带动搜索引导的成交提升,是一个极具挑战性的问题.传统的Learning to Rank(LTR)方法主要是

【双11背后的技术】万亿级数据洪峰下的分布式消息引擎

选自<不一样的技术创新--阿里巴巴2016双11背后的技术>,全书目录:https://yq.aliyun.com/articles/68637 本文作者:冯嘉.誓嘉.尘央.牟羽  前言 通过简单回顾阿里中间件(Aliware)消息引擎的发展史,本文开篇于双11消息引擎面临的低延迟挑战,通过经典的应用场景阐述可能会面临的问题 - 响应慢,雪崩,用户体验差,继而交易下跌.为了应对这些不可控的洪峰数据,中间件团队通过大量研究和实践,推出了低延迟高可用解决方案,在分布式存储领域具有一定的普适性.在此

【双11背后的技术】双11晚会背后的技术

选自<不一样的技术创新--阿里巴巴2016双11背后的技术>,全书目录:https://yq.aliyun.com/articles/68637 本文作者:邵雍   回顾2015年在鸟巢举行的第一届双11晚会,我们可以称之为"全民互动"的晚会.因为不止是现场的几千位观众,全国所有在电视机面前的观众朋友,都可以拿起手机,打开天猫客户端或淘宝客户端,参与到晚会现场的各个明星互动游戏中来,进行红黑押宝,获胜的人,还能抢到一元商品. 而刚刚过去的,在深圳大运中心的2016第二届双1

【双11背后的技术】Weex 双11会场大规模应用的秒开实战和稳定性保障

选自<不一样的技术创新--阿里巴巴2016双11背后的技术>,全书目录:https://yq.aliyun.com/articles/68637 本文作者:鬼道  前言 Native 开发的诸多亮点中,流畅体验和系统调用是最多被提及的.流畅体验体现在页面滚动/动画的流畅性,背后是更好的内存管理和更接近原生的性能:同时又是 Web 的痛点:资源首次下载.长页面内存溢出和滚动性能.动画性能.传统 web 性能(如JS执行效率).Native 有丰富的系统调用能力,而 Web 痛点在于:W3C 标准

【双11背后的技术】双11数据大屏背后的实时计算处理

选自<不一样的技术创新--阿里巴巴2016双11背后的技术>,全书目录:https://yq.aliyun.com/articles/68637 本文作者:藏六  黄晓锋  同杰 1. 双11数据大屏的实时计算架构  1.1 背景 2016年的双11我们的实时数据直播大屏有三大战场,它们分别是面向媒体的数据大屏.面向商家端的数据大屏.面向阿里巴巴内部业务运营的数据大屏. 每一个直播大屏对数据都有着非常高的精度要求,特别是面向媒体的数据大屏,同时面临着高吞吐.低延时.零差错.高稳定等多方面的挑战

【直播回顾&amp;资料下载】Work Like Alibaba第三期:揭秘双11背后的技术支撑

阿里巴巴逐年增加的双11营业额和不断创新的业务背后隐藏着怎样的秘密? 阿里走过的这18年,它用怎样的工作方法.工作形式打造出高效.创新的企业帝国? Work Like Alibaba社区活动带你全方位了解阿里的开发.产品.运营是怎样工作,又有哪些创新技术可以帮助更多企业赋能自己的业务创新和企业发展,这些前言技术理念及实践经验给哪些企业带来了怎样的技术成果.Work Like Alibaba第三期和你一起揭秘! 第三期Work Like Alibaba社区活动是线上直播活动持续进行,连续4场,10