【阿里在线技术峰会】郭东白:基于大数据的全球电商系统性能优化

  • 时间:
  • 浏览:3
  • 来源:神彩大发11选5_彩神大发11选5官方

直播视频:点此进入

平台是独立于业务领域的。针对不同的业务领域,有不同的优化方案,显示在图中左下累积。平台的功能是:把当前的性能变得可视化;实时度量目前的性能水平;对全链路做有一有六个 性能的监控;所有的领域都可不并能并能 接到这个平台上;做有一有六个 全量的度量。平台虽然过多过多将性能优化的回报变成有一有六个 可度量的、非常容易看后的结果。在整个试验的过程中,数据是不断积累的,数据会带来准确的度量结果,度量结果则决定否是将优化在全栈进行推广。

本文根据郭东白在首届阿里巴巴在线技术峰会上的分享收集而成。他首先介绍了AliExpress电商系统的理论基础,通过页面间再次出现率的计算引出了全栈优化的思路。假若,他介绍了AliExpress平台的设计思路和性能优化过程。紧接着,他分享了AliExpress使用过的几块有效的优化策略:动态加速、静态化+ESI、元素合并请求、CDN调度优化等。最后,他用实例展示了性能优化带来的结果,并对收集的过程提出了几点思考和总结。

AliExpress在全球的各个国家全部就有相当多的用户,在巴西是第二大的电商网站,巴西用户可不并能并能 请求美国的边缘节点,也可不并能并能 请求巴西的边缘节点。经过测试,巴西用户请求巴西的边缘节点的相对耗须要少这个,可不并能并能 认为是有一有六个 单位,请求美国节点耗时六个单位,假若请求地理位置离巴西近的阿根廷节点须要耗时7个节点。过多过多得出结论:可不并能 单纯从地理位置来估计请求节点的耗时,以此为基础可不并能并能 优化CDN调度。

有一有六个 页面中会有过多过多的子元素,将会单独去请求,则每个请求全部就有回源的调用,没有每个请求就有占用过多过多时间(包括TCP建联时间等)。元素请求合并过多过多指把所有的请求合并成有一有六个 ,统一提供到服务方,假若服务端再将那先 请求收集,假若再统一合并再返回。

以下为收集内容。

首先,应该有过多过多业务模块来收集用户的行为数据(请求时间、建联时间等),假若数据经过收集系统进行正确处理。正确处理完的数据有并否是分析土办法:离线分析、实深冬析,区别在于离线的正确处理量比较大这个。分析的结果就有地处有一有六个 业务数据库中,最终会送到cache layer中做追溯和同比。后端会支持过多过多不同的应用场景,比如报警、监控、报表。

虽然,世界上在DNS层、网络层、CDN层、业内沉淀有过多过多优化方案。那先 优化方案那先 最有效呢?下面列举几块使用过的有效的优化方案:

在此基础上,亲戚亲戚亲们可不并能并能 将其推广到所有页面。有一有六个 大的网站将会有数百个页面,比如上图中的两条链路:搜索——详情——订单;商铺——商铺详情——订单。在这个关系下,将会亲戚亲戚亲们把每条链路的再次出现率算出来,虽然亲戚亲戚亲们就得到了每条链路的理论最大流量,另一有六个 亲戚亲戚亲们就知道了最终页面的最大流量。这虽然过多过多有一有六个 全栈性能损耗的过程,亲戚亲戚亲们可不并能并能 知道每个细小的过程对全局的贡献。这对于优化方案的制定非常重要。在做优化方案的以前,亲戚亲戚亲们可不并能并能 取舍有一有六个 页面做尝试,准确度量有一有六个 页面的回报,另一有六个 就可不并能并能 明确知道并否是优化方案对整个系统的贡献,即本次优化对电商系统的订单回报量。

这张图代表流量分布和再次出现率的关系。有一有六个 用户放弃使用有一有六个 网站将会APP的行为叫做再次出现。上图中,横轴代表延迟区间,纵轴代表流量分布。绿色的曲线代表顾客来网站将会APP的流量分布,可不并能并能 发现大累积流量分布在几百到一千毫秒,随着时间延迟的增加,再次出现率变高。整个系统计算时,使用转化率公式:转化率=1-再次出现率。在地处性能故障的以前,比如有少累积机器再次出现延迟大大增加的情况报告,亲戚亲戚亲们会发现高速性能的流量会变少,有很长延时的流量会增加,跳去率也变快地爬升上去。这个过程表明,将会延迟越大,没有延迟再次出现率会变得没有高,即转化率变得没有低。亲戚亲戚亲们可不并能并能 把虚线看作是优化前,实现看作是优化后,其中的累积过多过多优化得到的新的转化率。

优化前,用户的动态请求全部就有源站,请求链路是:用户——运营商——源站。全世界全部就有去源站拿数据,另一有六个 的请求链路会非常长,过程相当耗时。

PDF下载:点此进入

上述理论的分析,平台的搭建,业务的优化,带来了:整套系统的分析能力提升;过去的优化直接为整个网站带来5.07%的订单;性能损耗明显下降;购买力增强。

优化后,尽量把动态数据推到边缘节点,那先 边缘节点不须要去源站进行请求,只需直接在边缘节点做请求。另外有一有六个 优化:请求既可不并能并能 是同步的,也可不并能并能 是异步的,可不并能并能 同去并行请求多个页面内的元素。整体的动态回源的过程是对内容的动态加速。另外有一有六个 动态加速的做法是,将会须要回源的话,把这个回源网络的最优化路径交给CDN来决定,CDN会帮助找到目前一条最优的链路来回源。动态加速虽然是一系列的优化方案,比如包括内容压缩等。整个过程中全部就有不少的技术挑战:电商须要知道用户的真实IP;源站正确处理攻击要做请求拦截等等。

接下来,亲戚亲戚亲们进行从A页面到B页面的理论再次出现率的计算。如上图所示,A是有一有六个 页面,0、1、2、3是它的前序页面,end代表再次出现页面。亲戚亲戚亲们发现,出口的再次出现率=经过补偿后的所有再次出现率-自然再次出现率。其中,自然再次出现率是指当时人将会对商品内容不满意、评价不满意而产生的自然再次出现。

亲戚亲戚亲们做更深一步的讨论。上图中,红色代表转化率,蓝绿色代表性能区间的分布。假设亲戚亲戚亲们把性能从a秒压缩到3秒时,转化率的回报是图中绿色的累积。那先 回报是缘何得到的?随着延迟越大,转化率越低,将会回报是单调减的函数,过多过多压缩以前得到的回报过多过多图中绿色的累积。将会亲戚亲戚亲们知道压缩的时间,亲戚亲戚亲们就可不并能并能 预测出单个页面上得到的回报,这个回报称为Performance Loss。

用户把内容插进边缘节点上,到了机房内虽然也是做有一有六个 缓存:将会是动态内容则直接回源到数据库,将会是静态的不命中的内容则通过业务逻辑回源到数据库。请求链路一般是“读链路”,“写链路”会变更db,db被变更消息的消费者消费以前通过业务逻辑更新存入缓存,是缓存内的信息一直最新的。另一有六个 的过程合适用户将会能直接hit到边缘节点就返回(大多数最优的情况报告),全部就有最优的情况报告会hit到缓存层再返回。

猜你喜欢

我父亲和继母离婚了,我户口在继母名下,我要领结婚证和迁户口,继母不给户口本,怎么办

收起更多回答(1)扫描二维码下载追答你对這個回答的评价是?追答本回答由提问者推荐你多大女孩嘛展开详细追问有点硬推荐简单,去派出所补办就还我不要 了使用百度知道APP,立即

2020-01-29

我小时候我爸爸和我妈离婚了,我爸又找了个后妈,我现在该结婚了我爸

收起更多回答(1)有时候有你在亲爸爸妈妈的财产,你完整版都是继续权。展开完整版为你推荐:并能 你父亲现在就签协议。对于你而言。还有大伙完后 的房子有你在爸妈一并的,还有你在

2020-01-29

我15岁。爸爸和妈妈在我3岁的时候离婚了,又认识现在这个父亲,又生了一个妹妹,从那以后我经常受到排

你对你是什么回答的评价是?你对你是什么回答的评价是? 我来答你对你是什么回答的评价是?可选中另有1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个现象报告

2020-01-29

云大使官方交流群,欢迎加入~

云大使是阿里云生态伙伴计划,致力于与推广者实现普惠科技,以社会化营销来驱动数字中国。加入云大使推广后将获得现金奖励,并得到阿里云多项权益及官方钉钉交流群等赋能支持。依据一.点击

2020-01-29

从小父母管的比较严,交友方面都有所约束,要出门总是要问我去哪里跟谁一起,有一次跟一个异性朋友出去,

 我来答扫描二维码下载一阵一阵推荐展开完整版使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。下载百度知道APP,抢鲜体验展开完整版你对这些 回答的评

2020-01-29