当前位置: 网站首页 > 关于博雅
关于博雅
亚马逊购物节首日系统崩溃:手动添加服务器应对流量峰值
时间:2019-11-18  来源:www.oaled.com

7月20日消息?一年一度的亚马逊日高峰日购物节受到影响。在Prime Day开放的15分钟内,由于流量过大,亚马逊还没有准备好让很多用户加载页面。最近,亚马逊内部文件显示,由于亚马逊内部系统无法自动调整服务器资源,技术人员不得不手动添加服务器资源以应对瞬时峰值流量,甚至切断国际流量以缓解服务器压力。陷入混乱。

7月16日美国当地时间12点,2018年亚马逊成员Prime Day购物节正式启动。当许多消费者准备在亚马逊Prime日购买折扣产品时,一些消费者无法开门购物。页面技术故障。

亚马逊的Prime Day是亚马逊Prime会员的购物节。它通常在每年的7月中旬开始。今年的Prime日从7月16日起持续36小时。在此期间,用户可以在亚马逊平台上。我买了很多折扣很多的商品。

但是当许多用户试图在他们的计算机或手机上打开亚马逊的页面时,他们看到了以下错误页面。

作为回应,亚马逊在其官方Twitter帐户中发布了一条推文,称“有些用户购物有问题,亚马逊正在解决这些问题,很多用户都可以成功购物,美国Prime会员日的第一个小时用户订单总数有比去年同期还多,而且还有成千上万的折扣商品。“

当用户无法大规模打开网页时,亚马逊的内部技术人员陷入紧急响应和混乱状态。亚马逊技术人员开始发现整个站点由于过多的瞬时流量而出现故障。作为回应,亚马逊紧急启动了一个初步计划,将主页切换到更简单的信息演示页面版本,以减少带宽压力。

截至下午12:15,亚马逊决定暂时停止所有国际流量,以减轻系统压力。到12点37分,亚马逊打开了所有默认页面,占总流量的25%。在12点40分,亚马逊对其内部系统Sable进行了优化,但仅仅两分钟后,它重新考虑阻止它。“5%的未知流量流向美国。

但即使采取了这些措施,亚马逊的“错误率”仍然在下午1:05之前恶化,但五分钟后,情况明显改善。亚马逊的部分系统发现订单率“远高于预期”。

一位知情人士表示,整个办公室处于“混乱状态”,有一次,超过300人甚至连接到紧急电话会议。

联邦通信委员会前首席技术官Henning Schulzrinne表示,亚马逊显然陷入了准备不足的问题,由于用户行为会更糟,因为如果用户无法打开界面,他会进一步刷新并重新加载它,导致更大的服务器压力。

“所以通常更好,显然是在短时间内关闭服务的不良选择。” Schulzrinne说。

实际上,亚马逊没有采用这种方法,而是通过手动添加服务器逐渐提高了消化流量的能力。一位知情人士在文件中写道,他增加了“50到150个虚拟服务器”。

一些专业人士认为,问题的根本原因可能是亚马逊的内部系统会自动调整服务器的大小。此功能通常会自动识别流量波动,以配置适当的服务器资源。当亚马逊回应问题时,它迈出了摆脱国际流量的第一步,而不是立即增加服务器数量,同时手动添加服务器而不是自动添加服务器,这证实了服务器资源自动调整失败。

由于暂时缺乏服务器资源,亚马逊的内部系统Sable承受着更大的压力。根据内部文件,去年的Prime日,该系统被亚马逊的400个内部团队使用,能够处理5.623万亿个服务请求,每秒处理6350万个请求。

今年的Prime会议首先由亚马逊全球市场和首席副总裁Neil Lindsay领导。今年年初,Prime Day前副总裁Greg Greeley离开亚马逊加入Airbnb,Neil Linday接管了他负责的Prime团队。

根据市场研究机构的初步预测,亚马逊今年的Prime会员总销售额为42亿美元,比去年增长33%。亚马逊早些时候公布的初步数据显示,Prime Day在前24小时内发送了超过1亿件物品,销售额超过10亿美元。