
电商大促前
物流IT要做哪些准备??
神州控股
焦海涛

前言
听到“双十一”这个词大家都会非常熟悉,,,它是一年一度的购物狂欢,,,,发展至今也已经举办13次了。。。每年的双11都是物流行业突破自身极限能力的时刻,,,是对物流人的大考。。。在那7天里,,订单量是日常单量的几十至百倍,,,,社会上所有的物流能力好像一下子都被占用没了,,,车辆紧张、、场地紧张、、、、人员紧张,,,,系统崩溃。。。。记得最初几年伴随着销量暴增的报道,,总是出现电商平台崩盘,,付款失败的情况,,,IT人面对双11,,,,如临大敌,,,与购物者的狂欢心态完全不同,,IT人是在提心吊胆,,神经高度紧张中度过的。。。为了系统稳定,,网上还有各种“奇葩”招数,,,,比如把马老师的照片贴在服务器上保平安。。。足以证明双11的单量压力是多么的可怕。。。随着大促经验的不断积累,,,,现在的双11,,,虽然单量还在逐年增长,,,,但是我们很少会听说系统崩了,,,站点爆仓了这类消息。。。这个转变的原因是多方面的,,各方资源和能力都在增长,,,,在这里,,我们浅谈“要做哪些准备才能支撑好电商仓发货的业务”。。。。
作为亲历过12次双十一的神州控股旗下科捷物流的IT团队成员,,我特别想把一些经验分享给感兴趣的伙伴们。。。今天就借着神州数码技术年会星火文集这个舞台,,,带着伙伴们一起进入科捷物流忙碌的大促系统筹备中。。。
科捷物流在大促中扮演的是电商仓储发货的角色,,,每次我们做大促支持,,都分“战前”、、、“战中”、、、“战后”三个阶段。。。。工作量最为繁重也是最重要的就是“战前”阶段。。在这个阶段,,,,我们会按以下九个方面来做准备。。
1.
硬件资源
硬件资源指我们使用到的服务器、、、虚拟机、、、存储一类的硬件设备。。。。这是最基础的资源,,,也是一切的根基。。。。在大促前,,一定是需要做短期扩容的。。。。我们有本地的资源,,,也用到云上的资源,,,,本地资源就更要提早的协调沟通。。。
1.根据单量预测,,,增加服务器或者提升CPU/内存
2.检查更新WINDOWS服务器补丁,,并设置成不允许自动升级补丁状态
3.整理磁盘碎片
4.做硬件健康检查
5.关注磁盘空间、、、网络状况、、、、CPU使用、、、、内存使用情况
2.
仓内设备
仓内设备指库房内的电脑、、、打印机、、、手持设备、、、、电子秤、、、自动称重设备DWS、、、AGV等。。。这些设备不像总部机房内设备那样集中管理,,都分布在各个仓里,,,,难管理,,在大促前需要做一次全面检查。。
1.库房内电脑磁盘空间是否足够
2.手持设备的联网状态,,手持设备本地空间剩余,,,备用数量
3.电子秤备用数量,,提前做好短期新增的电子秤与电脑的适配连接
4.各型号打印机的试打印
5.自动化设备的健康检查
3.
监控管理
监控管理有很多层面要顾及。。要有最基础的服务器、、网络资源使用情况的监控和自动报警;也要有业务层面的监控,,比如来自于我们大数据系统KingKooData自动发送的业务各项指标的完成报告【图1】、、、、业务数据流的流转阻塞监控【图2】;还要有全国各仓的实时画面监控【图3】。。。。

图1

图2

图3
4.
网络准备
网络涉及到服务端的带宽和库房的内外网。。。。首先是要通过日常的网络占用情况数据来判断需要增加多少带宽。。。其次是如果发现连接总部网络质量不好的库房,,,需要采取一些加强措施,,比如SDWAN的方式,,减少链路跃点数,,,,提高网速和稳定性。。。。
5.
数据库
最有可能出现卡顿的故障点就是数据库,,,,要做以下准备。。
1.清理历史数据,,保证一个安全的数据量
2.重建索引、、收集碎片
3.调整全备份的日期,,避开大促
4.调整批量数据导出作业,,,,避开大促
5.优化慢SQL,,,避免死锁
6.
部署调整
利用短期新增的服务器,,,做多节点配置,,,,接口系统和应用系统用Nginx做分压。。根据单量预测,,单量比较集中的库房,,,不能集中在一个数据库中,,需要做拆分。。。。日常如果有很多程序挤在一个服务器上情况,,,这种时候就要分服务器部署。。
7.
压力测试
大促开始时,,压力会先来自于上游给库房下发单据的动作,,,,我们叫接单。。。当夜间和第一个白天过后,,,所有压力都发生在仓储系统的发货流程上。。所以我们一般会针对以上两个重点做压力测试。。。。
1.接单压试,,是通过测试工具模拟大量订单接入的场景测试。。。。自测后,,,,还要协同客户,,,,根据往年的单量进行压力测试,,模拟大促场景,,,,确保客户订单接入无延迟。。。。
2.关键功能压测,,是找到用量最大的几个关键功能点做压测。。。。比如“制拣选波次”、、、“批量调度”、、、“获取面单”等,,,,根据结果,,,,要制定针对性能瓶颈的解决方案。。。需要注意的是,,,,功能优化往往是花费时间最多的准备环节,,需要提早3个月以上开始着手。。。。最晚到大促2周前,,,就不能再有代码变动了,,,要封闭版本,,因为任何上线都可能隐藏着代码BUG,,一定要留给业务一个版本稳定期。。。
8.
日志管理
在大促的时候,,,,系统动作越少越好,,,能节省资源的地方就不要放过,,,,日志记录在金库系统中做了开关,,分出了“必须”和“非必须”两个级别,,,在大促时,,只开“必须”的日志记录,,,能大大缓解数据库和磁盘的I/O压力。。。。另一项工作,,就是清理旧日志,,,,腾出足够的空间。。。。
9.
值班安排
值班安排就是把参与大促的IT人员做分工安排,,,,要根据大家各自熟悉的领域搭配好,,,提前为大促值班排出两个班次,,这种大促都是24小时轮值,,,每耽误1小时解决问题的时间,,,仓里就是几万到几十万的损失。。
好了,,,如果准备完以上的九方面内容,,时间可能也过去四个月了。。。。临近大促最后的一周基本上没有大动作了,,就是小的查漏补缺,,,,一些不能提前做的配置和开关动作在这时候进行。。那么,,真正到了双十一来临的那个晚上,,我们会和仓储管理部、、客户部组成联合作战团队一起进驻作战室集中办公。。。全天候双班24小时的战斗,,,通过KingKooData大屏盯住所有仓的各项指标,,线上响应各方呼叫,,,,每小时系统自动发送详实战报。。
科捷的IT小伙伴们就是这样来准备一场大促的。。“亲,,签收满意的话,,,,给个五星好评哦!!”

