论坛4 | 多维共生的云生态 曹毅 「行业联盟篇——全渠道电商中台搭建」



  • 时间: 2016年7月28日
    发言人: 博智信息创始人 & 首席架构师 曹毅
    主题: 行业联盟篇——全渠道电商中台搭建


    大家好!非常高兴能在这里跟各位分享一下,博智在零售行业上云的道路上经历的坎坷路程。

    我们是以用户的身份接触到青云,因为我们同时也是1919的总架构师。在使用云计算的过程中,我们比行业的伙伴更有话语权。因为我们是在一线,通过云计算打造零售行业整体的解决方案。今天分享的案例是1919的案例。熟悉酒类电商的朋友会比较熟悉这家企业。目前1919是酒类垂直电商的NO.1,去年他们超过酒仙网,成为行业第一。2013年的时候我们还是非常传统的零售行业,那时我们只开了70家门店,线上流量几乎为零,整体销量也就2亿-3亿。我们一直在思考零售行业应该怎么发展,互联网能够带来什么东西。这个过程中,我们想了很多思路,而这些来源于我们的一次创新。

    这个很小的业务创新,给我们企业带来了非常大的腾飞。我们一直在思考零售行业和电商行业的优势在什么地方。我们没办法去和BAT抢流量,也没办法通过拉拢用户进入我们网站购买东西。但我们有一个很强大的优势,就是线下有非常强大的实体的交付能力。我们可以做O2O。但发现所有零售行业都可以做O2O,而我们做O2O的优势在什么地方?这个时候,我们找到一个非常好的场景做酒类零售O2O。这个场景式这样的:在这个场景里有非常核心的内容,我们是做19分钟到达。因为我们传统做酒类电商,通过各种分析我们得到,很多酒的消费它其实是场景消费。更多是在酒店和餐饮,我们喝酒的时候会想到购买,我们真正家庭购买非常少。这个时候对我们要求就非常高了,因为在这样的场景消费下,我们的配送时间没办法做一个小时两个小时,只能把这个时间压缩到更短,甚至消费者在点餐的时候,菜还没上的时候我们的酒可能已经上桌了。这是我们和别人做O2O场景不同的地方。

    抱着这个想法我们做了尝试。把我们所有门店做了开放,做19分钟立即送,如果超出1分钟或者超出几分钟就做赔付。这个场景对我们整个销售带来非常大的提升。我们上线APP以后,几个月销量就冲了两到三个亿,超过以前全年零售销量。这个场景的核心在于我们找到一个非常极致的时间点,而这个时间点是我们和其他O2O企业不太一样的地方。我们做极致O2O,把配送时间压缩到19分钟,甚至10分钟、8分钟。这给给销售带来非常多的好处,销售有大量增长,但同时对我们IT就带来非常崩溃的压力。为什么呢?我们做了很多电商入口的接入。现在在京东、淘宝各个电商平台都在开店。我们有立即送业务场景,同时零售门店自己也在做零售销售。这个时候库存管理对我们压力就非常大。为什么?因为作为一个消费者,如果线上购买了一单, 而他要享受的是场景消费,希望这个酒水19分钟到。如果超时,因为我在吃饭而酒没到,消费体验就会极大的下降。这个情况下我们的库存锁定就变得非常重要。因为在做APP下单的时候,可能同时门店也有客户到门店上做了订单的收取,他可能把这瓶酒拿走了。而互联网上这个客户他下的订单没有被锁住,那么就没有办法完成极致的交付体验了,最后影响到整个最终消费者的完整体验。处理这种情况对我们的IT压力非常大,每天会接触到非常多的互联网订单。所有订单都在抢一个库存,都在抢不同门店的库存。而又不可能给每个门店配更多的货,矛盾就来了。

    所有线上商城是通过库存信息,直接接入到我们的系统。当推出这项立即送的业务之后,我的零售系统每天都崩溃好几次。因为我没办法把库存锁住,消费者投诉率也非常高。消费者在线上下订单,而这个订单最终因为门店缺货没办法完成交付。在做传统零售企业的时候,我们采用的架构都是非常传统的IT架构。数据库都是用的Oracle,整个零售系统没有上云,运维压力非常大。而面对这个困难的时候,我们想到了用云计算解决整个库存的问题。

    0_1470628569338_upload-700c166f-9135-4cc4-8145-e14134f854a7

    我们设想了多维库存,是完全架在云计算上面。在这个云上面我们设置了各种各样零售库存场景,基于这些场景,我们针对不同的业务场景,如刚才我们举的立即送的业务场景,我们设计了很多策略库存。在策略库存之上我们又做了大量的缓存。通过这些层级我们分解了各渠道上订单对库存的冲击。而通过很好的应对这些冲击,实际上获得是对用户对这种场景体验的很好的满足,同时也缓解了库存管理的压力。通过这个手段,立即送的订单一下提升了好几倍,完全超过零售订单。我想很多消费者可能不太愿意到门店上一单一单进行购买,可能更喜欢在餐饮场所,正在吃饭的时候他下一个订单。这个订单下单以后通过库存的精确计算把它定位到最近的门店,这个门店能够在极短的时间完成交付。消费者拿到酒的时候很有可能还是冰的。在很多门店集中的区域,经常是在餐馆点了菜,菜还没上来的时候酒就已经到了,而且这个酒还是带冰的。这种场景体验对消费者是非常好的。我们也是通过这样的云计算,分级解决我们的库存压力。

    有了这个场景的成功之后,我们对互联网的创新一下就爆发了。因为很小的一个创新给我带来这么大的销量,甚至超过门店零售量。整个企业就不停开放各种各样的创新平台,我们也疯狂开店。截至到今天,我们从2013年的70家店现在已经开到了1000家店。我们的销售额从2013年2亿销售今年已经做到6亿销售额,我们只用了三年时间。这三年时间不是靠我们传统零售一个门店一个门店带来的销量,而是靠各种各样创新的零售消费场景,通过这些场景带来各种各样的互联网订单流量。其流量已经完完全全超出线下门店自然流水的流量。我们现在已经把线下门店变成整体服务中心,这个整体服务中心成了互联网平台的载体。这个载体需要对所有互联网订单进行交付,对我所有互联网订单提供库存满足以及配送解决方案。在这个过程中,我们越来越多的问题也暴露出来,比如我们的账户中心。客户越来越多,他可能从京东购买,从天猫购买,从线下门店购买,从我们各种各样商城进行购买,比如我们的APP,我们的微商城,我们的官网。这个时候我很难识别用户信息,用户信息也很难统一在一个账户,这个时候我们必须要把统一账户中心架设到云平台上。因为这样能够对所有的互联网接入平台进行很好的大并发量的支持。同时,通过我们的多维数据库,解决零售库存解决方案,也同时给我所有的线上各个接入平台都提供了一个统一的库存解决方案。各个前台提供出来的解决方案对我的库存是共享的,我所有的库存并没有发生增加或者减少,这个时候我可以把库存给各个渠道同步公布,我的库存策略也是通过我们的云平台进行分布式的库存策略。包括我们的订单中心,因为全渠道使我们订单接入点会变得越来越多,互联网订单,线下订单,都是会通过零售门店完成很好的交付。同时营销中心、呼叫中心、物流中心也搭建了这样的平台。以前没有云计算平台的时候,我们的计算能力和平台的软件架构没办法支撑这么大的并发量。每天我们订单处理量也是很小的,因为之前没有接入互联网每天订单处理是几万到十万。接入互联网以后我们的订单是成倍级增长,最多一天要处理100万到200万订单,100万到200万订单同时分解到线下,可能会形成很多配送信息,配送信息最终又会分解成各种各样的物流分解信息,整个数据增长也是成倍级增长,对IT架构的影响也非常大。

    0_1470628590947_upload-377664a6-e039-4a4a-86b6-acf304f08f50

    在这个过程中,我们逐步把电商平台进行了完善。我们把所有前端平台,包括零售系统,POS系统,包括各商城的,包括我们自建的各种创新APP平台,都放到了公有云上,放到青云,或者阿里公有云上整合。我们也搭建了私有云。因为核心业务必须把控资金,物流,还有很多其他核心信息,这些信息很重要,所以也搭建了私有云。这个私有云完全搭建在青云之上,我们把整个核心交易相关的会员、支付、物流、库存、订单的处理到集中到中台业务里面来。通过这样的架构完全减轻了运维压力,因为对于我们一个传统企业,没办法驾驭非常底层的虚拟化或者这样的云平台。在没有青云之前,我们也尝试过用VMware或Openstack。这些东西大家可能都有接入,但真正进行大规模交易应用的时候我们发现它里面有非常多的问题,我们必须把代码做嵌入式的修改。而在每个方向每个领域,我们其实缺乏专家。比如做Linux,缺乏Linux 的专家;比如做缓存,我们缺乏Memory Cache的专家;做离线数据像Kafka这类,也非常缺乏专家。在使用Openstack的时候我们发现,所有问题都不能解决,但所有业务都能在上面跑。而应用场景并没有提升,整个客户体验没有提升,系统崩溃率仍然在增加,内存突然丢失了,数据丢失了,我们找不到原因。这个时候我们就找到了青云,因为我们觉得作为行业软件服务商,我们可能更聚焦在应用层面,对于底层IaaS层和PaaS层会找更专业的服务商来合作。找到青云以后,我们所有的应用,包括中台应用,完全架在私有云平台上面。我们发现所有运维工作,系统宕机的机率,包括大并发数据处理,都交给了很专业的PaaS层解决了。我们完全不会担心系统会发生崩溃,应用会发生宕机。在这个时候我们私有云应用的作用非常大。刚才提到多维库存。在多维库存高峰时候,我们大概会启动了将近100多个MySQL去处理不同的业务场景。每一个业务场景都会做一些分库分表,它可能是针对每一级区域锁定区域库存,每个门店会锁定门店库存。以前我们整个集群工作做的不太好,很多数据库之间的关联关系隔离做的不太好,分拆做的不太好,于是经常发现一个数据库崩溃可能对其他数据造成很大的效率完全下降,甚至多维数据库系统的崩溃。后来发现青云在这些方面有很大的价值。在通过青云平台起用了大量的MySQL集群之后,现在每天在上面跑100多个数据库,这个过程中并没有发现数据库会出问题,完全超越了我们以前自己搭建平台的架构。

    这是我们青云过后带来的一些好处。作为传统的企业,我们不可能在云计算上面投入更多资源做底层研发,特别是做基础设施研发,还有底层PaaS研发。我们可能更聚焦在业务的快速迭代上面。我们会经常同时开工20个甚至30个APP迭代项目。在这个过程中,底层高并发、高可用,相耦合的一些业务场景,可们会更多倾向于通过青云的API接入。这可以给我们节省大量的时间,同时也不会担心性能的问题。以前我们经常搞促销活动的时候,研发部门会投入大量时间聚焦在压力测试及性能测试上,很多时间都浪费在这些基础性工作。我们接入到云平台之上,可伸缩完全可以解决突然性的大规模促销活动,解决压力和性能的问题。包括安全,之前我们每天遭受大量的网络安全攻击。之后我们把前端所有应用放在公有云上面,使得内部整个网络,内部所有接入平台完全被保护起来,在外界网进行隔离,做到更好的安全防护。在运维上面,我们也是做了大大的减少。现在企业做运维都是很头痛的问题。我们现在IT机房有100多到200多服务器。而找运维工程师越来越难找,服务器和IT机房的管理也成为非常头痛的问题。因为以前的虚拟化做的非常差,而在我们实施青云的私有云之后,至少在运维工作上大大减少。现在机器人跑起之后,每天都会对低级错误进行修正和调整,包括部署自动化,这些节省了我们很多IT成本。

    整体云计算帮助我们在IT投入上做了很大的节约。目前,支撑6亿销售,每天订单是30万-100万订单处理量。在这个过程中,我们整体的IT资源相比过去是下降了很多,也没有采购新的服务器,也没有做更多的公有云或者私有云扩容。完全是在以前服务器体系之上,加了大量效率提升的工作。所以我们整体IT资源做了极大的提升。整体供应效率也做了极大提升。现在业务部门完全不用担心,比如提出今天的活动需要做2亿到5亿的浏览量,因而需要特别对I/O的支撑提出要求。现在所有东西都是自动伸缩共享,大量IT资源通过整体管理,可以进行很好的伸缩。在我做活动的时候有一些资源可以做消减,在做服务开放的时候有一些资源可以进行扩大。那这些使我服务的伸缩做的非常好。还有运维成本,启动私有云之后,大量基础的检查,比如网卡检查,数据阻塞检查,包括MQ(Message Queue)的一些检查等等,都可以交给私有云P2P机器人帮助做这些基础性的检查。这样的话我们运维工作大量减少。

    混合云架构现在我们也正在做很好的搭建。毕竟大量应用场景是不方便在私有云上部署,我们更多放在公有云上做部署。在混合云和专线方面,青云都给我们提供了非常好的方案,使我们在公有云和私有云之间很好的切换。

    这是我们对青云的一些使用场景和是私有云的应用。这些应用在一些传统的零售行业是非常广阔的。我们希望未来有更多的在零售行业,在快消行业,能够找到更多的私有云或云计算的应用场景。这样可以为云计算生态做更好的搭建,谢谢!


登录后回复
 

与 青云QingCloud 社区 的连接断开,我们正在尝试重连,请耐心等待