专访金山云做了什么?《剑侠世界》登录界面上为何有它一席之地?

编辑:张起灵 发布时间:

金山云将为游戏行业的“基建”服务带来哪些变革?

  《剑侠世界》以公测首日活跃用户破100万的数据刷爆了行业,在西山居投入上亿、耗时两年200人研发、小米独代等关键词之外,龙虎豹发现了一个非常有意思的事情:在《剑侠世界》的游戏登录界面上,除西山居与小米的logo外,“金山云提供游戏云服务”一行大字也赫然在列。

  一般情况下,游戏的登录界面,一般都会展示游戏研发方与独家***发行方的logo图标,但加上第三方服务商的情况实属少见。金山云这次之所以在列,不得不说的是他们与《剑侠世界》深入、紧密的无缝合作。而这次合作的背后可以洞见的是,金山云在游戏领域更深层更全面的服务升级。也正是基于这一点,龙虎豹再次拜访了金山云合伙人胡畏,去了解金山云将为游戏行业的“基建”服务带来哪些变革。

直接参与到《剑侠世界》游戏架构部署当中

  2014年,金山云确定公有云业务方向并以游戏云切入。据胡畏透露,公司现在有800多人,到目前已为接近2000款游戏提供过基础云服务,而为《剑侠世界》提供游戏云服务是金山云游戏云业务升级的一个关键点,“在《剑侠世界》游戏架构部署阶段,金山云就已经参与其中了。”

  胡畏解释,在前期《剑侠世界》服务器的部署阶段,金山云便组建专门项目团队,针对服务器应用及西山居运营规划进行了解,再根据服务器部署情况列出整套解决方案。

  在合作过程中,双方共同参与服务器架构搭建,根据前期庞大的预订人数及游戏特性商讨《剑侠世界》的服务器架构。比如核心的数据库,如何保障数据的备份、如何灾备与容灾、如何进行线路切换等所有的架构搭建,金山云都会参与。

  胡畏表示,《剑侠世界》的服务器架构,是金山云参与的最复杂也是最有安全保证的架构之一。而金山云参与到游戏架构部署中去,这对游戏产品本身来说是非常有益的。

  “游戏厂商从端游到手游已经做了很长时间,踩过无数的坑,在这方面已经很完善。而对于一个新兴的游戏公司,对游戏服务器的部署是没有概念的,各家游戏厂商的运维能力和架构能力也有参差不齐的情况。 ”即使是最核心的数据库,也存在游戏厂商由于疏漏而出现的重大事故的情况。据胡畏介绍,在这点上并非所有人都能有足够的重视,曾经就有某客户采用单数据库结构,而且只放在金山云的一台主机上,如果这个主机硬盘发生故障,那么他面对的将是数据全丢的局面。

  而此前的云服务商并没有过多参与到游戏的架构部署层面当中,这也导致了游戏厂商要么因不专业而导致了服务器的问题,要么为此专门付出额外的人力、财力成本。在胡畏看来,这是云服务业务可以进一步优化的关键点之一。

  所以,自金山云提供游戏服务伊始,金山云便提出参与到游戏厂商的服务器架构当中的概念,希望从服务器部署层面对游戏产品本身的安全运行,起到良好的保障作用。而到今天这一步,金山云也确实通过这种方式帮助并参与了许多大型游戏项目,比如早前的《奇迹MU》,现在的《剑侠世界》,并在这个基础之上,再一次升级服务。

  在胡畏看来,这次升级后的金山云定位,是从基础云服务到运维级服务的质变。龙虎豹将按照游戏的测试、正式上线、日常运营这个顺序来梳理。

不盲目测试 明确测试目的

  《剑侠世界》自2016年7月起,到2016年9月20日公测,前后进行了多次测试,整个测试过程和时间非常紧张。

  胡畏透露,金山云从《剑侠世界》第一次测试开始就一直参与,并且期间一直在强调每一个阶段服务器测试的目的性。比如最开始的终端适配要测什么,渠道要测什么,都会以测试方案的形式确定下来。

  乍听之下这并无特别之处,但在胡畏眼里,目前整个行业的游戏测试,从封测、删档到技术测试,再到二测、公测,最后到发布,有非常多的测试环节。在这数量众多的测试背后,其中一个原因就是目前的测试是缺少标准和共识的,而金山云则可以提供一个有目的性与标准的测试环境。

  一些厂商只是希望测试游戏当前状态,可以获得怎样的反馈,并没有明确的目的。多数厂商也只是希望得到游戏的次留、七留等数据,验证关键数据本身有没有问题。但关键的问题是,即使次留、七留很好,它代表用户的最终选择吗?会成为一个好游戏吗?

  基于这一反思,胡畏介绍了现在金山云在做的两件事。

  第一,明确测试的目的和类型。“你想测什么?这是我们需要跟CP和发行商去沟通与梳理的。”为厂商提供一个清晰的测试类型,这个产品应该测什么,有什么目的。这其实就是测试前提供的测试咨询服务。

  第二,研究怎样让玩家能够去吐槽这个游戏,怎么获得玩家真正的反馈意见。比如小米的游戏中心,在游戏内测这个角度上,会有一个专门的吐槽区让玩家去聊聊对这个游戏的感受,《剑侠世界》也是这么操作的。

  真实反馈的意义,对于游戏产品来说不言而喻,尤其是在研发阶段。胡畏透露金山云为了更好地获取用户的真实反馈,已经在做专门的模版,并且成立评价专家团,把参与测试的玩家引导进入这个评测团中,一来刺激用户的活跃二来收集真实的用户反馈。

保证开服稳定:你见过回龙观高峰期的地铁吗?

  在游戏上线阶段,死在开服瞬间服务器崩溃的产品不在少数。而避免这种情况,也是金山云服务当中重要的工作之一。

  据胡畏介绍,某些负载均衡方案,在用户涌入后,是通过DNS去解析到登录服务器,但如果瞬间人数过多,这种靠DNS解析的方案,很可能出现DNS挂掉导致所有用户无法登录的情况。而金山云提供的负载均衡方案,则是针对性解决这一问题的。

  胡畏以一个非常通俗的例子来比喻使用金山云负载均衡方案开服的场景:“就如回龙观地铁的高峰期,人流量过多时,那它为了保证大家都能上地铁,就设置成通过栏杆一圈一圈排队,虽然会慢一些,但它让所有人能够进的去,而不是完全堵住或崩溃。”

  《剑侠世界》的服务器架构,实际上是一个由几百台甚至上千台服务器组成的大池子。在这个大池子中,服务器并不是固定在某个云主机上,而是相当于用户在这个大池子中,由金山云来调配用户进入哪个服务器。这样处理的好处是,如果某台云主机宕机,用户会重新回到大池子中再重新调配,而不会造成用户面对游戏崩溃的情况。

  胡畏表示使用这种架构,可以在技术层面很大程度地回避故障。毕竟哪家云服务商,都不敢保证每台云主机或者云主机下的物理机是绝对不会出问题。《剑侠世界》所使用的这种架构,多主机、高可靠模式、建大池子,个服务器有额外备份,最大程度保证游戏顺畅运行。一旦出现服务器故障,在玩家层面的感觉到的也只是“稍微卡了一下”。 

通过监控系统及时判断故障 提前公告

  尽管《剑侠世界》所用的架构能够避免一套主机挂掉整个游戏无法正常运行这种情况,但在实际运行中,仍会出现很多其他因素导致游戏无法正常运行。对此胡畏表示,金山云的服务器应用监控系统,也是保证游戏稳定运行的重要环节:一旦出问题,应用监控系统能及时的判断出问题所在,并即时通报问题。

  玩家在游戏中碰到闪退、游戏崩溃、无法进入游戏的情况,所产生的负面情绪可想而知。而金山云服务器的应用监控系统,则能及时判断故障,并通知游戏运营商,在游戏内发出公告提前告知,将玩家的负面情绪降到最低。“事前通知,肯定比事后道歉更能让用户接受”,从用户心理角度,胡畏这样总结。

  “在遇到故障时,通过金山云的服务器应用监控系统,我们可以监测出故障服务器是做什么用的,是登陆还是SDK,还是Gameserver等等,一个个排除,找出问题所在。”比如服务器负载过高,可能是登录服务器出现问题,需要尽快排查登录进程状态,是否这个进程令CPU满载或进程宕掉了,通过这种方式快速排查问题。

  在《剑侠世界》这个项目上,胡畏所提到的这些运维级服务再一次得到了全方面的演练,并保证了《剑侠世界》的顺利上线和运营。在合作过程中,金山云提出多个预案,与西山居项目组深入讨论,预演了多种情况,并针对这些情况做出解决预案。可以说在测试的过程中,金山云就在设身处地地未雨绸缪了。

《剑侠世界》是一次考验,也是崭新的开始

  游戏云服务发展到一定阶段,如何寻求一种新的突破?胡畏也一直在思考。金山云做游戏云已经两年半时间,与之前的区别到底是什么?《剑侠世界》作为一个典型案例,或许体现了他的一些想法。

  在胡畏看来,通过《剑侠世界》金山云不仅提供了云服务的基础保障,在游戏部署阶段提前进入到游戏架构的构建过程中,从测试到开服,从上线的稳定运营到故障监控,全方位立体式的一套服务,成为了金山云从基础云服务商到运维级服务商的蜕变过程。

  “对于金山游戏云来说,《剑侠世界》是一次考验,也是一个崭新的开始。未来,任重而道远!”胡畏这样总结。


暴雪玩家预约数量超200万,2024 ChinaJoy众盼所期!

4月10日上午九点,暴雪网易联合宣布,基于15年以上的紧密合作,暴雪娱乐与网易公司已达成全新的游戏发行协议,会将暴雪游戏重新呈现给国服玩家,在官宣15小时之后,成功登录并完成预约的暴雪国服玩家数量突破200万,在重铸血吼活动留言的玩家数量也达到了95万多,逼近百万级别大关。.