项目背景
盛趣游戏前身盛大游戏,是网络游戏开发商、运营商和发行商,立足“科技赋能文化”的的新文化产业定位,盛趣游戏全面推进“精品化”、“全球化”、“新文化”三大战略,以科技为骨、文化为翼,用科技激活文化的精髓,致力成为一家打造极致互动体验的科技文化企业。
本次项目新钛云服协助盛趣从本地IDC机房区域迁移至AWS公有云。整个迁移过程涵盖云架构设计、POC验证、迁移、部署及后续的持续技术咨询服务。
本次项目为一期建设阶段。本次建设包含需求分析、架构设计、落地实施以及项目验收等。
项目需求分析
本次需要迁移前端服务到AWS,迁移前需要详细了解盛趣游戏在目前基础设施资源使用情况、业务部署架构;梳理业务模块,了解数据使用量等诸多信息。
平台前端业务系统
-
WAF 网络应用防火墙
-
MSE微服务网关
-
K8S集群
-
Kubernetes容器镜像服务
-
PTS压测
-
DCDN全站加速
-
Linux服务器等
业务可观测
业务监控需要进行可观测展示,包括Prometheus监控、Grafana展示、云监控进行配置和调整。需要依据告警级别通过不同的方式发送告警,例如邮件、飞书等。需要对监控告警方案调研、验证功能以及给客户演示是否满足需求。
日志系统
盛趣游戏目前使用ELK日志服务,客户本次迁移的生产服务器预计80台左右,为了使客户顺利的迁移到AWS需要解决客户应用日志收集的需求,计划采用LogHub的方案实现。盛趣游戏有较多的业务应用日志,需要对各个业务日志收集流水线进行调试。
DevOps
盛趣游戏采用自建Jenkins服务器进行CICD流水线发布。需要进行流水线改造适配AWS环境来保证前端业务能够顺利发布。
业务架构图
基础设施的设计
-
VPC设计:生产环境VPC用于容纳生产环境,开发和测试VPC独立于生产环境VPC;
-
子网设计:根据安全分区要求,分为公有子网、私有子网、DB子网;公共子网(DMZ)部署面向公网访问服务器,VPC、NAT Gateway、堡垒机和ELB等;私有子网(External)部署只允许通过NAT Gateway访问外网的应用服务器;私有子网(Internal)部署只允许内部访问且无外网访问需求的服务;
-
资源选型设计:实例类型、操作系统、EBS类型、IOPS;
-
IAM:研发、运维、管理等部门创建IAM用户和用户组,遵循最小权限策略赋予对应的权限;开启强制设置MFA多因子认证;
-
定义NACL:控制所有子网层面的进出流量;
-
定义安全组:控制所有实例层面的进出流量;
-
开启CloudTrail记录资源的操作记录,可追溯性;
迁移方案的设计
-
MSE微服务网关在AWS上的实现需要进行PoC;
-
WAF托管规则需要在AWS WAF上进行PoC,利用AWS WAF实现基于IP速率的访问控制、SQL注入防护、反爬虫、恶意机器人等功能;
-
Kubernetes容器集群和镜像需要通过部署AWS的EKS集群和ECR镜像来进行迁移;
-
日志收集方案计划采用AWS Loghub解决方案集中式进行日志搜集,帮助客户在单个控制面板收集、分析和显示。同时可以整合来自不同来源的日志文件,收集来自Cloudfront、ELB、EC2应用日志文件;
-
监控告警方案的设计,客户使用习惯需要依据告警级别将警报发送至不同的SNS,以触发不同的告警方式来接受来自不同资源的告警,例如:CPU、内存、CPU利用率、网络IO等。
验收标准
对于本次项目的验收标准,是以在与客户互相确认通过的迁移计划中所列出的每个阶段时间节点内完成的工作安排以及针对本阶段用于验收的交付物进行评审、评估和测试。在确定每个交付物满足特定交付的验收标准,并客户在书面验收上进行确认,已完成整个验收过程。在交付物在客户验收期内不能满足或者不符合,由项目经理进行双方沟通并确定在所要求的范围内进行纠正不符合项,以使交付物达到和满足验收标准。达到验收标准后,双方确认项目验收报告并签字。
新钛云服项目团队资源分配矩阵
Project Phase
|
PM
|
SA
|
SAP
|
Engineers
|
总计
|
规划
|
2
|
0
|
25
|
0
|
27
|
设计
|
6
|
0
|
67
|
0
|
73
|
实施
|
6
|
0
|
86
|
0
|
92
|
验证
|
9
|
0
|
60
|
0
|
69
|
总计
|
23
|
0
|
238
|
0
|
261
|
项目实施过程可交付成果
序号 |
可交付成果 |
时间节点 |
1 |
整体方案概览 |
2023/5/9 |
2 |
成本分析报告 |
2023/5/8 |
3 |
系统迁移方案 |
2023/5/11 |
4 |
安全设计方案 |
2023/5/16 |
5 |
网络设计方案 |
2023/5/17 |
6 |
监控设计方案 |
2023/5/15 |
7 |
日志设计方案 |
2023/5/19 |
8 |
CI/CD 设计方案 |
2023/5/17 |
9 |
实施方案 |
2023/5/19 |
项目收益
新太云服实施团队在项目执行过程严格按照项目管理计划所执行,最终按照客户预期完成一期迁移项目。
AWS多年来的行业经验能够满足游戏企业在国内和全球化部署时更高的安全合规要求。同时,AWS平台能够灵活地选择资源的购买方式,动态调整使用资源,可以满足某些资源用量突增或者临时需要快速对服务器升配的需求;并且在存储、带宽以及成本优化方面帮助用户节约成本。总结收益为以下几点:
-
成本优势。AWS的云服务定价更加灵活和优惠,特别是对于大容量和高配置的用户。迁移到AWS可以降低整体基础设施成本,提高运营效率
-
更丰富的服务。AWS提供超过165种云服务,涵盖计算、存储、数据库、网络、分析、机器学习、物联网等领域。
-
更高的安全性。AWS作为全球公认的云服务安全领导者,在数据保护、网络安全、风险管理等方面具备更强的技术实力和丰富的经验。迁移到AWS可以更好保障游戏平台业务的安全稳定运行
-
更优的业务连续性。AWS可提供跨区域的业务持续性解决方案,确保业务在区域间快速恢复和中断迁移,最大限度减少对终端用户的影响
-
更丰富的合作伙伴。AWS丰富的合作伙伴生态系统,可以为游戏平台提供各类应用程序、工具软件和服务。这有利于平台拓展第三方服务,丰富用户体验。