全球数字化时代,数据中心作用不可小觑。自然灾害、数据攻击等危机事件层出不穷,企业纷纷建立双活或多活数据中心防患未然,应用和数据库的高可靠性和高可用性成为关键。
然而,随着海量非结构化数据的涌现,传统数据中心在帮助企业构建数据空间的同时,也面临着一些挑战。如何修炼出一招高效省心的数据灾备大法,让企业打通多活数据中心的任督二脉?且看这份修炼秘籍。
灾备江湖:传统数据中心数据保护方法
作为服务和数据的载体,数据中心的可靠性直接关乎企业的命脉。正因为此,各行各业用户对数据中心安全可靠性的关注度日渐攀升。如何保证数据中心中数据的安全可靠,是所有企业在数据中心建设和运维过程中的重点和难点。传统数据中心的数据保护方法和切换逻辑为:
本地数据备份:通过捕获或跟踪生产数据的变化,并将其在生产数据之外建立副本独立存放,以确保数据可以恢复到过去的时间点。
同城数据双活:容错能力扩大到了2个数据中心,在主中心出现故障无法在短时间内进行恢复时,可快速切换到容灾中心,进行业务接管。
异地数据容灾:在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。
路遇迷雾:海量非结构化数据“双活”存储挑战
随着新技术的不断涌现,企业业务变得更加灵活多样,从“稳态”向“敏态”不断发展。企业不仅关注数据中心服务的日常数据处理表现,也对业务连续性提出了更高的要求。
基于数据安全考虑,大型企业往往会建立双数据中心或者多数据中心。双活数据中心已经跨越概念炒作的阶段,被越来越多的企业用户所接受并付诸实践。这些建设方案往往针对的都是比较重要的结构化数据,也就是运行在关系型数据库之上的关键数据。
但随着用户习惯的改变以及技术的演进,每年产生的数据总量爆发式增长,非结构化数据占比也越来越高。据IDC报告显示,非结构化数据已占数据总量的80%以上,使用同样的方式来处理结构化数据与非结构化数据的双活需求,会面临一系列的挑战。主要体现在:
拥有成本高
为了实现双活,通常要增加专门的网关设备。另外,双活数据中心有一定的物理距离,在意外事件发生时,例如数据同步链路故障,就可能出现两个数据中心一体化的业务系统会分裂成两个独立的数据中心,即“脑裂”现象。在这种情况下,应用难以判断哪一个是最新的生产数据,或者基于数据完整性的考虑,也可能出现两边的数据都锁定不提供服务的情形。为了避免脑裂现象,势必要增加仲裁设备;要保证仲裁设备的有效性,仲裁设备往往要设置在不同于双活数据中心的第三处数据中心。
总体来说,传统的双活存储方案,SAN/NAS一体,未考虑不同类型业务数据的差异,架构复杂,设备繁多,整体方案过于笨重,对于非结构化数据也要增加网关设备和仲裁设备等,增加了投入。同时涉及到的业务和存储技术门槛较高,对运维管理人员的要求也较高,造成企业运维成本高企。因此,整体的投入性价比不高。
运营维护复杂
传统双活方案涉及存储、计算、应用等多个层面,其间的协同、均衡、仲裁、接管逻辑复杂,系统复杂度极高。像网络部分,就可能涉及复制链路、心跳和管理网络,在管理上比较复杂,故障处理也会比较复杂。非结构化数据的文件数量和容量随着业务规模的发展呈逐年激增的趋势,传统存储的设备数量随之快速增长,这对运维管理人员的技术能力提出了极高的要求。
方案厚重,灵活性不够
传统双活存储方案,对于双数据中心的情况可以满足一定的双活需求。但是在更多基于非结构化数据的业务涌现的背景下,实际业务中可能会出现多个数据中心的场景,特别是常见一个中心多个分中心的场景;数据中心之间的数据可能出现双向同步的需求,也可能出现单向同步的需求。面对这些需求,传统双活方案就显得过于厚重,策略调整困难,灵活性不够。
总体来说,在以结构化数据为主的场景中,传统双活方案为业务连续性和数据安全保驾护航的表现尚可,但是在处理海量的非结构化数据时面临着一系列挑战。
如何高效地对海量小文件进行数据保护?如何在多个数据中心之间做好负载均衡?针对非结构化数据,是否有更经济、更简洁、更灵活的多数据中心存储解决方案?
针对海量非结构化数据,杉岩数据打造的新一代存储多活方案可以有效地解决以上问题。
冲云破雾:杉岩MOS构建新一代多活数据中心
杉岩MOS是一款业界领先,支持海量对象存储、便捷检索管理及智能数据感知的对象存储产品。经过深入调研非结构化数据跨数据中心灾备需求特点,实际大部分业务场景不需要传统方案的强一致性。
基于此,杉岩MOS去繁就简,抛弃传统方案繁重的架构,基于索引日志机制实现了多站点异步复制、总部分支机构汇聚分发,并且配套支持多站点智能DNS解析、SandVision高效多站点多集群统一监控管理;彻底解决了传统方案成本高、运维复杂、方案厚重的问题,为企业提供了一套运维便利、架构简洁、高效灵活的非结构化数据保护解决方案。
杉岩MOS的多站点技术,主要包含以下技术要点:
● 多站点自动同步:多个站点之间的数据按照策略相互同步,保证数据的最终一致性。
在开启多站点的存储集群中,新上传的数据会记录索引日志,每个站点都利用同步网关记录索引日志并向其他站点同步。
● 多站点多活:由多个独立的存储集群组成,每个存储集群都能够对外提供服务,集群的读写互不影响。
● 站点同步传输压缩:在网络带宽紧张的情况下,支持站点间数据同步的压缩传输。特性开启后,数据在线压缩;目标站点收到数据后,数据解压存储,从而节约网络传输带宽。
● 数据汇聚和分发(CDN):在多站点的基础上增加了单向同步功能,在定义数据同步策略时,能够指定部分站点仅单向同步,分支站点可将数据单向同步到主、从站点。主、从站点可以主动将部分需要在所有分支机构保存的数据进行推送。同时,在自定义共享规则之内分支站点能够向主、从站点请求数据,实现本地快速访问。
● DNS自动切换:支持域名对外提供服务。存储集群配置不同的IP,通过DNS进行域名映射,当站点出现故障时,通过DNS进行切换,提高业务的连续性。杉岩MOS多站点技术实现了数据容灾,提高了数据的安全性,且多个站点保持多活,在某个数据中心故障时,通过DNS技术能够快速切换到另一个数据中心,保障业务连续性。
● SandVision多站点统一管理:支持多集群统一管理。SandVision提供基于Web的管理系统,管理员可以通过浏览器访问服务IP进行登录,对杉岩MOS进行统一业务管理和性能监控等。
对于用户来说,杉岩数据多站点多活存储方案的优势也是显而易见的:
架构简洁,拥有成本低
存储采用软件定义的方式,内置同步网关,不增加过多的硬件设备。与企业构建多数据中心的目的类似,多站点技术为应用提供了最短路径的选择,从而实现业务的就近访问,提高业务的访问及数据传输的效率。
运维简单,多活自动容灾
杉岩多站点技术支持数据多个站点之间的数据自动同步,大大提高数据的安全性。并且多个站点保持多活,在某个数据中心故障时,能够快速自动切换到另一个数据中心。SandVision提供多集群统一管理,运维简单,自动化程度高,大大便利运维管理人员。
方案灵活,消除数据共享壁垒
基于多站点技术的汇聚和分发功能,杉岩MOS提供构建大型企业总部与分支机构数据灵活部署的能力,企业可根据实际情况进行存储集群拓扑的构建,消除数据共享壁垒,使业务数据得到更好的共享与使用。多站点技术中的汇聚分发功能提供了构建大型公司总部与分支机构数据分布拓扑的能力,可根据企业的实际情况进行集群拓扑的构建,消除主数据中心与分支数据中心之间的数据共享壁垒,使业务数据得到更好的共享与使用。
成功实践:多分支机构部署,集群数据高效流动
中国广核集团是由核心企业中国广核集团有限公司及直属管理的26家主要成员公司组成的清洁能源大型企业集团。
该集团下属的成员公司规模大,且集团与下属成员公司距离较远,网络带宽成本高,文档信息管理系统访问频率较高,文件的访问性能直接影响到办公效率。同时,各下属成员公司之间及集团与下属成员公司之间,也希望建立一个统一的文件视图,在授予权限的情况下,可以看到整个集群所有单位的文件视图,更好地实现集团知识共享。
此外,大部分下属成员公司,特别是核电站,有强烈的数据灾备安全需求,但如果每个核电厂都建立异地容灾中心,成本较高,需要考虑将这些数据集中保护。分支到集团总部以及其他分支网络时延高、带宽低,直接写入数据到总部会导致带宽占用高、用户体验差。
为将文档信息资源应用于各项业务,为企业提供有效的信息支持服务,该集团在总部数据中心及规模较大的下属成员公司数据中心分别部署杉岩MOS,利用分支汇聚与分发功能,在集团总部和下属核电厂、研究院等中大型分支机构间建立一个完备的数据同步与分发架构,在存储层面实现整个集群数据的统一命名空间与流动。通过部署杉岩MOS,中广核提升了下属成员单位访问集团总部数据的效率和性能,保证访问便捷性和数据安全,实现整个集团数据的集中灾备保护。