2014年10月20日,Gartner在其报告里称:“到2020年,70%到80%的非结构化数据将放在由软件定义存储管理的低成本存储设备上”。
如果对这句话进行解读的话,你会发现有两个关键词,“非结构化数据”和“软件定义存储”。
什么是非结构化数据?我们平时使用电脑、手机所产生的文本、图象、声音、影视、超媒体等无法用二维表(关系型)进行记录的数据都是非结构化的数据,看看我们的手机,你就会知道为什么我们所处的世界中数据会有如此快速的增长。
有了数据,就涉及到了数据存储的问题,这就是我们的第二个关键词:“软件定义存储”,即SDS。首先,云计算时代下,对象存储方式被广泛应用。对象通过唯一的ID进行标识,就像在基于文件的存储系统中,文件通过路径来标识一样。对象存放在扁平的地址空间中,这样可消除基于文件的存储系统中,分层的文件系统的复杂性和扩展性的挑战;其次则是更为底层的存储机制,软件定义存储的主要优势表现在,独立SAN存储部署,无需同品牌硬件,避免硬件厂商绑定,服务器可利旧;存储融合于主机内,总拥有成本降低60%;后续按需扩展,提高存储资源利用率。节省机房空间,节省运维人力成本。
而通过低成本的统一硬件搭建而成的“存储资源池”其实是一个共享的存储,这也是传统存储产品无法做到的,但不得不承认的是,对于一些用户来说,仅仅有“SDS”的概念是不够的,他们更需要的是把存储绕过技术层面直接抽象成为模块化的“存储服务”,从而最大限度降低用户的使用门槛。
杉岩数据CTO邱尚高认为:从目前的市场情况来看,软件定义存储(SDS)的确取得了很大的成功,不仅可以在一些场景中替代传统的中高端存储,还可以为用户提供一个总体拥有成本更低的高性能存储产品,但从一些项目中可以看出,传统存储产品在转型的过程中依然具有不小的阻力,要想真正做到“软件定义存储”还有一些路是必须要走完的,而其中最重要的就是产品的打磨。
SandStone是杉岩数据自主研发的一款为满足云计算、大数据背景下企业级存储建设与变革的需求,而设计的分布式统一存储软件,利用分布式技术将标准X86服务器的本地HDD、SSD等存储介质组织成一个大规模存储资源池,同时,对上层的应用和虚拟机提供工业界标准的块、iSCSI、文件和对象访问接口,进而打造一个高性能的分布式统一存储产品。
现在,很多分布式存储系统都会宣称同时支持块存储、对象和文件系统,可实际上,如果只是为虚拟机提供存储,只需选择支持块存储的产品即可。为什么呢?因为,一个产品里面,特别是核心引擎支持的东西越多,各种优化的复杂度就会越高,稳定性、可靠性受到的影响就会越大。好比单针对块存储进行优化,每个数据切片可以采用定长来切;可以简化对象名,简化后,可以尽量大部分甚至全部缓存内容,减少元数据读盘。但还要考虑对象、文件系统的话,考虑优化问题就不能像这般简单,还需评估对块的优化是否会对文件系统、对象造成潜在的影响,是否会引入一些不可知的风险等。此外,块存储基本采用强一致性,对象存储基本采用最终一致性,放到一起两者要如何取舍也是一个不容忽视的问题:全用强一致性,对于对象存储来说,会牺牲性能;而全用最终一致性,块存储数据可靠性又存在问题。但这些问题,对于开发资源、投入有效的企业来说并不了解,很多存储产品自身也同样存在一些隐患,因此,目前行业内最重要的还是服务,甚至是针对用户的现场服务。
因此,相比于“存储+”所提倡的生态化、整合化,“+存储”这一理念则显得更加接地气一点。“+存储”强调的是一个被集成的理念,通过不断在性能、可靠性、互操作性等方面的打磨,不断完善存储产品的兼容性,而这种兼容性必须是双向的;而从产品层面的角度来说,分布式存储的出现本来就是为了解决存储本身遇到的问题,而解决问题的最有效方式就是直面问题。这并不是一种文字游戏,而是一个解决问题的具体思路。经过两年多的打磨,杉岩数据走出了一条适合自己的存储之路,发现问题、解决问题,从用户需求入手,这便是对“+存储”这一理念的最好诠释。