根据Gartner报告,到2020年,有70%~80%的非结构化数据将存放在被SDS(软件定义存储)管理的低成本存储上,而非结构化数据约占未来十年数据产生量的90%。所谓的软件定义存储,就是将相同或不同数据中心的各种存储资源抽象化、池化,以服务的形式提供给不同应用,满足企业自动化使用存储的需求。
成立于2014年9月的杉岩数据是一家企业级软件定义存储产品和服务方案提供商,为企业IT系统、私有云等提供存储功能,通过将多个标准化服务器的直连存储资源汇聚为一个虚拟存储池,可以单独部署或与传统存储混合部署,提供更加简单、灵活的企业级SAN服务。创始人陈坚曾在华为工作14年,2008年开始负责华为存储领域的研究和开发,2010年团队与中国移动合作开发存储式产品。杉岩数据几位联合创始人,均为当时的产品经理、首席架构师等业务骨干。
传统存储已有30多年历史,主要是通过硬件冗余保证数据安全,软件定义则是通过分布式软件弥补硬件的缺点。国内目前专注做分布式存储的公司很少,陈坚认为,主要是因为存储作为最底层的基础设施,本身对工程能力要求很高,尤其是对存储系统的理解和经验、对企业级客户需求的把握。现在有很多开源存储软件,但是真正打磨成产品,中间还有很长的路。而存储系统责任重大,一旦出现数据丢失等问题,产品很难在市场立足。
在他看来,企业级用户对存储系统的需求主要有3个。一是稳定,也就是不能停机、丢数据;二是满足实际应用需要,性价比高,大多数企业需要极致性能的业务不到10%,因此满足实际运用就够了;三是可用性好,运维简单,传统存储需要配备专门的存储管理员,管理十分复杂。我们之前的文章也谈到,传统存储存在着扩展困难、大规模集群下容错和可靠性差、iops和带宽不足、建设周期长、成本高等痛点。
基于此,团队2015年3月推出SandStone-USP统一存储系统,兼容传统SAN设备,可以应用到传统存储的应用场景,同时全面兼容Vmware/Hyper-v/KVM/Xen等主流虚拟化软件平台,而且更适合虚拟化和大数据等云计算应用场景,包括行业IT应用、虚拟桌面基础架构VDI、私有云/虚拟化以及容灾备份等、超融合解决方案。
未来的存储产品一定是与硬件松耦合,与应用紧耦合,前者是软件定义存储SDS、Server SAN、超融合,后者则是大数据、人工智能等等,这样的存储革命正在波及包括互联网巨头在内的大多数企业。杉岩数据的价值在于,为企业提供更可靠、更高性能、更具扩展性的存储系统。
具体来说,杉岩数据主要从这几个方面解决企业用户的存储需求:
•可靠性。传统存储主要通过备份来防止数据丢失,杉岩数据的做法是,通过分布式算法将同一份数据的数据块分散存放在多个磁盘上,数据以2或3副本存储,保证不同副本数据存储在不同节点上,某副本数据损坏,依然有完整数据可用,并能自动修复。
•性能。采用SSD缓存技术实现写加速,热点数据缓存在SSD高速缓存中,读请求优先从SSD高速缓存读取数据,其次从HDD磁盘中读取。
•可扩展性。性能随节点、容量增长而线性增长,可划分资源池进行故障域隔离。支持单一物理集群3-1024个节点线性扩展,在线动态新增、移除节点或磁盘,系统能自动迁移和重新平衡存储资源。
根据陈坚的统计,这套系统能帮助企业节省60%的成本,包括初始投资、机房空间、能源消耗等,运维成本下降30%,安装部署小于10分钟。
目前,杉岩数据已服务过电力、制造业、教育、政府、运营商等领域20个企业用户,SandStone统一存储软件现已部署商用项目总容量达到数十PB。产品主要按license或节点收费,平均客单价在20万左右。
团队方面,目前近50人,其中80%为研发技术人员。创始人陈坚,14年华为系统软件研发、规划及项目、团队管理经验,8年华为云计算与存储领域技术研究、产品开发、技术规划和产品规划经验,华为第一代分布式存储产品经理兼首席架构师;CTO邱尚高,8年华为虚拟化和分布式存储系统研发和项目管理工作经验,2年分布式数据库研发经验,作为项目负责人,先后参与华为第一代虚拟化、分布式云存储以及下一代分布式存储系统产品的研究开发工作。其它成员主要来自世界500强企业的专业级存储团队,平均有5年以上经验。
杉岩数据曾于2015年年底获得上海天玑数据1000万元天使轮投资,2016年,先后作为创始成员加入英特尔发起成立的软件定义存储联盟、英特尔Storage Builder Program合作伙伴计划及中国开源云联盟。