本文转载自DOIT传媒
对象存储意义不局限在存储,也可成为衡量应用水平高低的一把尺子。
对于这个观点,杉岩数据董事长兼CEO陈坚表示强烈认同,并在朋友圈点赞。
2023中国数据与存储峰会期间,我特邀陈坚先生进行专访,又一次讨论了对象存储的话题。
——DOIT总编宋家雨
图 杉岩数据董事长兼CEO陈坚(右)和DOIT总编宋家雨(左)
我首先请陈坚先生谈谈对对象存储市场的看法。
陈坚表示,杉岩数据已把对象存储做到了传统行业市场,而不停留在公有云服务,如今随着AI、大数据业务应用的驱动,非结构化数据量呈现爆炸式增长,当这个数据规模达到PB数量级,文件数量上亿之后,如果用户继续使用传统文件系统,就会遇到很多难以解决问题,而对象存储恰好可以弥补、解决这些问题,也因如此,对象存储技术在传统行业市场的前景被普遍看好,未来值得期待!
“在接触传统行业用户过程中,我们不会一上来就谈对象存储,因为这对于他们来说,还是一个新的概念,新的产品和新的业务形态,需要一个重新学习的过程。针对这种情况,我们会先谈用户的业务痛点,谈论当用户文件数量激增,特别是包括很多小文件,其数量高达几十亿、上百亿规模的时候,所面临的文件查询、检索速度缓慢问题。”他说。
他特别列举了高端制造业用户的案例。
智能制造如今普遍采用人工智能的技术替代人工进行质量检测、监控,这个过程中,工业机器人会现场拍摄大量产品图片,并借助AI算法对于产品质量进行验证,把控产品的良率。工业机器人所拍摄的这些原始影像数据,会应消费者客户请求长期保存,用作产品质量追溯。
在以往的业务场景中,用户都会选择NAS,也就是文件系统来保存、管理这些非结构化数据,但随着数据的不断积累,其数据量就会累计达到亿级的门槛,导致数据检索速度无法满足需求,如业务要求的速度是10秒钟,但文件系统基本只能实现分钟级的响应,从而出现性能上的偏差,这就是高端制造行业用户普遍面临的问题,急需走出困境。
为什么现有的NAS没有办法满足需求呢?
陈坚也给出了技术上的原因。NAS采用的目录树结构的技术,其元数据所记录信息主要是:目录、文件名、文件大小、文件创始时间等信息。与之相比,对象存储采用的类似哈希计算的方式来定位文件位置信息,其元数据也记录了更加丰富的文件语义信息,它们由业务系统生成,以标签形式记录在元数据中,当需要进行数据的访问、检索的时候,就可以在元数据层进行标签的查询和检索。
“这就像同样一张身份证影像,NAS系统通过目录、文件名等信息,可以检索到其对应的PDF等影像。但NAS不会理解‘身份证’意味着什么?因为它没有记录语义信息,因此也就没有办法通过‘身份证’这个意义信息展开检索和查询。”陈坚说。
相比NAS文件系统,对象存储更加贴合业务应用,具有先天的技术优势。对象存储技术和业务应用结合的特点,为创新业务应用提供了想象的空间。
除此之外,陈坚也指出了对象存储的技术在数据访问方式上的优势。
NAS文件系统数据访问是基于局域网技术,在一个企业网内部数据共享的限制;与之相比,对象存储更加灵活,它属于云原生架构,可以使用HTTP协议、通过互联网来访问数据,因而更易于满足互联网+等应用场景实现,以保险行业为例,很多保险公司通过互联网,支持用户对保单信息的查询和访问,提高服务水平和用户满意度,这些NAS难以企及,但数据访问的难题被对象存储技术轻松化解。
“NAS文件系统和对象存储不是零和博弈。”陈坚说。
所谓非结构化数据统一存储平台,就是同时支持NAS和对象存储的访问,况且很多用户已经习惯了使用NAS。但是与此同时,也有越来越多用户开始了解、熟悉,并开始使用对象存储技术,并将其与业务创新更好融合。
陈坚表示,从长远发展来看,对象存储技术会呈现一个上升格局,超越NAS市场规模,也只是一个时间上的问题。