联系方式

售后服务热线

售后服务热线 400-838-3331转3

售后服务热线

关注官方公众号

服务邮箱

服务邮箱 support@szsandstone.com

服务邮箱

关注杉岩小助手

华天科技:分布式对象存储在集成电路封测工厂的应用

分类:最佳实践 发布时间:2026年03月03日
分享:

随着集成电路封装测试工艺日益复杂,封测过程中产生的数据呈指数级增长。封测数据具有海量性、多样性与复杂性的特点,传统的存储方案已难以满足要求。杉岩数据基于分布式对象存储底座打造的检测数据存管用一站式解决方案,帮助全球知名的半导体集成电路封测企业天水华天科技,打造产线数据统一存储与管理平台,实现了海量数据的高效汇聚、长期安全存储、集中统一管理和便捷查询调用,合力推动半导体封测工厂向智能化升级。

本文基于该项目实践,分享分布式对象存储和杉岩检测数据管理系统IDM在集成电路封测工厂的应用实践。

045ef7c33588ee37c1fbaa7048acedf7.jpeg

本文发表于《中国集成电路》2025年12月刊,原标题《分布式对象存储在集成电路封测工厂的应用》,已获转载授权。

作者:王兴刚,天水华天科技股份有限公司总经理助理;魏峰,天水华天科技股份有限公司IT工程师;周军德,天水华天科技股份有限公司IT部长。


引言

集成电路广泛应用于消费电子、工业控制、汽车电子等多个领域。随着智能化进程的加速和新兴技术的迅猛发展,集成电路需求呈爆发式增长,集成电路生产工艺不断向高集成度、高性能、小型化演进,封测工艺日趋复杂,封测生产过程中产生的数据也呈指数级增长,封测企业的数据管理面临存储容量与处理效率的双重挑战。

现有存储方案的困境与挑战

封测行业数据具有海量规模、多维形态和系统复杂性、存储周期长的特征。生产过程涉及七大主要业务环节,数十道生产工序,如表1所示各个业务环节产生了多维的非结构化数据。每日产生约1TB以上数据需存储。部分数据需实时采集分析,用于工艺参数调整。存储系统需按产品等级实施差异化存储,并具备自动生命周期管理功能,到期后自动清理过期数据以节约存储成本。封测厂传统非结构化数据存储方式主要分为两类:设备本地硬盘存储和NAS存储。

表 1 封测生产流程

设备本地硬盘存储

设备本地硬盘分散存储,数据物理隔离导致数据整合困难,需人工提取且易出错。本地硬盘容量有限,如 AOI 设备配备 20TB 硬盘仅能存储 3~4 个月的数据,存储饱和时需停机手动备份。本地硬盘易受磁盘损坏、病毒感染、人为误操作等因素影响容易造成数据永久性丢失,零散的数据存储无法满足系统性数据追溯与分析需求。

NAS存储

NAS 存储为多个客户端提供集中式数据存储服务,方便用户对数据的使用,但高并发读写时性能显著下降,容量扩展需停机配置,性能提升无法匹配数据增长需求。NAS 设备配备了诸如RAID 技术的数据冗余机制,若单一NAS 设备遭遇故障,整个存储系统将陷入瘫痪。随数据量增长,持续购买大容量本地硬盘或高性能NAS 设备,增加存储运维成本。

因此需要设计一种新的存储方案,以满足海量数据存储与访问。

分布式对象存储方案研究与系统设计

相较于 DAS、SAN、NAS 等传统集中式存储技术,分布式对象存储展现出诸多优势,故本系统选用分布式对象存储做存储方案 [1] 。分布式对象存储由众多分散的存储节点协同工作,数据跨多个节点冗余存储,有效避免单点故障,即使部分节点失效,系统仍能依靠副本或纠删码技术确保数据完整性,维持正常运行。其核心思想是将对象数据分散存储在多个存储节点上,以实现高可用、可扩展和高性能[2]。

系统业务架构设计

将多端数据汇聚,进行统一管理,形成数据池,提高查询追溯的效率。系统根据数据特性自动定义标签,实现分类管理,提高数据检索的维度。支持数据冷热分层,根据数据类型进行全智能生命周期管理。支持API 和主流文件传输协议,方便与其他业务系统进行集成和调用。系统整体架构如图1所示。

图1 系统架构

性能优势

以 6 节点部署为例,依托集群提供的聚合带宽,提高数据访问速度[3]。如图2所示,随机向单节点文件存储和分布式对象存储写入大小为30 MB的数据,分布式对象存储受并发量增长影响较小,可快速写入。但单节点文件存储随并发量的增长,受磁盘I/O影响,写入速度明显降低。


图2 分布式对象存储与单节点文件存储写入性能对比

系统扩展能力

分布式对象存储支持存储节点热扩展,按需添加存储节点,系统自动实现数据的重新分布均衡,存储容量与性能几乎线性增长。通过数据自动分层机制将冷数据存储成本大幅降低,与某封测厂原有存储方案对比,降幅达40%以上。

数据治理与系统管理

采用数据与元数据分离管理机制,扁平化的对象存储架构,通过元数据实现高效检索与访问。原生 S3 兼容接口支持高并发请求,有效提升多源异构数据管理效率。构建统一运维平台降低运维成本[4]。通过数据采集管理平台实现标签策略配置、数据自动采集任务监控。提供统一数据查询入口,支持检索、预览、下载及生命周期管理全流程操作。

数据冗余安全

结合封测厂数据特点,以 6 节点部署为例,采用4+2纠删码的方式进行数据冗余,分片数据和纠删码分别随机落盘至 6 个节点上,如部分数据块丢失也可以通过冗余块恢复原始数据,相比多副本存储可节省存储成本。数据安全方面,当检测到数据损坏或丢失时系统自动通过冗余块进行数据恢复。如图3所示。

图3 数据安全

方案实践效果与分析

本研究基于分布式对象存储系统构建的工业数据管理平台,在某封测厂生产实践中的以下3个场景取得显著应用成效。

MES系统与对象存储的深度集成架构

过去为提升文件检索效率,文件以二进制形式存储在关系型数据库,导致数据库容量激增,形成备份与灾难恢复等瓶颈。对此采用元数据索引与对象存储的混合架构,无需重构现有MES等应用系统,通过 S3 接口将非结构化数据转存至对象存储,数据库保留关联业务的元数据用于定位对象存储中的实体文件地址。针对历史数据,开发迁移工具可将数据库内的文件剥离转存至对象存储,保留原业务元数据关联关系,实现存储结构的平滑迁移。

在 6 个月对比实验中,混合存储方案将数据库体积从12 TB 压缩至1.3 TB,数据库全备份时间由10 小时缩短至 50 分钟,文档检索响应时间从 1200 ms 优化至300 ms,读写效率与存储成本显著改善。针对 3 类典型存储场景的重复测试(取中间6 次均值),性能测试结果如图4所示。

图4 性能测试结果

生产数据自动采集

如图5所示,通过在设备部署轻量级数据采集器并配置管理策略,实测吞吐率达 2 TB/ 小时,实现7 ×24 小时在线采集[5]。结合MES 系统实现对象标签化与生命周期管理,运行 6 个月累计存储 2.8 亿对象,使用空间 804 TB,显著提升数据存储、管理、使用能力。

图5 生产数据自动采集

构建全过程数据可追溯平台

融合MES、生产自动化系统的结构化数据和分布式对象存储平台非结构化数据,建立完整的生产数据档案,形成全面的追溯体系,实现汽车电子产品生命周期内非结构化数据100%可追溯。如图6所示,通过建立生产对象、生产过程、生产规则等关键数据的关联,实现生产数据的完整映射与动态追踪。在追溯机制设计上,采用工单驱动的数据检索策略,用户通过工单编号可检索全维度生产数据。有效解决了传统追溯系统中数据孤岛、信息断层等问题。

图6 全过程数据可追溯平台

总结

在集成电路封测领域,分布式对象存储系统正加速向智能化数据中枢演进,呈现多元发展的趋势。作为计算机集成制造体系的核心数据底座,与大数据等前沿技术深度融合,借助人工智能大模型的智能预测与推理能力,挖掘数据价值为工艺改进、质量管控提供支撑。分布式对象存储在集成电路封测领域的应用已超越基础数据存储功能,正逐步演化为支撑智能制造的核心平台。

参考文献

[1] 刘仲, 章文嵩, 王召福等. 基于对象存储的集群存储系统设计[J]. 计算机工程与科学, 2005,(02):78-81

[2] 杨传辉. 大规模分布式存储系统: 原理解析与架构实战[M]. 北京:机械工业出版社, 2013:6-63

[3] 屠雪真, 黄震江. 一种海量小文件对象存储优化方案[J]. 计算机技术与发展, 2019, 29(08):31-36

[4] 胡豆豆, 罗飞, 张园. 对象存储系统的自动化管理技术[J]. 电信科学, 2017, 33(11):154-161

[5] 闫丽飞, 褚宇宁, 赵维伟等. 大规模非结构化数据资源快速存储方法研究[J].集成电路与嵌入式系统, 2024, 24(04):77-81


我们重视您的隐私

我们使用 cookie 来个性化和增强您在我们网站上的浏览体验。点击“接受所有 Cookie”,即表示您同意使用 Cookie。您可以阅读我们的Cookie 政策以了解更多信息。

电话咨询

服务热线

400-838-3331

更多联系方式

顶部

扫码关注