在混合办公时代,数据保护变得更加复杂。为了保障安全和业务连续性,企业需要一套覆盖各类环境终端的备份策略,从员工 PC、多平台服务器到 Microsoft 365。然而,由于这些设备通过外部网络连接,延迟和不稳定性常常在备份过程中造成带宽压力。
传统备份方案通常只在数据到达服务器后进行重复数据删除。虽然这可以减少备份设备的存储占用,但无法解决传输过程中的高网络负载问题。
为了解决这一问题,Synology ActiveProtect 采用了源端全局重复数据删除技术。该技术在受保护设备上于数据发送到服务器之前进行去重,大幅降低了备份过程中的网络负载。
Synology ActiveProtect ,为高效而生的架构
ActiveProtect 在源端通过标准化的多步骤流程处理每一次备份。每台受保护设备的数据会依次经过以下模块:

- 分段:将所有数据划分为标准的 4 KB 数据块,作为处理的基本单元。
- 版本重复数据删除:将数据与设备的上一次备份进行比对,以识别新增或修改的数据。
- 全局重复数据删除:将数据与整个组织中所有已备份的数据进行比对,以检测重复项。
- 寻址:定位新数据块,并为重复数据创建轻量级指针。
- 压缩与加密:对新数据进行压缩和加密。
- 上传:将优化后的数据传输到备份服务器。
该流程依赖于两个关键的过滤步骤:版本重复数据删除和全局重复数据删除模块。下面我们将详细了解它们的工作原理。
版本重复数据删除模块:精准识别真实变更
该模块用于判断自上次备份以来设备上哪些数据发生了变化。其通过以下流程利用更改块跟踪(CBT)实现:
- 标记更改块:系统通过 CBT 标记已修改的数据块,排除未变更的数据,仅处理相关数据块。
- 生成数字指纹:对于每个被标记的 4 KB 数据块,系统会使用 SHA-256 算法生成唯一的数字指纹。
- 比对与过滤:代理程序将指纹发送至备份服务器的核心服务,核心服务会与上次备份的指纹库进行比对。匹配项会被标记为重复并跳过,仅将新数据块传递到下一阶段。
该机制将完整备份转化为增量更新。通过将比对逻辑从代理程序转移到备份服务器,可以减轻用户设备负载并提升稳定性,确保本地问题不会导致备份失败。
全局重复数据删除模块:最大化集体备份价值
此时,这些数据对该设备来说是新的,但它们是否已存在于组织内的其他地方?全局重复数据删除模块正是为解答这一问题而设计。
通过使用集中式指纹数据库跟踪每台受保护设备的数据,该技术确保每次备份的数据都能帮助减少后续所有备份中的重复项。
当一台新的 Windows PC 进行首次备份时,没有可供比对的历史版本。但系统仍可利用全局指纹数据库识别已从其他设备备份过的常见操作系统文件和公司设置。
在这种情况下,核心服务会通知代理程序该数据为冗余数据,可直接跳过。因此,PC 的首次备份仅传输个人设置和唯一文件。全局重复数据删除从首次备份就节省了时间和资源,打破数据孤岛,确保全组织范围内的重复数据只存储一次,从而减少带宽和存储占用。
轻量级代理,强大后端
您可能会担心在源端进行数据去重会影响用户计算机的运行速度。性能问题正是我们开发过程中关注的重点。
ActiveProtect 代理不会做出重复数据删除的决策,而是作为高效的通信者。其职责包括:
- 将数据分割为数据块并计算指纹。
- 通过高速 API 与备份服务器的核心服务核查指纹是否存在。
- 根据核心服务的回复执行相应操作。
当核心服务识别出数据为重复时,代理不会发送该 4 KB 数据块。寻址模块会生成指向现有数据的精简指针,上传模块只发送该指针。
只有在核心服务确认数据块为新数据后,代理才会对其进行压缩、加密并上传。诸如指纹比对和数据库查询等资源密集型任务均由 ActiveProtect 备份服务器处理,从而最大程度减少对用户设备的影响。
结论
在当今分布式 IT 环境中,网络带宽是一项关键挑战。ActiveProtect 通过源端全局重复数据删除技术,有效减少需要通过网络传输的数据量,从而解决了这一难题。
通过分层过滤和轻量级代理,ActiveProtect 可确保备份在后台安静高效地运行。系统运行稳定,不会占用企业所依赖的网络资源,为 IT 数据保护与管理提供了切实支持。
