NetApp:100 年归档您准备好了吗?

长期归档最大的挑战是逻辑迁移。
《信息周刊》网络版
发表时间:2008-8-27

作者:NetApp 全球实践总监 Gary Zasman

Gary 担任 SNIA 长期归档和法规遵从存储计划 (LTACSI) 的主席。他还是业务应用程序和数据库集成方面的 NetApp 全球实践开发的领导者。在 2006 年加入 NetApp 之前,Gary 担任过领先存储供应商的多种职位,主攻 ILM 解决方案的开发和咨询实践。2001 年,Gary 工作的团队在开发可视化历史数字归档领域进入决赛争夺著名的计算机世界奖 (Computerworld Smithsonian Award)。

拿起 100 年前的书,您也许可以毫不费力地进行阅读,但读取哪怕只是 10 年或 20 年前的备份磁带,可能要困难得多。即使具有正确的硬件来读取磁带(且磁带本身仍然完好),您还是需要知道磁带的写入格式,且需要可以识别此数据的应用程序。情况可能会非常复杂,且随着时间的推移只会变得更麻烦。此时您也许会想:“没什么,我不需要将数据保存那么久。”请再考虑一下吧。

2007 年,存储网络工业协会 (SNIA) 完成了一项全面调查,在该调查中我们采访了来自世界各国各种组织的数百人。令人惊讶的是,80% 的人说他们的信息必须保存 50 年以上,68% 的人说他们的数据必须保存 100 年以上。足足 70% 的人还报告他们对阅读 50 年内所保留信息的感知能力很不满意。他们最关心什么类型的数据?电子邮件、客户记录、企业应用程序数据及数据库 — 我们大多数人每天处理的信息类型。还想再关注吗?

在本文中,我将解释长期归档面临的挑战,讨论您现在可以使用的一些最佳实践,以及通过我担任主席的 SNIA 长期归档和法规遵从存储计划 (LTACSI) 谈谈正在进行的工作。

长期归档面临的挑战是什么?

简而言之,我们需要保留信息的时间(即使使用相对保守的 50 年图)远远超过存储系统(磁盘或磁带)和应用程序的典型生命周期。甚至保留期还要很久才过期,物理介质就开始退化,变得无法读取。

当前的实践是每隔 3 至 5 年迁移数据(同时在物理上和逻辑上)。物理迁移需要将信息从一个物理存储系统移到另一个系统,或从一种介质格式移到另一种格式以维持物理可读性、可访问性和完整性。这种类型的迁移的推动因素包括介质故障、介质或存储系统过时、系统更改及运作成本(人员、电力、空间)。

逻辑迁移需要将信息从一种逻辑格式移到另一种格式(如从应用程序的旧版本移到新版本),以保持可读性和可解释性。推动因素可能包括更改应用程序格式、过时的应用程序及合并。这两种迁移类型的障碍因素包括成本、复杂性、巨大的信息量以及时间和/或预算的不足。

上述 SNIA 调查表明,逻辑和物理迁移不能有效地规模化成本来满足当前和未来的需要。事实上,只有 30% 的被调查者每隔 3 到 5 年迁移磁盘上的数据。显然,需要使用新的方法来满足长期数字信息保留的法律、法规、业务、成本及可扩展性要求。
 
过渡解决方案

由当前存储系统和应用程序引起的限制近期不会消除。那么,现在您应采取什么措施来解决长期保留问题?当前最佳的建议是,针对您的应用程序、操作及数据存储库实施正式生命周期管理流程,以在使用寿命中解决数据管理的效率问题。最佳实践应包括: