软硬兼施 降低电子邮件归档存储成本
邮件系统的投资并不大,对于小企业而言,投资两万元足以构建企业邮件系统;对大型企业而言,十余万元也能构建企业的核心邮件系统。但是愈演愈烈的垃圾邮件等邮件安全问题以及邮件搜索与归档问题都无法得到有效解决。
对企业而言,邮件系统是必不可少的。邮件系统的投资并不大,对于小企业而言,投资两万元足以构建企业邮件系统;对大型企业而言,十余万元也能构建企业的核心邮件系统。但是这样的邮件系统在目前的网络环境下是难以使用的,因为愈演愈烈的垃圾邮件等邮件安全问题以及邮件搜索与归档问题都无法得到有效解决。
简单存储是不够的
为了进行灾难恢复,需要对邮件进行备份,这是邮件存储的最初要求。这其中最为典型的就是磁带备份。磁带备份容量大,价格相对较低。不过如果想在备份邮件中进行查询,需要将磁带一盘盘恢复到系统上,然后在邮件系统中查询。由于邮件系统检索功能很弱,要查找某封邮件无异于大海捞针。
另一种方案是将系统数据定期拷贝到离线存储设备上。这种方式存在几个弊端:一是容易出现重复拷贝现象,浪费存储空间;二是无法保证数据的完整性,如两次拷贝之间删除的文件无法备份;三是成本高,一般要用NAS或者SAN大容量存储设备,或者必须使用大型厂商的专用系统才能实现。
这两种简单的方案一般是专门针对某些企业而设计的,已经实现了从数据层到应用层的跨越。但这类方案通常只能满足一个或几个方面的法规需求,无法为企业提供全面而专业的、遵从各种现有法规的专用归档解决方案。
法规遵从让成本上升
法规遵从归档(Compliance Archiving)设备,是专门应对各种目前现有的法规、取各种法规的最大并集而设计的专业归档系统。法规遵从需要企业在业务运作中守规矩,遵守政府和行业制定的各项法律、法规及各种规章,并且对信息具备足够的可控性。
一个完善的归档系统应该具备以下几个功能:一是存储仓库功能,存储仓库收集所有向外发出和从外收到的以及内部的邮件数据;二是搜索及数据挖掘功能,能够通过搜索查询到相关的邮件信息;三是法规遵从性的需求,整个体系的设计应遵从法规,如不能删改数据等。从成本构成看,归档系统由存储系统和归档软件两部分构成。相比邮件备份,归档系统注重搜索,磁带机这种成本非常低的设备无法实现上述功能,必须使用大容量磁盘介质。这使得邮件存储成本大幅度提高。此外归档需要对备份的邮件构建索引数据库,以便进行搜索。法规遵从要求系统增加的许多功能导致归档软件比简单的备份更加复杂,这使得归档系统的成本进一步上升。邮件备份、归档特别是法规遵从使用户对邮件系统的投资直线上升。大型企业实施法规遵从的邮件归档体系可能需要投资上百万元甚至上千万元。
不要以为这些投资是不合算的,国内某企业因为邮件系统不合法规,被罚款2000万元。而其实施法规遵从邮件存储解决方案预计只需不到1000万元。在这样的背景下,我们应当如何降低邮件归档系统的成本呢?
方案选择应因需而定
1 . 选择备份还是选择归档。如前面描述可知,归档特别是法规遵从的归档系统成本大幅度提升,因此企业用户首先需要明确自己存储的目的。如果用户仅仅是为了进行灾难恢复,那么只需要简单的备份就可以了。通常邮件系统都支持联机备份或脱机备份。通常情况下,利用邮件系统自带的工具就能完成,也可利用第三方工具对备份内容进行选择,其可操作性往往比系统自带的要好。
2 . 备份时间及介质的选择。备份的介质主要分为两大类:磁带和磁盘。磁带介质有其局限性,容易发生质变。因此隔一段时间需要对数据重新翻读一下,如果有问题,则需要更换磁带。但是磁带价格低,存储的数据量大,适合需要存储大量数据的用户。而磁盘是在一个真空的实体里面,它的盘片不会受到影响,所以它的保留时间是非常长的,磁带坏了就不能用,但磁盘是可以修复的。对于邮件备份而言,几TB的数据容量,能够满足小型企业几年的数据需求,因此企业完全可以选择磁盘长期保存数据。
3 .法规遵从邮件归档的成本控制。前面介绍的两种情况适合一般企业的邮件存储需求。但在当前信息化广泛应用的背景下,企业和组织不仅要考虑经济指标的增长问题,还要关注是否符合社会法规和行业标准的问题。美国的很多政府法规和规章都十分详细。例如,《美国医疗保险信息交换与保密法案 (HIPAA)》规定美国公司必须保护人事数据,医疗保险提供商必须保护病人信息。
其中有些指标的规定还十分具体,如:很多法律程序会要求电子邮件的查找过程必须在72小时内完成,对某些特定信息要求保存的时间长达7年。
控制成本的两个步骤
首先是确定邮件存储的内容,不是所有的邮件都需要存储,并且不同性质的邮件需要存储的时间要求是不等的。业内人士把邮件存储中经常遇到的问题称为Bacn,也指那些既不是重要邮件也不是垃圾邮件的邮件,包括新闻邮件、同接收人有关系的公司的广告邮件以及各种人力资源邮件等。简单地说垃圾或病毒邮件都可以不存储。对Bacn邮件的解决方法和垃圾邮件的解决方法相同,就是过滤。如果不对垃圾及病毒邮件进行过滤,将导致大量的存储浪费。国内某知名ISP调查显示,其所收到的所有邮件中垃圾邮件占总邮件数近85%,消耗80%的带宽流量,消耗50%以上的带宽资源,除垃圾邮件外的10%到30%的电子邮件都是Bacn邮件,不仅堵塞收件箱,还影响搜索结果。
- 本文关键词:

