数据库容灾建设
1.3.1 数据库容灾
数据库系统,现在已经实现业务数据集中。容灾项目建设,其目标是实现系统数据的容灾及保护,在不影响现有生产系统性能的同时,采用同省异地的方式为数据库建立一份准实时镜像,以保证在生产数据库发生灾难时可使用容灾数据库进行恢复和最短时间接管。
1.3.2 容灾快速接管
数据库系统是 7 × 24 小时运转的核心重要系统,当生产系统出现异常情况后,需要能快速切换到灾备数据库,减少对业务系统冲击,降低对终端用户的影响。为实现最短的容灾切换时间,在容在设计方案中,灾备点的 Oracle 数据库状态必需一直为启动 Stratup Normal 状态,并可随时接管业务应用,而不再需要恢复或重启数据库的动作,减少当机时间。
1.3.3 排除启动风险
数据库系统的生产系统和灾备系统都是 Oracle 数据库。 Oracle 数据库设计架构严谨,只有在所有数据文件和日志文件一致完整时才能启动工作。常见的磁盘镜像和逻辑卷复制方案,平时无法通过 Oracle 的启动方式来验证数据文件一致性。因此在容灾设计方案中,需要确保 Oracle 在任何时刻、任何情况下都能启动,或一致保持启动状态,排除 Oracle 数据库在启动阶段失败的技术风险。
1.3.4 预防阵列单点故障
大多系统数据库采用了 Oracle RAC 并行架构,两个数据库实例共同访问一个磁盘阵列,由此造成了磁盘阵列的单点故障隐患。如发生磁盘阵列损坏、文件系统无法识别,文件系统不能切换、地震等突发事故,会造成所有业务数据的丢失和不可恢复,这对业务系统是致命的。所以需要实施一套可靠的异地容灾解决方案,解决 RAC 架构带来的磁盘阵列和文件系统故障隐患。
1.3.5 分担生产系统压力
数据库系统是提供所有业务处理操作,承受着巨大的生产压力。鉴于这样的压力情况,通过建设一套可靠的容灾体系,既保证了灾备点数据库和生产数据库数据的实时同步,同时灾备点 Oracle 数据库一直处于 Startup 启动状态,可以剥离系统中的报表查询业务或智能分析等业务,实现从生产数据库迁移到灾备数据库上来获取数据,达到降低业务系统的生产数据库压力,提升征管系统运行效率的目标,充分发挥容灾备份方案在平时阶段的投资价值比。
1.3.6 预防物理坏块
数据库系统数据库采用了 Oracle 数据库,数据信息的完整性和准确性是非常重要。 Oracle 数据库存储是以物理块( BLOCK )为单位,如果一个数据块的损坏,会引发数据丢失、不完整、不准确、业务系统当机等异常情况,而现有的磁盘 COPY 复制技术或磁带备份方法,无法屏蔽此问题,因此需要通过应用逻辑层面的复制解决方案达到容灾建设目的。
1.3.7 预防人为失误
系统中的数据是容纳了用户的信息、缴费等等重要信息。如出现一些数据丢失,后果非常严重。在维护管理过程中,遇到的人为失误会对数据造成影响,比如错误的删除表或修改 INDEX ,都会造成生产系统不稳定。因此在容灾方案中,可以通过设定选择复制对象的属性,例如禁止 DDL 敏感语句的复制,或通过设定时间开关实现复制延迟等方式,降低人为失误对生产系统的影响。
|