构建数据中心关机程序,做好最坏的准备

有了物理服务器,你就得把工作负载复制到另一台不在工作的物理箱中。有时候这行得通,有时候却不好整。有了虚拟化之后,就可以从最近的快照提取,而不是重建物理箱。故障转移工具现在允许整个工作负载都从一个物理主机迁移到另一个物理主机,仅仅基于虚拟化池的硬件故障。很多时候这是自动化的,用户之间的交流保持最小化。因为虚拟机在SAN上存储,它们可以复制到云上,甚至通过SAN
to SAN技术克隆。这些在以前的传统环境下是很难的。

广泛的操作系统支持

在准备过程中,还可以识别和了解数据中心内各种各样的依赖关系。记录依赖关系允许IT人员以适当的顺序重新启动系统,服务和应用程序,以避免中断和启动时间的损失。例如,工作人员不想在启动依赖的存储阵列之前启动服务器。

有两个理念为灾难恢复计划带来了革命:把所有服务器存放在一个SAN上的方式,以及虚拟化概念的提出。过去,灾难恢复主要要做的是反映物理设备,做好异地备份,确保数据中心能够应对断电等紧急情况。有了虚拟化之后,IT人士意识到它在灾难恢复方面的潜力,虚拟平台更容易迁移、备份和恢复。几乎每个大型数据中心现在都有虚拟化解决方案,所以一定要改变灾难恢复计划,以更好的配合虚拟化技术带来的好处。

Server
2008,用以支持服务器虚拟化的每个组件都集成在Windows Server 2008
Hyper-V功能中。 Windows Server 2008
Hyper-V是下一代的基于Hypervi…

检查和验证系统硬件

虚拟化为IT带来了无以伦比的灵活性,利用虚拟化,数据中心可以把工作负载各个服务器之间迁移——甚至可以在数据中心间迁移。因此,虚拟化也肩负了灾难恢复准备的责任。但是灾难恢复计划不是随便就能实现的,需要仔细的计划和定期测试,以保证公司和人员能够在问题发生时顺利执行恢复。

Hyper-V的核心应用

www.hj8828.com,以正确的顺序关闭系统

灾难恢复计划不管是物理还是虚拟化的,都得经常测试。基于环境的大小,有的组织每周测试,有的每个月测试。有很多可行的测试。例如,想要测试物理硬件的故障,工程人员可以直接关掉其中一台物理箱的电源,来保证他们的虚拟机负载能自动平衡到另一个可用的服务器上。在自动迁移到虚拟物理主机时,可以测试网络能力、故障和虚拟机健康。另一个测试方法可以确认所有不在线时的快照可用。只要从一个快照中,加速一台虚拟机,就可以确认数据整合有没有花太多时间。

测试和开发

每个数据中心关机过程都是最终重新启动的前提,所以适当的准备是确保一旦中断时间结束后重新启动成功的关键。创建一个全面的(或至少是现有的)文档集,可以捕获每个系统的卷,操作系统和应用程序配置,特别注意重新启动期间可能或意外更改的任何内容。创建此文档有无数工具,大多数现代配置管理和执行工具可以捕获和报告系统状态。不要忘记捕获或记录任何网络设备或存储阵列的配置。

可在一个虚拟机环境中最多支持四个多处理器,使您可以在虚拟机中完整享受到多线程应用程序的优势。

验证和更新系统文档

物理和虚拟灾难恢复计划是不同的。在虚拟化环境,人员必须非常熟悉他们的监控管理平台——不管是VMware还是XenServer。工程人员得了解如何使用这些平台,快速排查故障,还得训练使用软件中所有的灾难恢复功能,并且定期测试环境。实践是最有效的方法。

  • windows server
    2008上创建微软Hyper-V虚拟机

【编辑推荐】

但这会带来危险,将complacency和灾难恢复计划结合在一起不是个好主意。虚拟化灾难恢复会比较顺利,但是工程人员还得时刻注意他们的环境。关键在于了解技术和最大限度利用工具。工作负载可以实时迁移,终端用户可能感觉不到区别。你要通过练习保证所有你地虚拟化平台更新并且工作良好。

Hyper-V可以快速将运行中的虚拟机从一台物理宿主系统迁移到另一台,同时将停机时间做到最小,并可对Windows
Server以及System Center管理工具维持一样高的可靠性。

例如,在尝试启动任何存储阵列之前,打开网络设备并确认其已正确引导。一旦存储阵列打开,请检查是否有任何故障磁盘,有问题的磁盘组和其他可能的问题。

TechTarget数据中心网站Advisory
Board的专家分享了他们在虚拟化环境中灾难恢复计划的见解。讨论了如下的问题:虚拟化环境如何改变灾难恢复的准备、工具和步骤?虚拟化对数据中心灾难恢复会带来什么样的问题和挑战?会给IT人员及其发展带来什么影响?

新的硬件共享架构

数据中心关闭清单有助于IT团队在插拔硬件,并在丢失有价值的信息之前专注数据备份,测试和系统验证。

执行并验证备份

通过在宿主级别上对多处理器或多核心提供支持,以及从虚拟机内进行增强的内存访问,现在可以将虚拟环境进行垂直扩展,以便支持在同一台宿主计算机上同时运行更多数量的虚拟计算机,但同时还可保持在多个宿主之间实现快速迁移的能力。

准备数据中心关闭清单的第三步是检查硬件状态,并识别任何硬件故障。现代系统管理工具可以生成电子邮件或邮件系统的错误报告,将事件记录到日志文件中,甚至可以在全面实时仪表板上跟踪事件。但并非所有事件都能立即处理。例如,RAID6组的RAID5中的磁盘可能会失败,并重写到另一个备用磁盘,但技术人员可能需要一段时间才能更换和重建故障磁盘。在可能将虚拟机工作负载迁移或重新启动到其他可用系统的服务器上也会出现类似的问题,但是由于尚未处理,故障系统可能仍然存在问题。

Hyper-V配合现有的系统管理解决方案,例如Microsoft System
Center,可帮助企业实现动态数据中心,提供自主管理的动态系统以及操作敏捷度。通过使用类似自动虚拟机配置、灵活的资源控制,以及快速迁移等功能,创建动态的IT环境,使得虚拟化技术不仅可用于响应问题,还可用于前瞻性地增加需求。

尽管政策和流程对于现代IT至关重要,但数据中心管理员通常因为中断事件而措手不及,没有关闭需要关闭的设备。这种需求可能像暴风雨即将来临一样剧烈,或者仅仅是一次普通的市政电网升级。但是,企业准备和响应设施关闭的方式可以避免灾难带来的损失。

Hyper-V利用一整套集成的管理工具,提供了动态、可靠以及可伸缩的虚拟化平台,并以之管理物理和虚拟资源,从而允许您创建敏捷而动态的数据中心。Hyper-V可实现:

如果准备时间有限,请专注于关键任务备份。但是,任何未备份的系统或数据都将为应用程序和业务带来风险。

  • 将Hyper-V集成到Windows Server
    2008安装源

备份是任何数据中心内的一个重要过程,但在计划的设备中断之前,固态备份工作至关重要。在关机开始之前完成,并验证任何定期安排的备份,并手动备份在关闭之前未定期备份或具有长时间恢复点目标的任何系统。

网络负载均衡

组织和数据中心设施之间的实际依赖性差异很大,因此IT规划人员需要确定包括网络设备,存储阵列,DNS服务器,备份服务器和调度程序在内的启动顺序。一旦所有必需的服务器,存储,网络和关键服务(如DNS)重新联机,启动顺序就可以重新启动应用程序(如数据库),然后是依赖的应用程序(如企业销售系统)。然后,启动依赖于这些应用程序的任何流程,例如企业的店面网站。