图片 11

云计算环境下数据中心管理运行探讨

一、云计算的概念及特征

对于三层式模型,中间管理层统一了来自云服务管理平台的指令和自身的运维变更指令,形成一致的操作集下发,保证了操作的统一性。特别是对云计算而言,上层服务的部署、变化总是会涉及到底层多个系统之间的相互关联性变化,如虚拟机动态计算的特点使得其网络位置发生变化,存储资源也会因为数据迁移产生位置变更,这都涉及到计算、网络、存储各个对象之间的信息交互、协议通告、连接性检查等处理,以保证云服务的连续性与持续性。数据的流转与基础协议交互发生在第三个平面,但是在中间层不同资源的管理控制系统之间也主动进行信息传递,如虚拟机管理系统与网管系统之间交互计算迁移、状态与位置等信息,这使云服务的管理过程更为精确和可控,能够实现全部IT基础资源之间的关联性,并使得云计算的部署逐步走向更为完善的自动化。

目前来看,由于
Docker的部署非常灵活,往往是“碎片化”的,这加大了对其自身的运维难度。随着容器技术的进一步发展,
Docker 可能为运维带来巨大的革命。

(4)使用的便捷性

适用的数据中心管理运行模型,不仅可以使业务模型清晰可靠,并能极大提升业务运行能力,使得传统数据中心的运行机制得到重用。但是,不同的云计算服务模式有其自身特点,基于自身的运行能力、已有系统的要求,选择并演进到适合每个云计算数据中心适用的模式,需要用户、厂家、服务供应商持续的适配、调整才能优化形成。

IT运维转型升级机会大,细分领域将涌现龙头企业

2、IT规范化主要是指通过对企业IT的规范化,从而有效实现对企业IT资产的管理,包括了对企业重要文件资料的跟踪与审计、对可能出现泄密或病毒蔓延的介质与设备进行有效控制、对客户端安全分级管理、恢复性操作以及非法软件的禁用等等。通过实现IT规范化,有效解决了因云服务所引发的安全问题,并且强化了服务中运营管理与安全技术保障,增强了企业和用户对使用云服务的信心。

在自动化响应的管理关联结构上,云服务的提供需要将业务需求转换为对基础资源的部署要求,并形成相应的底层配置下发到不同的设备上,同时在服务变更(包括容灾、虚拟机迁移、扩展等资源的操作与调度)过程中,能够全方位调整底层设备的配置、功能、对接,以匹配业务需求。

图 19:应用性能管理的发展阶段 图 20:应用性能管理未来的发展趋势

三、对当前云计算运维管理的改进研究

就目前国内用户应用情况而言,用户对计算、网络、存储分离的管理运行已经形成很好的经验,这在云计算环境下依然是很好的借鉴;在考虑向云计算转型/演进的架构上,服务交付与IT运行可能是相互独立,但又是前者依赖后者、后者以前者为目标的业务方式,这就要求云的管理运行架构既要有很大的灵活性,又要有对基础层面控制的精准性。模型一是当前很多用户认为很自然的结构,因为这个模型很含糊地掩盖了云服务与云基础架构运行的差别,模型二与模型三则展开了云计算的运行框架要求,同时还融合了传统IT的运行管理模式,使得用户的IT模式以渐进方式迁移到云服务。

其一,运维服务人员工作忙碌却不受重视,传统的“救火式”运维大大增加了运维人员的工作强度和工作压力,难以量化的工作得不到业务部门的认可。

为促进当前云计算运维管理的优化与改进,应从打造一体化的的运维管理模式,并将业务导向放在首位,从而有效实现完善、成熟的IT运维服务体系的构建。

三层管理模式更进一步的好处是,中间管理层作为对基础资源层面的指令层,因其完全由软件构成,具有需求变化的能力,即能够封装多种来自服务层面、异构系统之间的互操作信息,形成下层易执行的指令下发到基础设备上。如图6所示,每一种基础资源与其管理软件构成了一个灵活的按需变化的IT系统,它们对外的变化接口主要由管理软件来实现,当前通用的SOAP/RESTful等接口已经广泛用于软件系统之间的调用,以EVB技术实现为例:网络与网管之间完全紧耦合实现网络系统内部的运行控制管理,虚拟管理中心与服务器虚拟化系统之间完全紧耦合实现虚拟计算内部的运行控制管理;在Infrastructure
Tier层面,网络与虚拟机系统之间通过标准技术EVB来实现数据互通与协议交互,这是整个云计算得以实现自动化、动态性、关联性的基础互通标准要求。而在控制层,网管系统与虚拟管理中心则通过SOAP/RESTful接口方式可以灵活定义这两种异构系统之间要求传递的信息(虚拟机标识、业务类型、网络标记、网络属性等),从而实现了整个云计算系统的底层数据流转、控制层面业务属性流转。

【嵌牛导读】:云计算时代,IT运维迎来转型升级。传统 IT 运维问题日显, IT
运维转型是必然趋势;云计算时代的 IT
运维转型升级向云运维方向发展,包含两方面内涵:运维技术的云化和对云的运维;市场对高效运维的需求和云计算、大数据等技术手段是云运维得以兴起的根本原因。

云计算可将大量计算资源在一个公共资源池中集中。并通过租用的方式以实现计算资源的共享,所提供的资源网络即被成为云。云计算不仅能够使用户对资源能随时获取与存储,并按需使用,而且利用其庞大的计算机群以及数据挖掘技术,为用户反馈出准确、详尽的结果,确保了用户服务的多元化与高效性。

三、如何选择合理的运行管理模型

IT 运维服务管理不规范;

云计算在企业运营中的基本工作原理是将计算分布在大量分布式计算机中,从而使企业数据中心的运行和互联网更为相似。通过云计算的运维管理,企业不仅能够实现对IT资源的统一,根据用户的需求提供可量化的存储服务与计算,而且还能有效将资源切换到实际需要的应用中,提高了IT资源的利用率,降低了系统的成本。因而加强对云计算运维管理的要点和改进方式的研究,从而使云计算在企业运营中能发挥出更大的效力,在当前有着重要的现实意义。

图3集中统一的云计算运行管理模型

图片 1

1、一体化的管理模式一体化是指云计算的数据中心运维管理,是数据中心生命周期中最后一个也是历时最长的一个阶段,从前期应用架构设计、软硬件资源配置评估、应用服务性能瓶颈评估到安全防护和系统优化等工作,都需运维人员全程参与。因此在对云计算运维管理的改进中,应从日常监控、周期巡检、服务受理、故障处理、平台维护、配置管理、安全管理等方面着手,利用自动化运维工具,实现对物理资源、虚拟资源的统一管理,提供资源管理、统计、监控、调度、服务管控等端到端的综合管理能力,从而实现对云数据中心统一、便捷、高效、智能的一体化运维管理。

姓名:张刚 学号:17021210979

(3)服务的安全性

这种结构虽然在一定程度上实现统一的业务部署、基础资源的自动化调度,但局限性很明显。不同的IT系统有其固有的专业性,网络、计算、存储各个系统的监控运行、故障处理、软硬件升级、容量与规划完全不同,要在一个管控系统中既做到业务的统一,又做到基础管理的全面,不仅对这个系统本身的规模、复杂性、功能性、专业性提出了挑战,而且对于支撑管理运行的团队,也在操作配合、知识体系、专业交叉上产生了巨大的复杂度。

Docker
支持在非常低的额外开销的情况下,打造一致性的运行环境,这或将为运维带来大变革。

云计算为现代化的运维管理体系带来了新的理念,将传统运维工作中的大量重复性、简单的手工工作通过软件实现,从而使运维人员能有更多精力、条件投人到整个服务的生命周期当中。我们应当加强对云计算运维管理的要点以及相应改进方面措施的研究与探讨,以此不断提高IT运维质量,实现高效的运维管理。

图片 2

首先,随着互联网各类业务规模的扩大,数据中心作为互联网业务的基础设施,其需求发生爆发式增长,重点需求对象为银行、电信、政府。伴随数据中心增长的是对高效运维的需求,因而市场需求成为云运维兴起的推动力之一。

四、总结

为了实现灵活的云计算服务,有些人提出了一种以统一集中的方式进行数据中心基础架构的运行管理模式如图3所示)。这种模式下,云的操作管理平台能够对计算、存储、网络进行整合,在用户操作平面上形成单一的界面,在逻辑结构、运行结构上很清晰,管理层次少。

【嵌牛鼻子】:智能化     自动化    可视化

2、将业务导向放在首位运行维护服务能力的四个关键要素分别是:人员、资源、技术和过程。每个要素通过关键指标反映运行维护服务的条件和能力。将业务导向放在首位,就是对人员、资源、技术和过程这四个关键要素的提升。从而有效实现云计算运维管理的改进。首先,应通过现代化与自动化的运维工具完成系统预备、配置管理以及监控报警等功能,降低故障发生率,提升故障发生后的响应处理效率,实现企业业务的快速恢复;其次,应做好在运维管理中新业务的快速部署、系统容量的平滑扩容以及资源分配等各个方面的业务项目,从而保证服务达到相应的等级标准,并能根据业务目标形成IrI’服务的管理目标;最后,还应当通过改进运行维护服务能力与管理过程中的不足,以持续提升运行维护服务能力。

模式一:集中统一的云计算运行管理

云计算、大数据时代下,传统 IT 运维服务出现瓶颈, IT 运维转型是必然趋势。

传统数据中心,基础架构层面设备之间通过标准化连接和协议互通,保证了计算、存储、网络设备的管理系统之间相互分离、独立如图1所示),从而使得不同的运维团队可以按照自身业务发展与架构演进的趋势不断完善和深化各自的管理规程,满足数据中心业务不断发展的要求。

面对数据数量、数据种类、数据速率以及数据复杂性的不断增加,企业需要一种全新的数据分析方法,而通过将
APM软件和大数据环境集成,企业能够有效消除性能低下、可用性不足及可扩展性不佳所带来的风险和成本,因而未来应用性能管理将成为大数据解决方案的不可或缺的要素。随着应用性能管理触角的不断延伸,性能调优的范围会深入到整个IT
领域的方方面面,监控数据将爆炸性增长,用户的地域和层次也将呈现多样化。在此背景下,传统的应用性能管理模式已经不能满足要求,基于公有云SaaS
交付的应用性能管理将成为主流。

云计算中的分布式数据中心,可将云端的用户信息备份到地理上相互隔离的数据库主机中,甚至用户自己也无法判断信息的确切备份地点。该特点不仅仅提供了数据恢复的依据,也使得网络病毒和网络黑客的攻击失去目的性而变成徒劳,大大提高系统服务的安全性与容灾能力。

在云计算环境下,各自独立分离的运行模式不能支持云服务的展开,新的IT运行模式对传统的管理架构提出了挑战:

图片 3

云计算管理软件将整合的计算资源根据应用访问的具体隋况进行动态调整,包括增大或减少资源的要求。因此云计算对于在非恒定需求的应用,如对需求波动很大、阶段性需求等,具有非常好的应用效果。

统一的服务平台能够屏蔽云服务供应层面对底层不同架构的差异,使得用户或业务运营部门聚焦在服务层面,不必关注云计算资源(计算、网络、存储)本身的技术属性。

4)国内企业如华胜天成、 广通软件、
北塔软件、银信科技和新华三等纷纷推出云运维相关产品。

3、自动化处理随着当前IT建设的不断深入,以及云计算能力和规模的扩大,云计算运维管理的难度与复杂度也日益增加,如果只是依靠人工的运维管理将无法满足当前企业的发展需求。这些新特性都对IT管理的自动化能力提出了更高的要求,企业需要更高程度自动化处理来以此实现运维管理的专业化、流程化与标准化。自动化管理已然成为了当前云计算运维管理的一个必然发展趋势。

图6异构系统之间的灵活接口方式

其三,技术人员难培养,流动性大,有经验的技术人员因为不受重视而辞职,造成运维质量和客户满意度的波动。

1、运行监控云计算的运维管理应从数据中心的日常监控人手,对日常维护管理、事件管理、变更管理以及应急预案管理等进行全方位的日常监控,以提前发现问题并消除隐患。通过对云计算良好的运行监控,从而实现对各个系统服务的统一管理,以及对各服务操作系统应用程序信息的统一收集,并实现对各层面信息的综合分析、归纳和总结。而且通过有效的运行监控,在系统出现问题时能及时的向系统管理员预警,从而提前解决问题,有效避免了因系统故障而导致企业蒙受经济和信誉上的损失。

图片 4

第一阶段以网络监控基础设施为主,这个阶段应用性能管理主要以各类网络管理系统(
NMS)和各种系统监控工具为代表。

(1)多元化的应用服务

图片 5

APM 热度提升,未来发展态势良好。
近几年,随着移动设备的普及,大众的生活开始依赖于移动应用,用户对于移动应用的性能体验更为苛刻,这使APM
热度提升。在云计算、移动互联网、大数据快速发展的背景下,企业的 IT
环境在持续地走向复杂化,市场对应用性能管理的需求会进一步增加。

云计算(cloud
computing)是一种通过Internet以服务的方式提供动态可伸缩的虚拟化资源的计算模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源(资源主要包括网络、服务器、应用软件、存储及服务等)共享池,这些资源能够被快速提供,用户可根据个人或团体的需要对云计算的资源进行租赁。继个人计算机变革、互联网变革之后,云计算也被看作是第三次的rr浪潮,是中国战略性新兴产业的重要组成部分,它不仅实现了信息时代商业模式上的创新,而且也为人们生产和生活带来了根本性的改变,必将成为当前全社会所关注的焦点。

二、云计算管理的目标

图片 6

二、云计算运维管理的要点

图5三层式管理模型

云运维是新型 IT 运维模式, 与传统 IT 运维存在多方面的差异。 传统 IT
运维存在人员成本偏高、自动化程度低、无法管理庞大资源等缺陷,基于云计算
IT 运维服务实现了三大转变。

1、云计算的概念

自动化:在非虚拟化环境中,业务部署后一般都具有相对的固定性,即主机位置、网络接入比较确定,运行维护的目标与物理机、物理端口一致,这种情况,主机系统、网管系统分别部署、调试对接相对比较容易。但在大规模数据中心,特别是云计算环境下的业务流程,基于传统的分离调试是无法有效支持云服务的业务模式,这就要求整个服务的供应应能够简单提交、且不同系统(基础的计算、网络,上层的主机、网络管理系统)之间能够交互服务信息,并基于一致的业务要求完成所有部件的自动化部署与运行。

运维自动化的关键在于标准化,代码从开发者的机器到最终在生产环境上的部署,需要流过很多的中间环境,而每一个中间环境都有自己微小的差别。

2、云计算的特征

三种模型的对比小结

1)从市场看, 云计算蓬勃发展,市场规模增速快,
云计算在中国的落地和繁荣将成为云运维持续发展的核心动力;
从政策层面看,国家政策鼓励发展“互联网+”、云计算、大数据、物联网,提高各行业信息化建设水平,促进运维需求增长,推动传统运维向云运维转型,同时国家建设绿色数据中心的要求将推进智能化运维的发展,为运维转型升级提供动力。

当前主流的云计算平台均根据SPI架构,在各层集成功能各异的软硬件设备与中间件软件。大量中间件软件和设备提供针对该平台的通用接口,允许用户添加本层的扩展设备。部分云与云之间提供对应接口,允许用户在不同云之间进行数据迁移。类似功能更大程度上满足了用户需求,并对计算资源实现了有效集成。

但这种模式的不足在于,对底层物理设备而言,存在两套指令系统:供应云服务的统一管理平台和独立的运维系统,如果存在操作上的偏差,需要这两套系统之间预先定义或确定一个优先顺序,否则在某些条件下将导致因不同系统的指令冲突造成服务的异常。同时,对于基础设备来说,两套指令系统的调用接口或协议也可能完全不同,甚至由于当前标准化的不足,针对不同的云管理平台有不同的定制化要求,带来了基础设备运行与设计上的复杂。

云计算正从概念逐步走向落地,在各个行业都出现了成熟的应用,但云计算与虚拟化在提升资源利用率的同时,也加大了
IT 复杂度。如何简化 IT运维管理,实现 IT
运维成本上的降低和效率上的提升,就成为了一个所有企业 IT
部门面临的难题。传统 IT 运维遭遇两大瓶颈。

云计算在运维管理中其所涵盖的范围非常广泛,其中主要包括了对环境管理、网络管理、软件管理、设备管理、日常操作管理、用户密码管理以及员工管理等多个方面。要良好实现以上的管理目标,则应着重从云计算运维管理中的运行监控、安全性管理和自动化处理这三个要点出发。

第三种模型是三层式管理模型。如图5所示,统一的云管理平台运行在一个逻辑层面(TopTier),向云计算用户提供服务界面、云服务供应操作,不直接管理和操作底层设备。中间层(MiddleTier)是基础资源操作管理层,接受来自上层的云服务调用,并转换为针对底层设备的配置操作,中间层同时作为专业化系统对基础设备执行运行、维护、监管等功能。最下层为基础设备层面(InfrastructureTier),是计算、网络、存储等基础云计算资源连通运行形成的物理层,接收来自上层的指令而运行和提供服务。

图片 7

(2)高可扩展性

图4双属式管理模型

1)随着传统企业信息化的深入,企业越来越多的业务应用依赖于 IT
来驱动,这意味着 IT
需求变得越来越强,服务器等数量爆增,管理起来日益繁杂, IT
部门如何快速响应业务需求成为一大难点;

一、云计算对运行管理变革的驱动

技术进步引起传统 IT
架构重要转型,云运维应运而生。基于用户规模不可预见,再加上目前互联网、物联网、大数据等新的趋势的快速发展,未来
IT架构的压力和挑战是非常大的。而云计算所具备的自动缩放、弹性、全网负载均衡等这些特性,正好缓解了传统
IT所面临的这些压力,于是越来越多的企业将核心业务迁移到云端,解决传统 IT
架构高成本的巨大缺陷。

四、结束语

图片 8

动态性:传统数据中心的业务针对物理主机展开,而物理服务器一般固定连接在某个网络端口上,并且业务属性单一,无论是网络策略、安全控制都比较固定。只要主机与网络运维界面清晰、系统归属明确,则业务容易展开,并能平稳运行。但是云计算环境下部署着高密度的虚拟机,在虚拟化环境下,基于服务变更、容灾、分布式计算等业务运行要求使得虚拟机动态迁移成为必备属性。如果网络无法感知这种动态性计算方式,持续的运行必将造成业务的紊乱、运维的不可控,这就要求管理系统能够具备动态计算的感知能力。

        智能化、自动化、可视化是运维发展的三大趋向; DOCKER
技术或将给运维带来大变革;在 IT 运维转型大势驱动下,BSM(Business
ServiceManagement, 业务服务管理)、 APM(应用性能管理) 将顺势崛起;
基于大数据分析是 IT运维向高级发展的重要路径。

编者按】管理是IT系统良性运行的重要保障,不同的IT设备都有自己的管理系统。特别是大规模数据中心,必须通过集中的管理系统来运行管理计算、存储、网络等设备,以能够快速响应和处理数据中心的业务变更、异常事件、持续优化。在《IP领航》往期的文章中曾多次聚焦”数据中心的管理”,但大都侧重于”以网络为核心”的管理,本文将把视线放大到整个云计算环境下的数据中心,对三种运行管理模型逐一对比分析。

Docker 的初衷是将各种应用程序和它们所依赖的运行环境打包成标准的
container/image,进而发布到不同的平台上运行。

第二种模型是双属式管理模型。如图4所示,在类似第一种模型的架构下,除了统一的运行管理平台,在计算、存储、网络各个系统中集成各自专业的管理系统。相比模型一,模型二有极大的增强,不仅可以简化统一运行管理平台的复杂度,又引入了传统成熟的运维管理方式,并分离了云计算的服务运营与基础架构管理,形成一个具有分工与协作的IT运行结构。

APM天生对数据分析的需求使得它有机会把性能数据与企业的经营数据整合起来,把管理范围逐渐从企业的核心
IT部门延伸到业务部门,从而让企业真正通过 IT 来指导商务决策。 Gartner
数据显示, APM 软件全球市场的在过去几年加速成长,截至2014 年已实现 26
亿美元营收,较2013 年增长了 15.8%,远高于 ITOM 市场增速。我国 APM
也已经进入十亿级市场。

图2 云计算的管理目标

IT 运维发展趋势一:智能化。

图片 9

首先它变被动为主动,云运维以各种监控、告警、日志、报告服务工具为依托,通过全面的网络式监控及早发现故障隐患,从而可以建立起主动式
IT 运维。

为了支持云计算虚拟化、动态化、关联性、自动化的服务要求,整个云计算系统需要有一个统一的操作运行管理平台,能够对云服务进行端到端自动化部署,同时快速响应资源调度与业务变更的服务需求如图2所示)。

其四,服务商难管理,技术水平参差不齐,服务不及时,有问题不能及时解决。

图1传统数据中心管理运行架构

图片 10

即使是一个厂家能够以极高的专业程度整合多个基础资源的运行管理到这样的统一系统,这个系统也必将非常巨大、复杂,其本身的运行维护也会存在极大难度。

图片 11

模式三:三层式管理

1)从细分领域看,需抓好 IT 运维新领域应用大机会,我们重点看好APM、 BSM
等新领域。

图片 12

三重逻辑把握 IT 运维转型升级带来的机遇

关联性:当前的网络与计算之间以一种松耦合方式运行,网管与主机管理系统之间基本上没有信息关联交互,这样,对于虚拟化数据中心,虚拟机的动态性计算特性,网络无法感知、网络管理系统无法对虚拟机进行定位,网络对业务的安全、控制、配置、监管便无法关联到虚拟机,无法实现云计算下的灵活部署和扩展性。

【嵌牛导读】:IT运维转型之路何去何从

模式二:双属式管理

其一,与“云服务”、“云产品”概念类似,云运维指的是通过云计算相关技术进行
IT 运维操作,是传统
IT运维转型优化的趋势。作为云服务的一个新兴的分支,云运维与云存储产品、云主机产品类似,由各大云服务提供商通过自主研发推出相关的解决方案和产品。代表性的产品有北塔软件的“代维宝”、华胜天成的“云悦服务”等。

图片 13

工作分工设计不合理,忽视梯队建设;

虚拟化:传统数据中心中每个物理服务器上只是单个或几个应用的固定运行,业务基本是与主机的绑定运行方式,对主机的管理,某种意义上也就是对业务的管理。云计算环境下服务器大量采用虚拟化技术,每一个物理网络端口下都会分布多达数十个虚拟机,物理主机上运行着多个不同的操作系统和应用,网络中应用密集度极大增长,对网络的性能、规格、可靠性都提出更高要求,而虚拟机网络属性的可管理性更是面临巨大挑战。

中国数据中心市场规模持续扩大,年复合增长率近
40%,巨大的市场需求刺激云运维兴起。2015
年,技术创新驱动带动数据存储规模、计算能力以及网络流量的大幅增加;全球尤其是亚太地区云计算拉动的新一代基础设施建设进入加速期。受供需两端快速增长的影响,
2015年中国 IDC 市场延续了高速增长态势,市场总规模为 518.6
亿元人民币,五年内年复合增长率为38.38%。未来三年 IDC
市场仍将保持高增速,预计 2018 年中国 IDC 市场规模将达 1400
亿元。数据中心作为日益重要的 IT基础设施,
对于运维的需求非常强劲。此外,银行、电信、政府等重点行业在新时代下对
IT基础设施的安全性和稳定性要求不断提高。种种市场因素刺激云运维的产生和发展。