www.hj8828.com 8

www.hj8828.com云计算时代的 IT 运维转型升级之路(上)

IT故障管理:亡羊补牢,不如未雨绸缪

随着BYOD、云计算、大数据等新一代IT技术的发展,企业信息化应用变得更加得心应手,但IT运维管理的压力似乎并没有减轻,反而面临更大的挑战。对于IT运维主管来说,一场IT重大事故的发生,不仅会让部门员工士气低落,更容易让上层领导怀疑IT部门的领导力和执行力。因此,针对IT故障管理,更多希望改善自身状况的IT部门,开始选择主动性的事前管理模式,而非被动式的亡羊补牢。

英雄难过“故障关”

IT在很多时候都会充当幕后英雄的角色,可如今的职场生存环境,对心脏不强健的运维主管来说则是一个噩梦。

一方面,作为公司的最高管理者,他们希望IT的能力越来越强大,变成无形的力量,因为IT能消除公司内部的摩擦,并且削减每笔交易的成本。另一方面,你永远不要相信他们可以做到绝对的平衡,如果重大的系统故障给整体收益带来了影响,公司就会强调这个原因,强调公司发展受到了IT的拖累。

那么,IT故障是否能够彻底消除呢?答案是否定的。任何系统都有出现故障的时候,它可能发生在IT资产生命周期的任何一个时段,包括了硬件、软件和不可抗的自然因素。为此,企业必须要为自身定义一个可以接受的故障管理目标,将IT基础设施故障对业务的影响减到最小,并防止与这些错误相关的事故再度发生。

www.hj8828.com,如果单从故障管理的目标来看,人们力求找到引发事故的根源,然后才着手改善或纠正该情况。“这种做法固然无错,但却没有行走在IT运维管理最佳的流程上。

对此,北塔软件表示:“故障管理的流程具有被动和主动两个方面。被动方面是作为对一个或多个事故的反应而解决问题,而主动的“故障管理”是指在事故发生前确定并解决问题和已知错误。所以说,即使你现在‘救火’的事情再忙、再多,也应当去思考,并且马上行动起来,因为这种工作状态非但不能给IT部门带来改变,反而陷入一个恶性循环当中。

“两步走”实现未雨绸缪

如今,企业的IT架构被多种新兴技术改造,并与业务深度融为一体。这带来了极度复杂的管理机制和故障发生机率,迫使IT部门不能满足于传统的故障识别及修复工作,而需要走在问题的前面。

未雨绸缪的益处世人皆知,但又要从何入手呢?针对这个问题,北塔软件建议用户采用如下两个步骤实现“质变”:

◆ 第一步:基础设施监控“泛化”

之前,由于网络的庞大和后续累加,你可能无法知道IT系统中每个关键应用承载设备在哪里,甚至不知道这些设备连接的应用在哪个端口上。这时的IT运维管理就等于“盲人摸象”,连最基本的“救火”都无法实现。所以,在这个阶段,便需要利用具备手动或自动发现功能的运维工具,迅速搜索整个网络内的所有节点,实现整个网络的真实物理拓扑图,实时反映出整个网络的运行状态。

需要注意的是,在云计算或虚拟化运行环境中,传统的运维工具已经无力支撑这个目标。此时,用户可以采用北塔BTIM等具备自动感知虚拟和物理环境的新一代运维平台,将虚拟交换机和虚拟机以“实体连接”的形式存在于监控场景中,自动追踪数据和虚拟机漂移后的性能指标。

◆ 第二步:业务管理“透明化”

一套业务系统的可用性,取决于每个基础设施对象之间的配合和稳定,但之前的基础监控数据对于整套业务系统又能起到什么帮助呢?

在完成全网监控的目标后,用户可以利用北塔BTIM自动对监控数据从业务角度归类整合,让所有业务关键参数醒目地投射到业务架构上,实时反映业务运行情况。业务视图的构建,可以对外向业务部门,对内给自身管理都提供透明化管理,能够非常清晰地反应出业务系统的健康指标。而透明化的监控业务系统运行起来之后,能够事前发现可能引起系统宕机故障,或者访问质量无法保障的问题,把可能发生故障的隐患消除在萌芽状态。

IT运维要给创新“留时间”

主动运维、事前运维,这些具体工作实际上都在围绕着“预防性检查(PM)”展开,旨在提高系统的可用性、稳定性。而IT部门的价值若想进一步体现,就不能总围绕“救火员”的角色。因此,未雨绸缪的最终目的还是解放人力。

对此,北塔软件表示:“追求IT创新不仅需要灵感,更要时间。用户还可以利用北塔BTIM中的‘业务仿真、自动巡检’等功能替代人力操作,主动找出可能会影响系统可用性和性能降低的原因。在这个平台上,看似是一张简单的业务管理门户图,但却可以紧密联合并改善IT与业务部门之间的关系,在沟通中激发IT创新的灵感。”

随着BYOD、云计算、大数据等新一代IT技术的发展,企业信息化应用变得更加得心应手,但IT运维管理…

1.云计算时代,IT运维迎来转型升级

传统 IT 运维问题日显, IT 运维转型是必然趋势;云计算时代的 IT
运维转型升级向云运维方向发展,包含两方面内涵:运维技术的云化和对云的运维;市场对高效运维的需求和云计算、大数据等技术手段是云运维得以兴起的根本原因。

2.从产品和技术趋势深度探析 IT 运维产业特征

智能化、自动化、可视化是运维发展的三大趋向; DOCKER
技术或将给运维带来大变革;在 IT 运维转型大势驱动下,

BSM(Business ServiceManagement, 业务服务管理)、 APM(应用性能管理)
将顺势崛起; 基于大数据分析是 IT

运维向高级发展的重要路径。

3.IT运维转型升级机会大,细分领域将涌现龙头企业

1)从市场看, 云计算蓬勃发展,市场规模增速快,
云计算在中国的落地和繁荣将成为云运维持续发展的核心动力; 从政策层面看,

国家政策鼓励发展“互联网+”、云计算、大数据、物联网,提高各行业信息化建设水平,促进运维需求增长,推动传统运维向云运维转型,

同时国家建设绿色数据中心的要求将推进智能化运维的发展,为运维转型升级提供动力。

2) 细分领域专业化程度尚低, 产业与资本仍在酝酿。

3)国外企业如 IBM、 BWC、 HP
等企业在云运维领域的产品和布局为国内运维企业

发展提供了借鉴。

4)国内企业如华胜天成、 广通软件、
北塔软件、银信科技和新华三等纷纷推出云运维相关产品。

4.三重逻辑把握 IT 运维转型升级带来的机遇

1)从细分领域看,需抓好 IT 运维新领域应用大机会,我们重点看好APM、 BSM
等新领域。

2)从运维技术看,把握新技术运用方可引领未来,我们优选新兴的 Docker
技术、 基于大数据的运维管理、 SaaS 化运维等技术这几大技术方向。

3)综合地来看,

在云运维领域,在技术有领先优势、在细分领域深耕细作、对客户资源有较强把控力的企业,能够更好地服务于客户,在同质化竞争中打出差异化路线、并且以高的用户黏性和高的用户续费率源源不断地为公司创造价值并且产生现金流。因此,这部分拥有综合优势的企业将更有希望在

IT 运维转型升级领域中脱颖而出。

一、云计算时代, IT 运维迎来转型升级

1.1传统 IT 运维问题日显, IT 运维转型是必然趋势

IT 运维是信息化时代企业不可或缺的一环。 IT 运维管理,是指单位 IT
部门采用相关的方法、手段、技术、制度、流程和文档等,对 IT

运行环境(如软硬件环境、网络环境等)、 IT 业务系统和 IT
运维人员进行的综合管理。配备专职 IT 运维人员的企业会自行进行 IT

运维管理;而其余企业选择将 IT 部门的职能全部或部分外包给专业的第三方 IT
外包公司管理,集中精力发展自身的核心业务。

自信息化普及以来, IT
运维对企业的发展而言不可或缺,因其能保障企业“网络不断、系统不瘫、数据不丢”,在保证各类
IT
基础设施稳定运行的基础上对关键业务提供良好支撑,使企业的核心业务能够实现不间断、高质量的运行,最终保证并提升公司的运营效益。36大数据(

www.hj8828.com 1

图 1: IT 运维管理包含的子类 图 2: IT 运维管理六大趋势

www.hj8828.com 2

传统 IT 运维问题日显, 究其根本是管理问题。 传统 IT
运维在发展过程中显现出了各个方面的问题:

其一,运维服务人员工作忙碌却不受重视,传统的“救火式”运维大大增加了运维人员的工作强度和工作压力,难以量化的工作得不到业务部门的认可。

其二, IT 系统复杂,维护难度高,系统宕机风险系数大。

其三,技术人员难培养,流动性大,有经验的技术人员因为不受重视而辞职,造成运维质量和客户满意度的波动。

其四,服务商难管理,技术水平参差不齐,服务不及时,有问题不能及时解决。

IT
运维服务的所有问题的根源都不是技术问题,而是管理问题,可归结为四方面:

IT 运维服务管理方式缺乏创新;

IT 运维服务管理不规范;

工作分工设计不合理,忽视梯队建设;

IT 运维服务供应商管理不到位。

www.hj8828.com 3

云计算、大数据时代下,传统 IT 运维服务出现瓶颈, IT 运维转型是必然趋势。

云计算正从概念逐步走向落地,在各个行业都出现了成熟的应用,但云计算与虚拟化在提升资源利用率的同时,也加大了
IT 复杂度。如何简化 IT

运维管理,实现 IT 运维成本上的降低和效率上的提升,就成为了一个所有企业
IT 部门面临的难题。

传统 IT 运维遭遇两大瓶颈。36大数据(

1)随着传统企业信息化的深入,企业越来越多的业务应用依赖于 IT
来驱动,这意味着 IT
需求变得越来越强,服务器等数量爆增,管理起来日益繁杂, IT
部门如何快速响应业务需求成为一大难点;

2)云计算、虚拟化时代的开启,在大型云计算数据中心面前,需要灵活自动地去管理虚拟的计算节点、存储和网络等资源,原来单一、物理的设备变为了动态、虚拟的资源。若传统

IT
运维模式不进行升级转型,结果会是死路一条。综上,云计算、大数据时代下,
IT 运维转型是必然趋势。

1.2 IT 运维转型升级剖析:运维技术云化 vs 对云的运维

云计算时代的 IT 运维转型升级向云运维方向发展,包含两方面内涵:
运维技术的云化和对云的运维。
目前业内仍未给云运维确定一个统一的概念,综合来看,云运维有两方面的含义。

其一,与“云服务”、“云产品”概念类似,云运维指的是通过云计算相关技术进行
IT 运维操作,是传统 IT

运维转型优化的趋势。作为云服务的一个新兴的分支,云运维与云存储产品、云主机产品类似,由各大云服务提供商通过自主研发推出相关的解决方案和产品。代表性的产品有北塔软件的“代维宝”、华胜天成的“云悦服务”等。

其二,云运维指以云平台作为运维对象,这是从运维的对象划分形成的概念。代表性的产品有新华三集团推出的云托管运维服务,该服务通过专业运维团队,提供对云平台的远程运维。综合来看,以云技术进行运维是云运维的主流概念,以云平台作为运维对象视为其内涵的一个补充。

www.hj8828.com 4

云运维是新型 IT 运维模式, 与传统 IT 运维存在多方面的差异。 传统 IT
运维存在人员成本偏高、自动化程度低、无法管理庞大资源等缺陷,基于云计算
IT 运维服务实现了三大转变。

首先它变被动为主动,云运维以各种监控、告警、日志、报告服务工具为依托,通过全面的网络式监控及早发现故障隐患,从而可以建立起主动式
IT 运维。

其次,它变复杂为简单,
增一个分支机构时,只需要在网络上增加安装一个网管机,就可以监控管理整个
IT 系统,整个过程简单高效,而不需要部署复杂的 IT 运维软件。

最后,它为用户提供了一种快速部署和应用运维系统的方法,彻底改变了传统的高成本运维服务模式。云运维把数据乃至应用程序全部集中到云端,这意味着大量在本地的运维工作转移到云服务器端,运维的总体工作量大大减少,运维成本也就大幅降低。36大数据(

此外,云运维在服务理念、服务形式、工作模式等方面也体现出与传统 IT
运维极大的差异。由此可见,云运维是传统 IT
运维在新时代下各方面优化转型的趋势。

www.hj8828.com 5

云运维本质是可控+可视的一种 IT 服务。
云运维首先是运维的一种,因而必须满足运维的核心功能“可控”。

“可控”包括稳定性可控、性能可控、安全可控、交付可控、效率可控等方面,满足了可控,运维才能在保证各类
IT
基础设施、软硬件设备稳定运行的基础上对关键业务提供良好支撑,使企业的核心业务能够实现不间断、高质量的运行,最终保证并提升公司的运营效益。

其次,云运维作为 IT 运维的一种优化和变革,有“可视”的内在要求。 IT
运维归根结底是一种服务,随着发展越来越凸显其服务的特性,

高效、透明化、 用户友好的服务成为运维的核心价值, 而显然“可视化”
可以最大化这种服务属性。 综上, 云运维本质是可控+可视的一种 IT

服务。

云运维商业模式:按需租用、免费+增值服务。
由于云运维是一个较新的概念,业界现有的云服务提供商或 IT
解决方案厂商仍未非常系统、清晰地区分传统运维产品和云运维产品的

边界,云运维产品未实现规模化销售。云运维产品的功能领域主要是设备监控管理、业务连续性/灾难恢复规划、数据中心整合及虚拟化、信息管理、信息安全等方面。云运维产品的销售模式主要是
SaaS 化产品的销售,即按需交付服务。

一般有免费试用的时间或资源量,超过免费阶段,客户就需要按需租用产品。除此之外,厂商会推出增值服务、定制化服务等,其交付形式往往是按项目付费。

1.3市场需求、技术进步两大维度看云运维兴起原因

云运维兴起原因可以从市场需求、技术进步两大维度解读。

首先,随着互联网各类业务规模的扩大,数据中心作为互联网业务的基础设施,其需求发生爆发式增长,重点需求对象为银行、电信、政府。伴随数据中心增长的是对高效运维的需求,因而市场需求成为云运维兴起的推动力之一。

其二,云计算大数据时代背景下,企业核心业务向云端迁移带来整个 IT
架构行业变化。技术进步倒逼 IT 运维升级,云运维应运而生。

中国数据中心市场规模持续扩大,年复合增长率近
40%,巨大的市场需求刺激云运维兴起。2015
年,技术创新驱动带动数据存储规模、计算能力以及网络流量的大幅增加;全球尤其是亚太地区云计算拉动的新一代基础设施建设进入加速期。

受供需两端快速增长的影响, 2015年中国 IDC
市场延续了高速增长态势,市场总规模为 518.6
亿元人民币,五年内年复合增长率为

38.38%。未来三年 IDC 市场仍将保持高增速,预计 2018 年中国 IDC
市场规模将达 1400 亿元。数据中心作为日益重要的 IT

基础设施,
对于运维的需求非常强劲。此外,银行、电信、政府等重点行业在新时代下对 IT

基础设施的安全性和稳定性要求不断提高。种种市场因素刺激云运维的产生和发展。

www.hj8828.com 6

技术进步引起传统 IT 架构重要转型,云运维应运而生。

基于用户规模不可预见,再加上目前互联网、物联网、大数据等新的趋势的快速发展,未来
IT

架构的压力和挑战是非常大的。而云计算所具备的自动缩放、弹性、全网负载均衡等这些特性,正好缓解了传统
IT

所面临的这些压力,于是越来越多的企业将核心业务迁移到云端,解决传统 IT
架构高成本的巨大缺陷。

整个 IT 架构变化,倒逼 IT 运维升级,新型的 IT
运维需要能灵活自动地管理虚拟的计算节点、存储和网络等资源,能对云基础架构、软件服务等进行有效地运行维护。这便是云运维诞生的强大推动力。

二、产品和技术趋势: IT 运维产业特征之深度探析

2.1 智能化、自动化、可视化是运维发展的三大趋向

IT 运维发展趋势一:智能化。

云计算的迅猛发展给 IT
基础架构提供了更多的选择,云架构和传统架构最终将走向融合。这种融合对运维服务提出了更高的要求,运维服务需要从单纯的人工模式走向自动化、智能化,从解放人的手和脚到部分替代人的脑力工作。

这也是数据中心从小规模走向大规模的必然要求。随着 IT 系统越来越复杂和 IT
设备的多样化,传统 IT
运维“救火式”的被动故障处理能力已经严重影响了企业业务的发展,只有智能化的运维方式才能维持企业
IT
环境的安全、稳定。智能化运维平台的主要功能是通过预测分析模型,自主定位问题、发现问题,综合分析之后上报信息,形成高度智能化的运维体系。36大数据(

www.hj8828.com 7

IT 运维发展趋势二: 自动化。

为了将有限的 IT
资源和人力投入到企业核心应用的创新研发之中,以快速响应业务用户需求,并满足云计算时代的业务变革需求,实现
IT

运维自动化已是必不可少的步骤。自动化技术不但能帮助 IT

人员从固定、重复、烦琐的日常维护事务中解放出来,还可以使故障处理流程变得规范、迅速、高效,为企业的业务变革提供良好的技术手段和基础。

目前,业界已有很多单一化的 IT 自动化产品,而在复杂的云环境下仍无法满足IT
运维的各类需求。所以 IT
运维未来将向支持多样业务的自动化方向发展。36大数据(

www.hj8828.com 8