www.hj8828.comIT运维管理如何摆脱“不怕坏,就怕慢”的魔咒?

IT运维工程师之间一直流传着“不怕坏,就怕慢”的魔咒。如果是网络发生信息不通、网页不能浏览等连通性故障,运维排错的任务并不困难。可当网络连通性并无问题,业务系统的响应和访问速度却在一步一步变慢,IT运维人员就很难处理这种“软故障”。

在国家“创新驱动”发展战略指引下,各个行业利用IT技术创新变革的情形四处涌现,虚拟化、云计算和大数据应用水平持续提升,自主可控的IT生态环境逐步完善。针对
“国产化”、“虚拟化”、“业务管理”等全新运维需求,以北塔软件为代表的国内IT运维厂商紧抓创新机遇,围绕用户应用需求构建新一代运维产品的功能,从而推动了广大企业用户运维服务水平的持续领先。

作为世界上华丽的舞蹈–华尔兹享有”舞中之后”的美称。华尔兹速度虽慢,但技艺难度却很大,不仅要先练好基本步,更要在此基础上学习各种变化步、花样步以及组合和套路。

对此,作为国内领先的IT运维管理专家,北塔软件认为:管理员应最大限度的保障数据中心的运行效率,不能让“软故障”成为阻碍用户应用的屏障。管理者应站在业务应用的全局角度上指导运维细节,建立业务系统与基础网络的映射关系,使用更先进的IT运维管理分析方法和手段,尽量缩短排除故障的时间,进而提升服务的质量和用户的体验效果。

全面国产化的“推力”

BSMBusiness Service
Management,即业务服务管理)的理念是从企业业务角度出发,来重新认识IT对业务的整合,是IT创新管理的风向标。BSM可以称为IT运维管理领域中的”华尔兹”,与华尔兹一样,因为它同样也具有了看似质朴简单却又高贵深奥的特质,所以广受一线IT运维人士的认同。它是打造一流的运维管理体制,是实现从优秀到卓越的关键,但BSM不是一蹴而就的。因此,企业在落实BSM前要形成一定的基础条件,也就是要先掌握最基本的舞步,然后才能倾听业务部门的节拍,将BSM充满活力地舞动。

案例分析:被“怪病”缠身的服务器

“棱镜门”事件给蓬勃发展的中国信息化进程敲响了警钟。由于信息泄密的风险威胁并未消除,涉及国内公众信息或是行业机密的业务,必须挑选自主可控的硬件和软件产品,以保证国家的信息主权与信息安全。为了加速打造自控可控的IT产业链,我国政府在芯片、主机技术、网络设备、操作系统、数据库、中间件等多个领域进行了行业扶持,并在采购政策上调整力度非常之大。因此,许多用户原有的IT运维平台开始在两个方向调整:运维对象国产化和运维产品国产化。

笨拙的舞步会踩踏业务主管的脚面

小刘,是一家大型企业的运维工程师,但他最近遇到了一种“网络怪病”。业务部门反映,已经上线4年多的CRM(客户关系管理)系统常常出现访问异常缓慢,用户终端需要反复刷新页面,有时还会出现彻底无法访问(访问超时)的问题。另外,还有些业务人员反映,在更新用户联系信息后,已经被更改的用户资料并没有得到更新。而且,这些问题已经被反映到集团老板那里,IT运维部门的领导带着一脸沮丧,要求他迅速查出原因,因为CRM系统的“怪病”严重影响了公司业务处理的效率。

对此,行内专业人士认为:“在关键系统以及核心领域中使用的国外产品,像是深埋在我国信息化系统中的“遥控炸弹”,给我国信息安全带来很大的隐患。“IT基础设施管理专家北塔软件则认为:”IT运维管理软件在企业网络架构中拥有绝对的超级权利,它可以在底层监控和收集网络中的所有信息,即使发生数据泄露,用户也很难发觉。另外,IT运维管理软件本身也会有升级,一旦厂商触及或接管运维系统的管理权,用户则很难保障核心数据不会造成泄露。“

作为国内领先的IT运维管理专家,北塔软件在协助电力、政府、金融、电信等4000家用户进行IT运维管理最佳实践中发现,绝大多数的企业深知BSM可以帮助他们改变在公司中的地位,但由于IT基础设施没有实现牢固的监控架构,IT部门的舌尖上也就无法品尝到BSM的美味了。因为主动运维的模式未能落实,假若销售业绩出现问题时,业务部门还会以系统故障,或是网络缓慢为由”起诉”IT经理。但若反过来想,这些投诉是有理由的,又有谁在一场舞会上被舞伴踩了N次脚面之后,不会埋怨几句呢?

小刘采用的多种方法开始排查故障的源头,例如:业务部门PC终端故障、检查服务器端的性能、找程序开发人员挖BUG、检查数据库、检查交换机、给服务器杀毒、翻阅之前的所有日志、架上流量监控软件……花费了大量的时间,最终也只是找到故障根源可能存在的方向。因为在拔掉交换机上链接服务器的线缆后,
FCS帧就会瞬间减少。这应该是网卡损坏(包括协议、驱动、硬件)故障或者连接服务器的网线(包括RJ45头)部分出现了问题,但排除问题所消耗的时间实在让人无法忍受。

针对政策导向和用户实际应用环境的改变,北塔软件在全新升级的北塔BTIM
3.6版本中,加大了对国产组件的研发投入,全面支持了麒麟Linux操作系统、达梦数据库管理、CICS和Tongweb中间件等国产化产品的运维监管,适应了行业用户对于国产化软件进行统一运维管理的发展趋势。

尽管IT运维管理技术在不断进步,但实际上,很多IT运维工程师并没有真正解脱出来,我们可以将传统的IT运维管理简单概括成四个字叫:”人拉肩扛”。因此,在BSM实施之前,企业要做的第一件大事就是解决设备层面的监控和预警难题。因为当涉及到今后的业务管理时,底层监控数据的分析结果,是对业务系统的运行状况最有说服力的。要改善这一状况,国内IT运维管理专家”北塔软件”举例说:IT部门需要把网络、路由器、交换机、服务器等纳入到北塔BTIMBetasoft
Integrated
Management,IT综合管理软件)平台上进行管理,保证其运行不出问题。通过IT基础设施管理服务的建设,IT部门有能力提供7X24小时全天候对服务器、网络和数据库进行监控。IT运维工程师会习惯使用监控工具,而不是手工打理,他们每天都会遵照和运用基础设施运维管理工具发现问题、解决问题、优化系统,并依靠ITIL方法论逐步对应出合理化的流程。