图片 25

iTop系统使用手册

数据中心资产管理方法解读

随着互联网与云计算的快速发展,中国掀起了数据中心的建设高潮,大型甚至超大型数据中心正在陆续投入使用。根据工信部的统计数据,2011~2013年在建或规划中的大型数据中心就有255个之多,其中超过10000标准机架的超大型数据中心就有23个之多。

目前的数据中心资产管理方法,主要依靠人工录入信息、管理工具较为简单、工作流不清晰,勉强可以应对中小型机房的管理需求;但是,随着数据中心规模越来越大,需要管理的设备数量急剧增加,传统的资产管理方式已经跟不上数据中心业务发展的脚步,成为数据中心运维的短木板之一。

传统的数据中心资产管理方式存在以下问题:

1)海量的资产信息依靠人工采集与录入资产信息,依靠Access、Excel等工具或小型资产管理软件来管理,人力成本高、工作效率低下、差错率高,往往导致资产数据不可用;例如:某ISP运营商下辖数十个数据中心,依靠半手工的方式来管理资产,花费大量人力在资产盘点、报表合并等工作上,费时又费力,还无法保证数据准确。

2)快速变化的IT业务需求导致资产变更成为常态,每个月都有数百甚至数千服务器上下架;而传统的资产变更过程没有实现标准化、流程化,难以保证网管中的资产信息能够及时、准确地变更;随着时间的推移,资产信息逐渐失真,最终导致如有新设备上架,还需要派人到现场去寻找可用的位置。

3)资产管理粗放,人员职责不清晰,资产数据没有经过高效地分析与利用,易形成不明资产或闲置资产。因此,业界主流厂家纷纷推出智能、高效的数据中心资产管理解决方案,提供完整的流程控制、资产识别、数据分析等功能,实现对数据中心资产进行有效管控。

智能的资产识别技术可大幅提高资产管理的效率与准确度

数据中心资产管理系统的核心是一个实时刷新、准确无误的资产信息库;而资产信息的采集、录入的准确性往往决定了一个资产管理系统的数据是否可用。随着数据中心的设备数据增加,资产信息的准确性显得更加重要。但是,传统的资产信息采集方式是通过定期的人工资产盘点来获取,人工差错不可避免,费时费力。针对这种情况,业界内的众多厂家也在尝试各种新的自动化信息采集技术,减少人工参与环节,减少差错率。目前,应用较广、较为成熟的资产识别技术主要有:

1)资产条码扫描技术。一套完整的条码管理系统主要由标签、扫描终端、网管等部分组成。首先,在设备进场之前,预先将带有条形码或二维码信息的标签粘贴在资产上;然后,在设备上线或发生变更时,使用移动式扫描终端对设备上的标签进行扫描,快速的录入资产信息;最后,借助无线传输技术将现场采集的数据实时上传到网管中,自动更新系统中的数据。此外,也可以将系统中最新的数据下载到扫描终端中,通过图形化界面显示当前位置的资产信息,以便在现场进行资产信息比对、查错。因此,通过条码移动扫描技术,大大提高了资产盘点的工作效率,同时避免人工录入环节,保证信息流和资产实物流的准确对应。

2)机柜级资产识别条技术。资产管理的一大难点就在于确定IT设备所在的机柜U位;针对这一难题,业内的部分厂家推出了智能化的资产识别条。资产识别条可以安装在机柜的侧面,通过内置的ID芯片进行近端通讯,可以识别IT机柜中的每个U位是否被占用,以及占用此空间的设备信息。这些资产位置信息通过资产识别条的通信接口集中上报给资产管理系统,从而完成信息的采集、录入等工作。通过资产U位的识别,可以精确发现连续可用的U位空间,用于指导刀片等服务器的上下架工作。这种方案的优点在于数据准确性高,及时性好,可以在第一时间内发现资产变更信息,适合对资产精度要求较高的场合。

3)设备自动识别技术。与服务器、存储等IT设备不同,大多数的UPS、空调等设备做不到被网管自动发现,还需要用户手工添加到网管中并纳入监控。如果这些设备增加电子标签等信息,主动向网管推送设备信息,则设备就可以在网管上实现自识别、自注册,自动刷新信息到资产管理系统,极大的简化了相关工作。目前,业界一些设备厂家已经开始提供并推广这一方案。

闭环的ITIL流程控制保证资产变更过程的可控、可管

在整个数据中心的生命周期内,不停地有新设备的添加、搬迁、上下电等资产变更事件。据不完全统计,腾讯数据中心的服务器每月启停4000多台,业务每月迁移2000多次,硬件每月变更500多次。频繁的资产信息变更,如果没有一个可闭环、可跟踪的资产变更控制机制,则资产信息将逐浙失真,最终变成不可用。先进的资产管理系统应该提供符合ITIL流程要求的资产变更功能,保证资产信息的可控、可管。

变更流程管理:ITIL是国际通用的针对IT服务管理的一个客观、严谨、可量化的标准和规范,其中与资产管理相关性最大的是变更管理模块。变更管理通过明确地定义资产变更的范围、优先级、职责与角色、流程与审核点、衡量标准等,在最短的中断时间内完成变更过程,减少对业务的影响,并保证变更结果及时、准确地刷新到资产信息库中,过程可回溯可审计。大量的成功实践表明,符合ITIL标准要求的变更管理可以提高运维效率约25~30%。

数据智能核对:在实际运维中,难免因为各种人为原因而引入有差错的资产信息数据;如果只依靠人工审核来发现这些潜在的问题,效率低下并且常常达不到预期效果。智能的资产管理系统可以借助大数据分析技术,通过与设备监控系统对接或借助资产识别技术,及时发现与生成设备的上下线记录;然后,通过与变更管理中的历史工单数据互相对比,智能识别两者之间的数据差异,生成问题单。通过资产信息的智能核对技术,可以大幅减少数据的差错率,提高数据中心的运维效率。

高效地利用资产信息,支撑数据中心的运营

准确的资产数据是数据中心日常运维的基础之一,而有效利用资产信息,结合数据挖掘技术生成各种资产报表,可进一步满足实际业务需求。例如,资产数据可以应用到数据中心的容量管理、租户管理上,实现数据中心资源的最大化利用,支撑数据中心的运维。

容量管理:容量管理是DCIM系统的核心功能之一,目的是通过当前容量统计、分析与规划,实现数据中心的关键资源的高效利用,提高资源利用率;借助容量管理,数据中心运营方可以充分利用现有数据中心的容量资源,尽量延长数据中心的使用寿命,推迟下一个数据中心的建设计划,保护企业投资。而容量分析所需的基础数据,必然包括了准确、实时的资产信息。只有通过资产自发现、自识别技术,掌握各个IT设备的准确位置、运行状态等信息,建立IT设备与机柜等的对应关系表,才能实时计算出某一个机架的当前可用容量(空间、供电、制冷等);而基于各个机架的容量数据,管理系统通过数据分析与预测技术,生成容量规划与优化的建议策略。因此,资产数据是支撑容量管理的必备功能之一。

租户管理:针对数据中心的机架出租业务,智能数据中心管理系统可以为业主提供租户管理功能,为企业运营决策提供必备的数据报表。例如:管理系统可以通过统计不同租户的已有资产,形成租户的资产月度报表(包含用电量、空间占用、设备运维状态等);业主可以根据这些基础数据,分析维护每个租户的成本支出,计算ROI识别高价值客户,为企业营销提供决策支撑。而实现租户管理的一个关键环节就是整合资产管理的资产数据库与CRM系统的客户信息,形成统一、完整的IT资产与租户之间的对应关系表。

因此,高效利用资产信息,通过大数据分析技术,可以有效地发现或解决数据中心的运营问题,提升整体的运营效率。

智能化的资产管理是数据中心运维的必然趋势

近年来,客户对智能化资产管理的重视度正在日益提升。智能化资产管理可实现高效、准确的资产采集、录入、跟踪、盘点、统计,大幅减少运维人力成本,提高了资产利用效率。业界的一些领导厂商也纷纷推出了完善的资产管理解决方案。例如:华为的数据中心基础设施管理平台NetEco集成了智能化资产管理功能,提供完整的ITIL流程控制、精确的资产自识别技术,能够解决大型数据中心的资产管理难题。在笔者看来,随着更多的资产智能化技术的推出,资产管理在数据中心的运维中将得到越来越多的应用。

随着互联网与云计算的快速发展,中国掀起了数据中心的建设高潮,大型甚至超大型数据中心正在陆续投入使用…

目录

  1. CMDB概述
  2. iTop系统概述
  3. iTop功能操作
    3.1. 配置管理
    3.2. 变更管理
    3.3. 事件管理
    3.4. 问题管理
    3.5. 服务管理

图片 1

1. CMDB概述

随着信息技术的发展,
IT系统已经成为企业业务发展不可或缺的支撑基础。IT运维管理系统是以CMDB为核心,以网络、服务器、应用的监控为基础,操作行为审计为安全准则,上层整合了符合ITIL管理思想的服务台、事件管理、问题管理、变更管理等流程,从而使IT管理从日常的运营监控、统计分析、发现问题、解决问题向流程化管理转型。

CMDB(Configuration Management Database,
配置管理数据库),提供配置管理数据库的功能,衔接监控与运维管理,是实现运维管理的核心数据支撑环境。

CMDB包含了每一个配置项(Configuration Item,
简称:CI)全部管理细节以及配置项之间的重要关联细节的数据库。CMDB把零散在各处的不规范的资源信息,通过采集和关联的方式,集中在一个整体规划的信息库中,打破了管理模式之间的壁垒,通过识别、控制、维护、审查、展示IT资源,为技术监管、管理流程和业务服务提供准确、统一的配置数据支撑,帮助信息部门有效管控不断变化的IT环境和服务。

CMDB提供动态的配置模型构建,数据模型基于面向对象的数据建模,实现配置项分类、属性继承、关系建模、字典维护等,用户可以根据实际管理需求进行灵活扩展,完成IT基础框架的构建。

根据企业IT资源,我们对CMDB标准模型进行分类,如下图所示。

图片 2

CMDB标准模型分类

CMDB系统可分为:

  1. 面向基础设施的CMDB
  2. 面向业务应用的CMDB

图片 3

CMDB系统分层

数据中心运维,喜冷怕热。在服务器的丛林里,热点无处不在,如何采用安全的RFID新技术方案,从每个服务器真实的物理温度监控开始,准确得出机房的热点云图,是跨越传统技术方案,让运维人员轻松应对日常工作,有效保障用户资产安全的新课题。

2. iTop系统概述

iTop,是IT运营门户(IT Operation
Portal)的简称,它是一个开源web应用程序,适用于IT服务的日常运维管理。它基于ITIL最佳实践,适应符合ITIL最佳实践的流程,同时它又很灵活,可以适应一般的IT服务管理流程。

iTop的核心是CMDB,即配置管理数据库(Configuration Management Data
Base)。CMDB是iTop最早开发的部分。以CMDB为中心的设计理念,需要保证CMDB的准确性和及时更新,服务人员和客户均使用iTop来解决运维管理中的各类问题将会对这一点有帮助。此外,CMDB与其它工具,如监控系统、报表工具、库存管理系统等整合得越多,CMDB的信息就会越丰富。CMDB快速实施,与其它系统相比iTop有丰富的CMDB接口,支持多种方式的数据导入。

iTop具备方便、快捷的二次开发接口,仅需要简单的数据库表操作知识及XML编写知识即可完成表单的二次开发定制。

iTop的功能包括:

  • 记录IT配置项(如服务器、应用程序、网络设备、虚拟机、联系人、位置、VLAN等)及其各个配置项之间的关联关系;
  • 管理事件、用户请求和变更审批与执行等;
  • 归档IT服务及与外部供应商的合约,包括SLA(服务级别协议);
  • 手动或脚本方式导出所有信息;
  • 批量导入或同步/联调所有来自外部系统的数据;

iTop角色包括:

  • 超级管理员(Administrator);
  • 变更主管(Change Supervisor);
  • 变更审批经理(Change Approver);
  • 变更执行人员(Change Implementor);
  • 文档作者(Document author);
  • 服务经理(Service Manager);
  • 桌面支持(Service Desk Agent);
  • 现场工程师(Support Agent);
  • 配置管理员(Configuration Manager);
  • 门户增强用户(Portal power user);
  • 门户用户(Portal user);
  • 问题经理(Problem Manager);

iTop基于Apache/IIS、MySQL和PHP,它可以在任何支持这些程序的操作系统上运行,如Windows、Linux(Debian、Ubuntu和RedHat)、Solaris和MacOS
X等。此外,由于iTop是基于B/S架构的应用程序,不需要在用户电脑上部署任何客户端,只需要一个简单的Web浏览器(IE
8+、Firefox 3.5+、Chrome或Safari 5+)即可使用。

一、机房发现热点的方法

3. iTop功能操作

当前,大部分数据中心的“热管理”依旧处于被动运维的阶段,即先发现热点,再进行处理,这种思维模式导致的后果有可能是“先热后冷”,稍有不慎,就会酿成大错。

3.1 配置管理

从技术角度看,这个锅不能由IT管理或运维人员来背。当前的技术环境,人员发现机房热点的方式,通常有以下三种方式:

3.1.1 概述

配置管理提供了一个虚拟数据库,用来记录企业中的基础设施信息以及它们之间的关联关系,并提供科学化的流程来负责核实IT基础设施中实施的变更和配置项之间的关系记录是否正确、监控IT组件的运行状态,以确保配置管理数据库(CMDB)能够准确地反映目前IT运行环境配置项的实际状况。

从IT管理的角度上来看,对IT资产配置项(CI)的修改不应直接进行,而必须由变更管理流程发起,因此配置管理与变更管理是紧密结合的,变更管理流程引发和控制对配置项的修改和变更;相反,配置管理向变更管理提供详细的配置信息,以帮助变更发起人分析评估变更对IT运营所带来的影响。

iTop应用系统提供了一个完备的CMDB管理应用,使得IT运维人员可以管理其IT资产的配置项信息。它通过识别、控制、维护和验证现有的所有配置项(CIs)的版本,提供一个IT基础设施的逻辑模型。由于CMDB会记录配置项之间的关系,因此IT运维工程师们基于其关联关系对基础设施与服务之间的依赖关系进行分析。

图片 4

iTop系统配置管理

所有配置项(CI)都在iTop系统的数据模型中得到展现,并且可以根据企业本身的应用配置需求进行自定义。针对CI的所有变更可以通过变更时间、变更的属性值(旧值和新值)以及变更人员来对配置变更进行跟踪。

1.在机房内来回观察,用手亲测服务器或机柜的温度。

3.1.2 配置项管理

iTop系统提供了配置项管理功能,方便IT运维工程师可以通过配置项类型维护相关的配置项信息。

iTop系统维护复杂的IT资产关联关系,
配置项之间的关系存在相互的关联,如下图所示。

图片 5

配置项关联

因此,在实际的CMDB配置数据库管理过程中,
一般按照硬件基础设施到软件基础设施的配置管理过程进行配置管理的。

注:
以下配置说明过程可能与实际的系统有所差别(如后期系统定制),配置时以实际的系统操作为准。

优点:经济、简单,对温度高的热点辨别最有效;

3.1.2.1 准备工作
  1. 做好基础配置信息,IT资产的配置项依赖于基础的配置信息,
    基础的配置信息包括组织、联系人、品牌、型号、OS系统及版本、用户角色、机柜、机位、电源等;

    图片 6
    组织信息配置

    图片 7
    联系人信息配置

    图片 8
    基础类型配置

  2. 做好基础配置数据后,就可以对配置项进行增加、修改、删除等操作。

缺点:准确性差,耗时、耗体力,辐射大。

3.1.2.2 录入配置项

1. 配置网络设备

(1).
在配置管理功能中,通过新建配置项或配置管理概览页面选择“网络设备”,新建一台新的网络设备;

图片 9

添加网络设备

图片 10

添加网络设备页面

(2). 在创建网络设备前确认网络设备配置项依赖的基础配置项是否已经创建,
如组织信息、地理位置信息(机房)、机柜及机位信息、电源信息等,
如果未创建, 需要先进行创建,
或者也可以在创建网络设备后创建,最后再对创建的网络设备进行修改;

(3). 录入网络设备的配置项信息;

网络设备的基础配置项应该包括以下信息:

  • 名称: 网络设备名称
  • 组织: 所属组织, 设备所属的组织,如信息技术部
  • 状态: 生产/上线/下线/空闲
  • 业务级别: 关联业务的重要程度
  • 地理位置: 网络设备所在的IDC信息
  • 机柜: 网络设备所在的机柜信息
  • 网络类型: 路由器/交换机/防火墙,可自行添加
  • 品牌: 网络设备所属品牌信息, 可自行添加
  • 型号: 网络设备型号信息,可自行添加
  • 管理IP: 网络设备的管理IP信息
  • 序列号: 网络设备的序列号
  • 资产编号: 公司对于设备的固定资产编号

图片 11

录入网络设备配置项信息

(4). 添加网络设备的关联配置项,
如果关联配置项未定义,可在关联配置项定义后再对服务器的关联配置项进行修改,关联配置项包括联系人、文档、所属的应用系统(解决方案)、相关设备等。

图片 12

添加联系人

2. 配置服务器

(1).
在配置管理功能中,通过新建配置项或配置管理概览页面选择“服务器”,新建一台新的服务器;

图片 13

新建服务器

图片 14

新建服务器页面

(2). 在创建服务器前确认服务器配置项依赖的基础配置项是否已经创建,
如组织信息、地理位置信息(机房)、机柜及机位信息、电源信息等,
如果未创建, 需要先进行创建,
或者也可���在创建服务器后创建,最后再对创建的服务器进行修改;

(3). 录入服务器的配置项信息;

服务器的基础配置项应该包括以下信息:

  • 名称: 服务器名称
  • 组织: 所属组织, 设备所属的组织,如信息技术部
  • 状态: 生产/上线/下线/空闲
  • 业务级别: 关联业务的重要程度
  • 地理位置: 服务器所在的IDC信息
  • 机柜: 服务器所在的机柜信息
  • 品牌: 服务器所属品牌信息, 可自行添加
  • 型号: 服务器型号信息,可自行添加
  • OS家族: 服务器所安装的操作系统类型, 可自行添加
  • OS版本: 服务器所安装操作系统的版本,可自行添加
  • 管理IP: 服务器的管理IP信息
  • MAC地址:服务器管理IP地址所属的MAC地址信息
  • KVM目录: 服务器所在的KVM目录信息
  • CPU: 服务器的CPU信息
  • 内存: 服务器的内存信息
  • 序列号: 服务器的序列号
  • 资产编号: 公司对于服务器设备的固定资产编号

图片 15

创建服务器

(4). 添加服务器的关联配置项,
如果关联配置项未定义,可在关联配置项定义后再对服务器的关联配置项进行修改,关联配置项包括联系人、文档、所连接的网络设备、所属的应用系统(解决方案)等。

  • 添加联系人

    图片 16
    添加服务器所属的联系人信息

  • 添加软件/应用实例

    图片 17
    添加服务器所运行的软件/应用实例

  • 添加解决方案(应用系统)

    图片 18
    添加解决方案

(5). 确认服务器配置项信息无误后,
点击“应用”按钮便可完成服务器的添加操作。

图片 19

确认服务器添加信息

(6).
如果需要对服务器配置信息进行修改,可以选择具体需要修改的服务器信息,
点击“修改”按钮,便可对服务器进行修改操作(如上图所示)。

3. 配置解决方案

(1).
在配置管理功能中,通过搜索配置项或者在配置管理概览界面中选择“解决方案”,新建一个新的解决方案配置项;

图片 20

添加解决方案

(2). 录入解决方案的基础配置信息;

解决方案必须录入的配置项包括:

  • 解决方案名称:
    IT系统名称,如:集中交易系统、融资融券系统、资管系统、OTC系统等)
  • 组织: 管理运维部门,如信息技术部
  • 状态: 启用/停用
  • 业务级别: 根据系统的重要程度设置其业务级别高低
  • 投产日期: 系统的上线运行日期

图片 21

录入解决方案基础信息

(3). 添加解决方案的关联配置项,
如果关联配置项未定义,可在关联配置项定义后再对解决方案的关联配置项进行修改,关联配置项包括联系人、文档、配置项(服务器/网络设备)、供应商合同、服务等。

关联配置项说明

  • 联系人:
    与该解决方案相关的联系人,包括供应商联系人信息、运维负责人信息、业务部门负责人信息及其他关键联系人;
  • 文档:
    系统所涉及到的文档信息,包括安装部署文档、运维文档、应急文档等,由于iTop系统将文档文件存放于数据库中,因此建议将文档放置在项目管理平台上,该处创建的文档类型为网页文档,只存放文档所在的URL路径;
  • 配置项: 系统所涉及到的关联配置项信息,
    包括服务器、网络设备和应用中间件信息;
  • 供应商合同:系统所涉及到的所有合同信息;

图片 22

配置联系人信息

图片 23

配置服务器/网络设备信息

(4). 确认解决方案配置项信息无误后,
点击“应用”按钮便可完成解决方案的添加操作。

图片 24

完成解决方案添加操作

(5). 解决方案添加完成后, 我们可以点击上图右上角的“其他操作”菜单,
在弹出菜单中选择“依赖于”,我们可以看到该方案所有的依赖配置关系,
如下图所示。

图片 25

配置项依赖关系

本文永久更新链接地址:http://www.linuxidc.com/Linux/2017-11/148408.htm

图片 26

2.手持温度测量仪实测,检测机柜或服务器温度。

优点:经济、有效,检测温度精度高;

缺点:耗体力,辐射大。

3.自动检测方法,包括DCIM自动监测装置或CFD 软件预测热点。