www.hj8828.com 4

空间过小的隐患 小型机房的散热策略(1)

数据中心的设计一定会包含空调系统,但许多较小型的企业由於IT设备较少,并不会特别建构机房,而是把IT设备部署在办公室的角落或仅是一个独立的房间,由於没有专属的空调设备,常会造成IT设备的电力密度超过负荷、过热甚至造成当机。大多数的小企业都忽视了这个问题,等到过热的问题发生後,才开始寻求改善的方法。在本文中,将会说明机房散热的基本原则,并分析各种散热方法的优缺点,协助企业选择合适的设备(BKJIA推荐阅读:太热啦!从网络恶搞到机房散热)。

数据中心内设备众多,内部虽然有完善的空调系统,但实际上内部温度分布是不够均衡的。即便现在的数据中心部署了出入通风道,机柜前面是入风道,后面是出风道,这样可以及时将热量带走。不过,由于不同的设备发热功率是不同的,局部区域若放置有大功率设备,容易造成机房局部区域过热现象,威胁数据中心的安全运行,甚至造成个别设备因过热而宕机、硬件损坏等严重问题,所以将数据中心机房内的温度控制在一定范围内,消除或降低局部热点是非常重要的。为保证数据中心长期稳定运行,改善IT设备的运行环境,消除局部热点、降低机柜局部温度,下面我们就来探讨一下数据中心局部热点处理的一些方案。

  为刀片服务器散热有五种基本方法。一旦选中了其中一种方法,可以用多种不同产品和方法来具体实施。

  为刀片服务器散热有五种基本方法。一旦选中了其中一种方法,可以用多种不同产品和方法来具体实施。表1对此进行了概述。  

www.hj8828.com 1

  要应用刀片服务器,必须选择其中一种方法。这种选择要基于目前设施的制约因素以及用户的需要和喜好。

  应用方法的选择

  了解了现有设施的制约因素并且在用户的各种需求和偏好间进行了适当取舍之后,就可以从前面所述的5种基本方法中做出选择了。刀片服务器的应用方法的选择是基于散热问题的,因为这些问题是实际系统中最主要的制
约因素。确定应用方式后,电力供应问题也就随之确定了。

  影响应用方式的最主要的不确定因素就是刀片服务器的密度问题。许多用户更愿意将刀片服务器以最大密度安装。在现有的数据中心环境中这往往不是一个恰当的选择。实际上大部分刀片服务器都采用模块化的机架结构,可以以较低的密度在机柜中安装。例如,IBM
BladeCenter采用独立的机架,一个机柜中可以安装1到6个刀片不等。虽然降低安装密度看上去没有充分发挥刀片服务器的优势,但实际上系统的成本、可用性和安装速度都有所提升,特别是在现有的数据中心环境中安装刀片服务器的情况。

  目前的许多数据中心设计的功率密度为每个机柜2kW甚至更低。在这样的环境中按每个机柜10-30kW的功率安装刀片服务器时,这些刀片服务器需要消耗大量的电力和散热功能,这与机房最初的设计不成比例。正因为这个原因,在现有数据中心中安装刀片服务器时节省空间通常是没有实际好处的。因此,在现有数据中心分散放置刀片服务器是既实用又划算的。以饱和密度安装刀片服务器通常只是在专为支持高密度方案新建的机房设施中比较划算——安装规模极大或者空间极其狭小。

  因此,刀片服务器安装的核心选择就是刀片服务器安装的分散程度――即每个机柜中安装多少个刀片。用户选择的刀片服务器的品牌和型号可能会制约刀片的分散程度,例如,一些刀片服务器采用独立的机架,这种设备就易于分散安装。而另外一些刀片服务器采用一种底板系统,这种系统使得分散安装不切实际。要了解有关这
个问题的更全面更详细的讨论,参见与具体刀片服务器品牌相关的“APC应用说明”。按照前面所述的五种主要刀片服务器应用方法规划好刀片服务器的应用密度后,其结果如表2。  

www.hj8828.com 2

  

www.hj8828.com 3

  表2表明,在30种不同的功率密度和应用方法组合中,有大约11种首选组合和7种临界的组合――共18种比较切合实际的应用方式组合。要选择最佳方案,必须把数千种用户的偏好、制约因素和现有的条件等数据与这18种应用方式组合进行比对。这种比对需要进行广泛的分析,遵循许多规则,这一过程可以象软件运算一样进行。但本白皮书中不做详细叙述。

  在开发工具进行这种分析的过程中,我们得出了在实际工作中经过长期观察得出的一些关键的经验:

  如果在房间中需要安装的刀片服务器机柜超过总机柜数量的25%,那么现有的数据中心的电力和散热
系统可能需要进行全面改造。这说明如果安装数量达到这个限度,用户就需要重建一个机房,否则就得把数据中心关闭一段时间进行系统改造。

  如果现有的数据中心计划安装1到5个刀片服务器机柜,那么为了将对数据中心正常运转的影响降到最低,同时降低安装成本,以饱和密度的25%或50%的数量(如每个机柜中最多放置3个机架)进行安装最合适。对大多数数据中心来说,实现非常高的功率密度所需的成本比增加几个机柜位置所需的空
间成本要高得多。

  现在的数据中心一般都是为系统设备整体提供散热和电力供应,辅助散热方案能够以较低的成本提高应用密度,同时达到可预测的散热效果。

  不当做法

  下面列举了数据中心管理人员平时经常会采用的一些方法和做法,但这些方法是有缺陷的,对解决问题帮助不大,而且往往会使情况更糟。

  降低空气温度。用户通常会通过调低机房空调的温度设定来降低机房的空气温度,以解决数据中心中出现的一些热点。这是用户操作最容易也是最差的做法。采取这种做法会降低空调系统的能力,大大增加增湿器的水消耗量,大大降低数据中心的运行效率(结果还会让你帐单上的电费增加)。所有这些都会发生,而问题根本
得不到解决,因为这是气流的问题,而不是空气温度的问题。

  地板格栅。另外一个看似合理的措施就是把垫高地板的通风地砖换成气孔更大的格栅。这种格栅的样子不是我们所熟悉的带孔的地砖,而是有点象火炉篦子。这种方法对于孤立的机柜会有帮助,但会有严重的副作用――特别是大量使用这种地砖的情况下。在数据中心使用这种地砖通常会导致其它区域的气流减少,但更重要的是这些格栅会引起地砖间的气流发生重大的不可预测的变化。这一问题在APC白皮书46“超高密度机柜和刀片服务器的散热策略”中有详细说明。

  机柜顶部风扇。在机柜顶部安装风扇的情况非常普遍――尽管这些风扇对于一个设计完好的IT机柜中一点好处也没有。服务器过热的原因并不在于机柜内部,而是在于服务器前部进入口处的热空气。这些风扇只能是产生
更多的热量,甚至会降低一个设计优良的数据中心的散热能力。许多用户在目的不明确的情况下按照传统的规格确定风扇的规格。也有一些与机柜配套的有效的风扇辅助设备,这些设备在APC白皮书42“解决应用高密度服务器引起的散热问题的十个步骤”中有更详细的说明。

  孤立机柜。有时候用户会把机柜从整排机柜中单列出来,试图在一定范围内降低机柜密度,让通风地砖的气
流能够更多地接触到机柜。但是这种方法使得设备排出的热气在机柜周围回流到服务器的进气口。整体效果并不是很好。更好的方法是让机柜处于热通道和冷通道的安排中,在刀片服务器机柜之间用带隔板的不加负载的机柜隔开,加宽冷通道,使用辅助散热设备和/或热通道密封系统来增强散热性能。

  结论

  在现有数据中心中应用刀片服务器会给数据中心的电力和散热系统带来压力,这种压力不容忽视。有多种方法可以用来给刀片服务器提供电力或散热功能。针对某一具体安装的最好的方法要根据现有设计的制约条件和数据中心管理人员的需求和喜好而定。

  本文概要阐述了涉及刀片服务器应用的相关事宜和选择。还描述了根据现有数据中心的制约因素和用户需求来选择应用方法的流程。

參考:

散热的基本原则

www.hj8828.com 4

IT设备耗用多少千瓦的电,就会制造出多少千瓦的热量来,然而,高温却会影响IT设备的运作,一般来说执行关键任务的机房,温度建议应保持在25℃以下,若是只有网路交换机等设备的非关键机房,温度上限可放宽到32℃。要彻底解决热的问题,最根本的就是要有效散热,否则热就会在IT机房内不断的累积,温度便会节节升高。

一、现状调查

一般而言,热的流向是从温度较高的地方往温度较低的地方流动,就像水会往低处流一样,因此,想要散热就必须提供一个能让热流向更低温的地方的通道。但在现实的环境中,并不一定有这个通道存在。不过,可以利用下面五种方法,将办公室或机房内的热量有效散去。

数据中心产生局部热点的原因主要有以下7个方面:

■传导:热透过实体的物品传递出去。

1.单个机柜对应的穿孔地板的送风量与机柜内IT设备所需的风量不匹配造成机柜内温度升高。

www.hj8828.com,■被动式对流:不使用风扇等空气导流的装置,让热量自然透过通风孔或气窗流入低温区域。

2.机柜内空闲U位空隙造成机柜内温度升高。

■主动式对流:藉由风扇等导流装置,将热量透过通风孔或气窗排至较低温的区域。

3.同列相邻机柜间空隙造成机柜内温度升高。

■室内空调降温:藉由建筑物的中央空调降温。

4.机柜底部与静电地板间空间造成机柜内温度升高。

■专用空调降温:透过机房专用的精密空调系统进行降温。

5.热负荷与投入制冷量的匹配不当造成机柜内温度升高。

图1假设在一个无特殊环境下的机房,根据空间的用电量与期望的目标温度,提供一个普遍的散热方法,说明上述几种散热方式的适用范围。这些方法界定不应该被认为是绝对的,因为有些还是相互共用,并且在最终设计时,还须考量到全盘的冷房变因。请注意,在本例中并未讨论室内空调,因为室内空调有太多难以预测的变数,这部分会放在後面再作说明。

6.机柜孔密度与设备风量的匹配造成机柜内温度升高。

www.hj8828.com 5

7.数据中心设备随着使用时间的延长,机柜内一些老旧设备发热设备自身产生的热风无法高效的被排出,造成机柜内涡流,致使机柜内压力高、温度高,形成局部高热。而局部热点的现象容易造成机柜内的设备运行环境恶劣,发生设备损坏等问题,进而造成经济损失。

▲图1根据电力负载与目标温度的散热方法指引。若在一个装设1500WIT设备的机房,为了将温度维持在25℃,那麽最佳的作法则建议采用主动式对流法。

二、可行性分析

www.hj8828.com 6

在机房中我们选取设备出风口方位作为机柜平均温度观察对象,实测机柜温度为43.8度:业内标准为:35度+5度或35度-5度范围

图2为选择散热方法的流程图,可以协助企业初步选择最适合的散热方法。再次提醒,室内空调降温不在此建议解决方法内。

这个机柜温度达到了43.8度,超过标准温度最高值3.8度。

现在针对此现象,我们对降低机柜温度的可行性进行了研究:

开孔地板手动风阀-可行(预计改善2度)