数据中心冷却那些事
虽然数据中心运营商的冷却管理比十年前要好得多,但许多设施仍然面临着容量不能充分被利用及浪费能源等问题。
Upsite科技的高级工程师、数据中心冷却专家Lars Strong表示,气流管理的最终目标是更好地控制IT进气口的冷却温度设定值,同时使得传送至数据大厅的空气量最小化。
AdaptivCool是另一家专门从事数据中心热管理的公司,该司技术总监沃利。菲尔普斯与Strong一起,列出了他们参观过的数据中心中最常见的一些问题,如下:
1、隐藏的泄漏:冷空气从活动地板下的空间中泄漏出来,进入到相邻的空间或支撑柱中。菲尔普斯表示,这种泄露相当的普遍,并导致了IT环境中的压力损失,从而使得别处满是灰尘的热空气或潮湿的空气进入进来。避免这个问题的唯一方法便是去活动地板底下检查周边和支撑柱,并 住你发现的任何漏洞。
2、太多的开孔地板:在热通道和空白区域放置开孔地板是毫无理由的。这样会浪费冷却能力。还有可能是在机架的进气口放置了太多的开孔地板。IT机架顶部的温度低于正常温度便是一大危险信号。
3、未密 的活动地板开口:尽管许多的数据中心运营商已经努力密 了电缆开口及活动地板中的其他漏洞,但很少人真真正正地完成了这项工作。剩下的漏洞会导致大量的冷空气逸入不被需要的区域。配电单元或远程电源板等电气设备是寻找未密 开口的一个特别重要的地方。
4、机架密 性不好:把备用面板放置在空的机架区域是气流管理的常识,然而并不是每个人都会这样做。一些机柜没有被设计好,安装钢轨与机柜边缘之间被 死。关心效率的经营者会密 那些开口以及机柜底端的潜在开口。
5、温度和湿度传感器刻度不准:有时供应商使用了未校准的传感器,有时刻度会随着时间的推移而变得不准确。这将导致管理不善的冷却单元不能协同地工作。Strong建议运营商每六个月校准一次温度和相对湿度传感器,并且在必要的时候进行相应的调整。
6、让CRAC互相牵制来控制湿度:使两个CRAC互相牵制的另一个好方法是给相邻的CRAC供以不同温度的循环空气。因此,CRAC得到不同的湿度读数,一个结束加湿,而另一个正在干燥空气。解决这个问题需要巧妙地理解湿度图,并准确的设置湿度控制点,菲尔普斯说。
7、物以稀为贵:许多的数据中心运营商预置了过度的冷却能力。如果拥有的冷却能力大于所需,并无法保证过剩的CRACs的安全,那么整个的冷却方案都会被连累,因为太多的单元处于低效率状态。地板下的冷却温度很高,且某些机架很难被冷却时,运营商一贯的反应便是运行更多的冷却单元。然而与直觉相反,正确的做法应该是运行更少的CRACs来降低负荷,菲尔普斯说。
8、闲置的机柜空间:这是另一个明显的因素,但出于某种原因没有被每个人所重视。当一个或者多个机柜空间被空置,将会破坏气流平衡,导致废气循环进入冷通道,或是在冷通道损失冷空气。这种情况将导致过度冷却,及供应多于实际所需的空气来弥补损失。
9、糟糕的机架布局:理想情况下,你想把机架按加热/制冷分别排成一行,并把主要的CRACs放置在每行的两端。拥有一小块机架且没有特定的方向并不能帮助任何人。无论是从前往后排列机架,还是使CRACs与IT行的方向相同,都无济于事。
10、冷却管理没有受到应有的重视:没有想到改进冷却管理方式的好处,使得运营商的容量搁浅并花费了更高的运营成本。做一些如安装备用面板等简单的工作就可以从中获益,但它们常常被忽视。在极端的情况下,一个管理良好的数据中心冷却系统甚至可以推迟扩张或建立新的设施。