数据中心的容量主要包括:空空间、电力、散热、承载、网络。只有这些指标同时存在,数据中心的容量才有。根据国际权威机构Gartner的调查,大部分数据中心的容量利用率只有70%,也就是说损失了30%的容量。然而,大多数国内数据中心将遭受70%的损失。低产能利用率意味着高运营成本和低能效。大多数现代数据中心的所有者都受到低容量利用率的困扰。
数据中心容量的损失通常是由多种原因造成的。一般一个数据中心的设计、建设、运营需要很多年,通常是10年以上,这就叫做数据中心的生命周期。在设计阶段,一般假设所有IT设备的利用率为100%,而新IT设备的电力和冷却需求在早期设计中是完全不可预测的。随着业务的增长,it的需求在不断变化,需要在越来越短的时间内做出IT部署决策,这就导致了容量的碎片化,这些碎片化的容量很难重用,从而造成了容量的流失。
当数据中心投入使用时,我们需要将IT设备部署到数据中心。数据中心使用的IT设备大多涉及不同类型的设备,如大型机、小型机、防火墙、负载均衡设备、交换机、网关、存储和存储交换机等。不同设备的功耗、发热量、重量、体积都不一样。而且,随着时间的推移,新的应用系统越来越多,系统切换、升级、变更,后端服务器、网络设备、存储系统的数量越来越多,数据中心的规模越来越大,管理、运维的成本也呈爆炸式增长,出现了“服务器蔓延”的现象。这不仅对机房的初期规划造成不利影响,也破坏了数据中心运行的环境,造成电力和空调节的容量瓶颈,使运维人员疲于修复和优化系统,不仅导致数据中心的运维工作繁重,也增加了数据中心的运营成本和运维风险。因此,如何省时省力地管理来自众多厂商的异构IT设备对数据中心容量的影响,如何最大限度地降低风险,有效降低运维成本,是数据中心运维团队系统需要关注的问题。
同时,随着计算设备的升级和高密度计算设备的广泛应用,能耗、散热等能源管理对数据中心提出了更高更新的要求。另一方面,业务发展对数据中心资源的需求导致服务器和存储数量的大幅增长,而服务器、存储等设备的快速增长,在环境控制、供电散热、空管理等方面对数据中心造成了巨大的压力。随着应用越来越多,对软件的需求是巨大的,而且与日俱增。应用的增长速度已经远远超过了服务器效率和性能的增长速度。同时,一些研究结果表明,服务器的功率密度每年增加4%,对于大多数类型的服务器来说,单位热负荷都在不断上升。如果不是数据中心管理部门的长期研究和优化工作,数据中心的能源和散热问题将会严重失控,解决与电源和散热相关的问题(电源不足和热量过多)是数据中心最艰巨的任务。
下图是数据中心生命周期与容量的关系,绿线表示设计容量的增长,红线表示实际容量增长的过程。这是由于实际的业务增长对容量的需求与之前的设计计划存在偏差造成的。这将导致容量损失。数据中心的容量不可能达到100%,但如果在生命周期内进行有效的容量管理,可以最大限度地提高容量利用率,减少损耗。
图1数据中心生命周期和容量之间的关系
目标和商业价值
数据中心容量管理流程的目的是确保所有基础设施容量经济合理,并能及时满足当前和未来的业务发展需求。
容量管理为与数据中心基础架构资源容量相关的问题提供了一个管理点。
容量管理的目标是:
生产并保持最新的容量计划,该计划能够反映当前与未来的业务需求;就所有容量和性能相关问题为数据中心深圳生活网业务及相关领域提供建议和指南;通过管理数据中心的基础设施容量,确保基础设施资源的利用率达到或超过设定目标;协助诊断和解决与性能、与容量相关的故障和问题;评估所有变更对容量计划的影响,以及所有资源的性能和容量;
数据中心容量管理负责确保基础架构经过精心规划和安排,以便能够根据SLA和OLA满足当前和未来的业务需求。通过与业务及其计划相结合,能力管理可以提供一个能力计划,该计划概述了支持业务计划所需的资源,同时为这笔支出提供了成本合理性证明。
关键功能
容量管理旨在确保数据中心基础设施的容量和性能能够以最具成本效益和最及时的方式满足不断发展的协议的业务需求。
因此,整个数据中心的容量管理将不断尝试以经济高效的方式使基础架构资源和容量与不断变化的业务需求相匹配。同时,需要调整和优化现有资源,以便有效地预测和规划未来资源,如下图所示。
图2产能规划示意图
(1)容量监控
为了支持容量管理的基本活动,应该对数据中心的电源、冷却容量、机柜位置、U位置空房间、承载、电气端口、网络端口及其使用记录进行监控。收集的数据用作流程活动(如容量分析、容量规划/调整和容量报告)的数据输入,以确保结果的准确性。
数据中心的容量监控应尽可能由深圳生活网自动化,以保证其数据的准确性和连续性。不能自动化的数据也要系统记录,明确相关流程规范,保证这部分数据真实有效。
㈡能力规划/优化
数据中心的服务对象主要是IT设施,相关的容量计算需要其硬件参数的支持。因此,在实施数据中心容量管理之前,应建立IT设备数据库,在数据库中记录IT设施的相关硬件参数,如设备的额定功率、端口号、U位高度、重量等主要参数。
在容量规划和调优上,要支持用户根据自身部署原则和部署设备的硬件参数,智能搜索和匹配容量,帮助用户在空之间快速找到合理位置,降低用户的管理成本。
能力分析
应对通过容量实时监控收集的数据进行分析,了解深圳生活网当前数据中心容量的利用率。通过定期的监控和比对,数据中心管理者可以了解各项容量指标的异常情况,上报非法抢占的情况,并采取相应的措施。
对数据的分析可以揭示以下问题:
基础设施内的“瓶颈”或“热点”;可用资源中的工作负载分配不当;实际负载意外增加;容量安排及利用率低。
评价指标
关键能力指标可用于判断能力管理活动的效率和有效性,一些KPI和指标应包括:
准确的业务预测:
按时生成容量负载预测(报告);容量趋势预测的准确率 ( 百分比 );及时在容量计划中充分考虑业务的发展计划;减少业务计划和容量计划的变化数量。
了解当前和未来的技术:
提高基础设施容量的采集技术;及时根据容量计算要求调整和实施新的采集技术;减少人工录入容量计算参数。
证明经济效率的能力:
减少因基础设施容量超载的情况;减少由于缺少足够的基础设施容量而引起的业务中断;减少生成容量计划的成本。
1 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
2 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
3 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
暂无评论内容