安科瑞 张双
摘要:本文将从数据中心运维管理的角度,联系现实情况,对运维管理进行研究,期望通过本项目的研究,显著提升数据中心运维治理的整体质量。这样,才能充分发挥大数据的价值,并推动企业加速发展。
关键词:大数据;数据中心;远维管理;策略
0引言
目前,我国经济形势向好,为我国企业的发展创造了有利条件。随着大数据时代的到来,企业越来越重视数据中心的运维管理,现在,需要找到一种切实可行的方法来进行管理,只有这样,才能保证这些数据的价值。
1数据中心面临的问题
1.1预警资料的准确性需要改进
从企业的角度看,所面对的数据信息越来越多,有的与企业的运营密切相关,虽然可以通过数据中心进行分析,但实际效果有待于进一步提升。在实际应用中,数据信息的使用数量很少,特别是对数据的深度挖掘还不够。数据是一种特殊的资源,它会直接影响到生产和建设,对于企业来说,要想实现管理的精细化,就需要要发挥数据信息的作用。根据目前的现实状况,在监测信息数据时,一定要确保信息数据的分析更具**性,若仍以人工模式,资料的处理将会变得十分困难[1]。目前已有研究表明,人工操作的效率较低,很大地影响了数据中心的运营,制约了其进一步的发展。要成功地解决该问题,可充分运用数据挖掘技术,即要将传统处理方法和优势算法有效地结合,这样就能更好地进行数据分析和调查,减少工作人员的工作量。
1.2运维经验知识化
对于一个数据中心的操作和维护,要求操作人员需要有丰富的工作经验,所以,新来的员工需要从前辈那里学到东西,才能在短时间内提高自己,但这样做的缺点也很明显。
一是培训的全过程要耗费太多的时间。我们知道,在培训初级运维人员时,他们需要集中精力进行故障检测、识别等工作,这需要更长的时间和更多的资源。
二是在运行维护工作中,不能忽略有关人员的主观判断,但是,这种能力的培养是非常困难的。
三是,如果一个企业的运维人员离开了公司,那么他们可能不会将自己所学的知识全部教给接班人,这会对运维造成很大的阻碍,严重的还会造成企业的亏损。
要解决这个问题,就需要建立一个完整的数据中心,把工作经验转化为专门的知识。在进入大数据时代之后,人们能够获得的数据越来越多,并且获得的方式也越来越多样化。这样就可以巩固知识库的建设,收获的资源也会更多。在此,数据主要由内部数据和外部数据两个部分组成。这里需要指出的是,要对内部数据、外部数据进行**的分析和转化,并把它们转入知识库,如此一来,这个问题就可以得到很好的解决,并且在很短的时间里,就可以完成对人才的培训,从而减少企业损失。
1.3运维流程标准化需加强
在进行数据中心的运维管理时,需要保证所有的流程都是相互的,而为了确保管理和监督的顺利进行,就需要充分利用智能化平台,这样能够让管理人员真正地理解到运维的细节,并进行控制,从而针对运维的缺陷进行解决[2]。从当前的智能平台来看,它的构成部分涵盖了业务活动的方方面面。要保证对相关的设备实施有效的监控,需要结合具体的条件,制定出一套切实可行的计划,在遇到紧急情况的时候,可以在*短的时间内,将工作订单发送给有关人员,让他们在*短的时间内完成工作,并且整个过程都是按照规范的要求来的。
2大数据时代数据中心运维管理策略
2.1重视管理人员的作用,提高整体素质
如果要使数据中心的运维管理更加有效,那么管理者就需要做好自己的本职工作。站在企业的立场上,应注重人才的培养,运用更为**的经营思想,而且,还要确定企业的管理环境是否*适合。企行业应当根据运维管理的真实需求,对他们进行培训,使得其具有较强的理论基础和实际应用能力。要采取切实可行的方式,加强运维管理人员的**文化素质,确保整个管理队伍的质量有很大的提升,还需要清楚每个员工的责任,彼此之间应当建立密切的合作关系,从而提高协同管理的有效性,确保了运维管理工作的正常开展,并取得预期的成果。
2.2提高分析业务环境的意识
从目前的数据中心运维管理现状来看,问题比较多,技术升级也比较停滞不前,运营设备太老,管理效率没有提高等,而造成上述问题的根源在于没有进行恰当的业务环境分析。为了确保运维管理的结果能够实现期望的目标,需要对数据信息进行更新,而在建设数据中心的过程中,要确保信息技术的功能得到充分的发挥,所以,以信息化为导向的创新可以促进数据中心的运维管理效果更加理想[3]。在开展运维管理工作时,设备与技术水平还远远达不到要求,相关的人不太了解工作情况,也不太善于分析,要想解决这一问题,我们需要注意以下几点:首先,我们要给运维管理人员提供必要的信息,让他们每个人都有一本**的手册,只有这样,他们才能了解到当前世界的发展。其次,根据规划,安排有关部门就存在的问题和行业发展等进行交流分析,通过这种方式,他们可以更好地理解运维管理的发展方向,从而更加主动地参与到运维工作中,并贡献出自己的智慧。第三,要对维护人员进行鼓励,让他们以沦为的方式来提升自己的业务水平,当然,论文的质量需要得到控制,期刊的权威也需要得到评价,在此基础上,进一步加强了对运维管理工作的了解,提高了对运维管理工作的认识。
2.3建设自动化运维管理平台
随着大数据时代的到来,数据中心的发展速度越来越快,但面临的挑战也越来越严重。在建立数据中心时,需要保证选用一种实用的运维管理模式,*大限度地发挥自动化平台的功能,这样可以很大地提高数据处理效率,提高管理的时效性。目前,随着数据中心运维业务规模的不断扩大,为了确保运维管理的**有效,企业需要对所选择的软件和硬件进行优化。在建立自动化运维平台时,要充分运用远程控制技术,这样可以使得数据更一致。合理地设置平台的关联和衔接,可以让平台的层次划分更加顺畅[4]。此外,由于数据中心的运行比较复杂,所以与之有关的运行管理人员对其业务水平的要求也比较高。在平台的功能设计中,应**行业务的分类,然后保证设置过程的顺利实施。
在此要说明的是,在平台运行的时候,会出现故障,因此,需要要确保自动提示和报警设备的作用*大化,同时能够顺利地传递报警信息,从而使问题的处理更加有效。
3安科瑞数据中心综合解决方案
3.1电力监控解决方案
电力监控系统实现对数据中心中低压配电系统、UPS、蓄电池组、ATS/STS、精密配电柜、电源支路电流、PDU机柜电源以及其它重要设备进行监视、测量、记录、报警等功能,实时掌握供电系统运行状况和可能存在的隐患,快速排除故障,提高数据中心供电可靠性。
3.2电能质量治理解决方案
数据中心常用设备为不间断电源系统UPS、LED照明、IT服务器等,易产生谐波电流和三相负载不平衡问题,电能质量监测和治理装置可根据负载运行情况进行实时的检测、分析并跟踪治理,为不同负载类型的电能质量问题提供合适的设计解决方案,以达到改善供电质量和确保电力系统安全经济运行的目的。
3.3智能小母线监控解决方案
数据中心IT服务器配电传统采用精密配电柜,占用空间较大,配电线缆多,新增设备不便,为了节省面积,智能小母线方案由于不占用机房面积、可按需灵活插拔,受到很多数据中心的青睐,被越来越多的应用。
安科瑞智能母线监控产品分为交流和直流母线监控两类,包括始端箱监测模块、插接箱监测模块以及触摸屏,另外还可以搭配母线槽连接器红外测温模块用于监测母线槽的运行温度,确保母线槽配电安全。通过标准网线手拉手简单组网,可以实现任意插接箱检修或更换时不影响其他在线运行的插接箱的数据上传通讯。
3.4动环监控系统解决方案
通过数据中心动环监控系统,实现了对数据中心的门禁状态、水浸状态,烟雾状态,视频状态,环境状态,高低压配电状态,设备运行状态进行实时监测,并进行实时报警,保障数据中心正常运行,避免运行环境的失控导致配电设备运行故障,保证维护人员安全,延长设备使用寿命,减少配电室粗放式管理导致成本过高。同时实现动环监控并对各用能耗能进行能效分析,帮助用户实现用能效率的优化。
系统功能
1)展示当前数据中心总能耗,IT能耗,空调能耗,及其他能耗并且计算出当前数据中心实时PUE值,通过仪表盘形式直观展示。
2)选择查看数据中心的中低压配电系统主接线图,并在一次图显示配电系统当前遥测、遥信数据和状态。实时监测各配电柜的电压、电流等电力参数,变电站的温湿度、烟感、水浸、门禁等环境情况。
3)电气接点温度实时监测,断路器触头、触臂、母排和线缆连接等位置安装无线测温传感器监测接点温度,便于提前发现温度异常导致的事故。
4)监测各变压器各项参数,包括负载率、频率、功率因数、三相不平衡度等,并且显示历时曲线图,数据实时变化。帮助用户直
5)电能质量在线监测,可以监测电流和电压谐波畸变率、电压暂升暂降暂中断等暂态事件记录、ITIC容忍曲线等
6)系统采集UPS输入、输出端和旁路三相电压、电流、有功功率、功率因数频率,同时监测UPS温度、蓄电池电压、当前负载下的剩余时间等数据。
7)展示单体电池电压、内阻和温度,预测电池带载时剩余时间,每节电池数据均可以设置异常报警,及时发现蓄电池异常。
8)展示精密配电柜内进线和馈线回路电气参数,包括电流电压功率电能以及开关状态,并可以对数据进行报警设置和分级,数据取自精密配电柜测量模块。
9)展示智能小母线的始端箱和插接箱电气参数,包括电流电压、开关状态、插接点温度,并对数据进行报警设置和分级。
10)通过平面图显示数据中心能源分布,设备分布情况,并显示设备能耗数据,点击平面图上设备可以进入具体设备监控界面。
11)实时显示当前数据中心PUE值以及历史PUE曲线。并且显示各分项用能的用能情况及用能排行。监测各变压器运行及负载情况,给出本月变压器输出电能排行。
12)显示电能消耗日/月/年报表,并可对具体回路选择曲线图、饼图进行展示。对数据中心用电数据进行同比、环比分析比较,查看用电趋势。
13)监测精密空调的回风温湿度,出回水温度,并可以设定精密空调的温湿度,达到更好的控制效果。
14)监测数据中心温湿度、开关门、水浸、烟雾、噪声、气体浓度状态等参数。曲线图直观明了,同时支持历史数据查询
15)通过列表显示各类报警事件数量,通过柱状图显示逐日报警数量,提供报警总数以及增长趋势。
16)维管理功能,可针对数据中心各主要设备进行巡检派工,消缺,抢修等维护工作。
3.5蓄电池监测系统
安科瑞公司***T系列铅酸蓄电池在线监测系统是在线电池监测产品,可以提前对失效的铅酸蓄电池进行预警及电池均衡,符合ANSI/TIA-942标准要求。
该系统具有监测电池的电压、内阻与内部温度功能,安装、维护与接入非常方便。系统主要由***T-S模块、***T-C模块及***T-M采集器组成,可通过采集器查询告警与实时数据、设置参数等,可选配监测平台实现网络化集中管理。
4平台部署硬件选型
4.1电力监控、电能质量监测