浅谈数据中心监控管理系统的发展趋势

2020.04.22

作为一个集中存储,处理,传输,交换,管理数据信息的关键性物理空间,随着互联网时代的深化和企业信息化网络的全面搭建,数据中心正进入下一个飞速发展的黄金时代。在迎来市场需求激增的同时,也面临着越来越复杂的运维管理所带来的重重挑战。目标在前,思路先行,共济监控管理解决方案专家史俊为您解读未来数据中心监控管理的五大趋势,让我们共同探索未来之路,让数据中心的管理更简单!

202004浅谈数据中心监控管理系统的发展趋势.jpg

史骏 | 共济技术顾问,运维专家




202004浅谈数据中心监控管理系统的发展趋势00.jpg

01数据是核心   

数据是数据中心管理的基础,数据的完整性、准确性、颗粒度都会影响管理的有效性。数据也是数据中心从“成本中心”向“利润中心”演进的动力源泉。因此监控管理系统的建设中,数据是重中之重。

1、数据的完整性要求:数据中心管理所需的数据包括:性能、资产、人员、业务、财务等。系统应当具备数据采集全覆盖的能力,具备自采集和子系统整合能力,而非仅仅关注上层业务功能。

2、数据的准确性要求:在数据采集和整合的过程中,应对各类型的数据做统一的报文格式、告警定级、联动策略的规范化设计,确保所有数据都说同一种的“语言”,提高数据的治理和应用效率。通过业务流程及服务,定期对数据进行校准,确保数据的置信度满足管理要求。

没有完整准确的数据支持,任何的智能化、AI应用都是空中楼阁。


202004浅谈数据中心监控管理系统的发展趋势01.jpg

02 场景化   

监控管理系统的建设需要紧扣用户的实际应用场景,而非简单的功能设计。充分考虑数据中心运维管理工作的共性和不同行业的个性,参考管理规范的要求和现场使用者的特点来搭建属于用户的管理工作体系,并用合适的交互界面落地实现。

监控管理系统需要与企业内部的其他管理系统整合,如ITSM,以实现诸如变更、事件等管理流程“双闭环”,通过“双闭环”逻辑,打通各组织和部门之间的信息流和业务流,实现各种业务场景在"业务"和"实务"两个层面进行有机的整合,相互联动,双向核准,提高工作效率,还能从宏观角度掌握整个业务流程的处理情况和绩效数据,为优化服务水平、提升服务能力奠定坚实的基础。


202004浅谈数据中心监控管理系统的发展趋势02.jpg

03 “两端、两边+一平台”  

不同于互联网应用“极端”关注用户体验的需求,数据中心的监控管理系统需要兼顾两个“端”,即用户端和感知端,通过感知端采集完整准确的数据,通过用户端为各维度的用户提供业务应用;为了保证两个“端”的有效服务,需要构建两个“边缘“,一是靠近感知端的边缘计算,事件联动,实现快速事件响应;二是靠近用户端的边缘发布,全局性冗余,保障用户的应用感受和服务响应能力。平台侧则是数据+业务能力群集,并整合各类支撑业务的专业子系统。


202004浅谈数据中心监控管理系统的发展趋势04.jpg

04 精细化   

精细化管理是一种理念;源于发达国家的一种企业管理理念,它是社会分工的精细化以及服务质量的精细化对现代管理的必然要求,是建立在常规管理的基础上,并将常规管理引向深入的基本思想和管理模式,是一种以最大限度地减少管理所占用的资源和降低管理成本为主要目标的管理方式。而影射在数据中心监控管理系统的设计上可分解为两个层面:

1、细化管理颗粒度:数据中心管理的颗粒度需要逐步的深化、细化,将原有基于机房一级的管理颗粒度向模块、机柜、设备、板卡、端口等级别层层深入,将蜷缩在高维度的海量信息降维展现出来;管理人员可以通过系统从各个维度(人、事、物、时间、空间)掌握数据中心的每一项信息,并可以从每一个细节入手,发掘数据中心的潜力和问题。

2、通过标准规范减少管理成本:所有的服务将是标准化的流程,并在系统上建立统一的服务目录,所有来自于内部或外部的服务请求均有与之相对应的自动化流程驱动流转;所有的流程和节点都应经过反复的推敲和实践,尽可能的减少无效操作和误差,充分发挥标准化带来的整体效益。


202004浅谈数据中心监控管理系统的发展趋势04.jpg

05 智能化   

数据中心智能化管理已经是当前数据中心运营管理的热门话题,通过智能化运营可以最大程度的优化管理结构和流程,节省运营成本,提高数据中心可持续运行的稳定性,优化运行方案,实现节能环保的政策性要求。

在夯实数据地基,贯通业务逻辑的基础上,数据中心智能化监控管理可以有几个方面发展:

1、告警的智能化关联和根本原因分析(RCA):即系统收到多个告警时,分析其根本原因(或主要告警的真实来源)和受影响的范围,并根据策略自动关联发起事件流程及通过必要的手段提醒相应的人员。

2、分析历史资料(包括告警信息、维修信息、运行信息等),从中发现潜在的隐患,并通过必要的手段提醒相关人员执行预防性维护流程(Predictive Maintenance Program,PdM),来消除或减轻风险的发生机率和影响程度。

3、智能搜索和关联事件相关的经验教训、SOP、EOP等,为管理员执行事件处理时提供有效的知识支持。

4、有自学习能力,自动通过对收集到的数据中心运行数据进行学习建模,结合专家系统转化为:1、数据中心运行环境参数模板,用于判断和侦测运行异常状态;2、通过智能控制,实现在满足边界条件的基础上,最优化设施运行方案。


返回

上一条数据中心监控行业第一部国标正式实施,共济拍了拍你
下一条《建筑智能化工程》送审稿研讨会圆满召开
400-8810-181

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级