澳门新浦京娱乐场网站-www.146.net-新浦京娱乐场官网
做最好的网站

城里人卡卡管系统运转监察和控制化解方案,国

透过5.28惨案看IT系统化运维,东华网智为您支招

2015年5月28日,黑色星期四,沪指一日连续下破整数关口,上证指数收盘下跌6.5%,深成指下跌6.19%,创业板下跌5.39%,创4个月来单日最大跌幅,全国股民人均赔两万!正当股民们心灰意冷,打算出去看看世界的时候,携程挂了!

澳门新浦京娱乐场网站 1

从11:09分开始,到晚上22:45分恢复,此次携程网站崩溃时间共持续了近12个小时。事后携程的官网解释:经携程技术排查,确认此次事件是由于员工错误操作导致。由于携程涉及的业务、应用及服务繁多,验证应用与服务之间的功能是否正常运行,花了较长时间。

从携程的声明来看,导致此次事件的直接原因是员工误操作造成,但有一个现象非常形象地描述了目前IT运维的真实状况:

系统出现故障后→

1、业务使用者最先发现应用受到影响,开始抓狂和投诉。

2、继而运营监控的各种大屏幕会出现流量的异样图、系统告警图。

3、最后轮到攻城狮们手忙脚乱进行troubleshooting,挨个设备的各种telnet/ssh抓取信息。

4、可以定位故障的,对症解决;不明所以的,尝试重新启动设备或者切换备份方案。

5、提交故障报告、问责、致歉、危机公关等等

目前的IT运维系统,可以查看链路状态,监控设备资源利用率,故障告警,但从业务的角度来说,还缺乏一种手段对这些数据进行系统性的分析,呈现出更明确更有意义的结论,以便在突发事件时,启动预案、快速定位和给出指导性建议。

携程事件再次向我们表明了新常态下,系统可靠性的重要作用,据统计,这次宕机给携程网造成的直接损失超过数百万美元,股价暴跌11%。云计算、大数据、互联网 的空前繁荣,让IT运维面临前所未有的挑战,如何及时全面的掌握网络、主机、数据库、存储、桌面等各类资源的运行情况?如何使我们的运维工作未雨绸缪,做到防患于未然呢?

澳门新浦京娱乐场网站 2

IT运维人员八种痛】

东华网智认为,互联网 时代,系统化的运维管理对企业有着不可估量的作用,规模化的IT系统和复杂的业务系统稳定运行是信息部门的重要职责,如果发生故障不能及时准备定位,引发业务中断,给企业带来的损失是巨大的,同时,企业IT治理、流程规范、智能巡检将有效减少违规操作、消弭隐患,降低故障发生机率。换言之,企业需要一套清晰、智能化的运维管理系统来帮助IT人员提高对整个业务系统的把控能力,而东华网智正是致力于精细化IT服务管理,帮助企业建立健全IT运维管理体系,实现IT“监.管.控”一体化,全面提升IT服务质量。

澳门新浦京娱乐场网站 3

东华IT服务综合管理解决方案技术架构】

“监”之综合监控

对IT基础架构和业务系统的实时监控,能够帮助管理人员准确定位故障,及时处理问题,并在警戒阈值达到前,将系统隐患扼杀于摇篮。东华IT综合监控范围涵盖机房动力环境、网络设备、服务器、数据库、中间件、虚拟化资源、桌面终端、通用服务等IT资源的运行状态及性能,支持SNMP、telnet、SSH、WMI、JMX、JDBC等远程非代理监测和Agent代理监测,根据管理规模不同支持分布式采集和集中管理模式,提供7X24不间断监测服务。系统将复杂的技术指标、监控状态等以图形化方式展现给客户,支持机房、办公区域、场所的3D可视化展现,大大提高用户的操作便捷性及工作效率。  

“管”之性能管理

系统不宕机、应用可访问只是保障业务连续性的入门级要求,在“永远在线”的互联网 时代,最终用户的应用体验成为关键要素。东华网智强调“业务服务视角”,分段监测业务系统的每个过程环节,快速解析应用问题并将问题范围定位到具体的应用组件,帮助运维者实现对业务应用问题的监测、定位和诊断,达到先于用户发现问题,提前建立紧急预案,保障业务可用性,提高用户体验。

“控”之流程把控

携程宕机的问题最终定位为“员工误操作”,实际是流程管控和权限设置不当,“人为因素”在很多IT事故中不是小概率事件,必须要依赖必要的IT手段将流程僵化再优化,将人为因素将至最低,操作是否合规,变更是否合理,访问是否越权,数据是否备份,一切全部由流程铁律进行约束。东华网智IT运维管理系统的目的正是通过建立一套标准的运维服务流程,围绕事件管理、问题管理、变更管理、配置管理、发布管理、服务级别管理等ITIL最佳 实践,帮助用户实现IT运维服务的流程化、规范化管理,最终让IT的“精确化”制约人力的“随机化”。

5.28携程的重大故障虽然是一次灾难,但也为所有的企业敲响了警钟,安全生产重于泰山,一个误操作带来的可能就是毁灭性的损失。在互联网企业各项业务都依赖IT系统的今天,做好IT系统的运维管理工作无疑是保障业务正常运行的核心所在。

专业的事一定要交给专业的系统来做,让5.28事件不再重演,让企业长青!


澳门新浦京娱乐场网站 4


2015年5月28日,黑色星期四,沪指一日连续下破整数关口,上证指数收盘下跌6.5%,深成指下...

【摘要】

互联网的迅猛发展使信息系统建设加快、规模变大,不同的信息系统中设备类型和数量增多,网络结构日益复杂,导致系统故障无法精确定位、系统状态难以实时掌握等问题时有发生,这些都给运维人员带来了很大的工作压力。可视化技术的应用,改变了传统的人工运维,让运维由繁化简。

为促进公共交通持续发展的需要,市民卡运营管理信息部门积极推动卡管系统信息化建设,在业务应用系统开发、基础数据库建设和信息化基础设施建设等方面取得了明显成效。市民卡运营部门对整个卡管系统(包括业务应用系统、基础数据库和IT基础设施)的管理维护能力直接影响到公司业务的正常开展。

2017-11-30擎创科技 孙QQ编

国家核电技术公司(以下简称国家核电)是中央管理的53家国有重要骨干企业之一,采用中央集权式统一管理进行信息化管理,总部具有全网统一规划、统一建设、统一管理的决策权。通过OneCenter IT统一运维平台的全面部署,所有成员单位均可访问总部的统一运维平台,借助分权分域确保数据的有效隔离,实现运维团队内部管理的统一监控、统一流程、统一资产和统一登录,并且完成与国家核电总部统一认证、统一门户和短信平台的接口,实现统一展现的管理目标。

什么是可视化?可视化就是将种类繁多的信息源产生的大量数据,通过映射成几何图元,再描绘成图形和图像清晰直观展现出来。

市民卡运营管理部门主要经营交通IC卡及IC卡应用电子系统的建设、维护、管理,IC卡的充值、清算、发放,以及IC卡收费系统机具设备的销售和维修。

*
*

项目背景

对于运维来说,可视化就是提供一种高效、一致性、透明化、面向用户的服务,也是运维的价值所在。如下,我们从四个维度来探讨运维可视化。

公共交通卡(即交通IC卡)主要应用于公共交通领域,包括公交车、轨道交通等应用。另,市民卡运营管理部门一般会有几百个公共交通卡自营网点及代理网点。

当前互联网和移动互联网发展迅猛,从事各个行业的企业为了应对日趋激烈的市场竞争,纷纷进行了数字化转型,利用移动互联网技术、云计算及大数据等新兴信息技术发展企业的数字服务,从而吸引客户,帮助销售和推广产品,提升客户体验。

随着信息化发展,国家核电已完成所属公司25家单位网络接入工作,集团广域网设备达到60套,局域网络节点约1500个。随着IT系统运行环境日趋复杂,业务对IT系统的依赖度提高,IT运维管理已经成为企业重要组成部分。国家核电运维管理部肩负着主干网建设、维护、运营的使命,致力于提供安全、高效、快捷的IT服务。

从业务角度看,构建业务应用分析模型,对各业务系统进行横向对比分析,包括健康度、繁忙度、可用性、宕机次数、宕机时长等,准确衡量业务系统的健康水平差异。图形可视化呈现用户、业务和应用系统的相互关联关系,一方面掌握应用系统异常对业务、用户的影响和威胁,另一方面实现IT与业务交互,将IT对业务的支撑价值完整体现。

行业特性

然而,随之而来的是规模不断扩大的IT系统、日益复杂的系统架构,以及海量的IT运维数据,同时公司业务对IT系统的连续性要求也进一步提高。

随着IT系统规模不断扩大,构成IT基础的设施呈现出规模庞大、结构复杂、品牌众多的特点,林林总总的网络设备、服务器、存储、虚拟化、中间件、数据库、应用系统等让运维管理人员难以从容应对,依靠手工方式已无法保障系统稳定性,为此需要一套IT集中监控系统,以便快速发现故障及定位,提高运维团队工作效率。

业务视图

卡管系统对于网络质量要求较高,卡管机房中心到全市各网点线路应保障通畅,故障应及时上报和处理;

面对这些新形势下的挑战,IT 运维管理(ITOM)需要从原有的人工加被动响应,转变为更高效、更智能化的运维体系,为新形势下的IT系统保驾护航。

在流程规范方面,运维管理中心还处于初级的IT服务管理状态,在组织结构、管理规范、管理流程和技术支撑方面,还未构建综合的IT服务管理体系。网络、设备、系统、用户等的管理和服务处于分散、无关联状态,没有实现数据、信息和知识库的共享,也无法实现规范化和流程化。

从网络架构角度看,网络架构图天然记录了系统的拓扑结构,可有效了解网络系统,然而由于缺乏有效的管理,网络架构图普遍存在规范性差、版本混乱、信息单薄、获取困难等问题, 清晰直观展现和管理网络架构图的重要性愈发凸显。网络拓扑图以图形化的方式,显示整个系统中主要设备的实时运行状态,动态生成实时的数据流向图。

卡管系统对于IC卡电子设备维护能力要求较高,一旦出现故障应有专门的服务流程平台报障、维修和跟踪;

当前传统的 ITOM 工具往往缺乏分析能力,虽然也能采集到运维数据,但无法对这些数据所包含的信息进行洞察,更加无法将数据进行知识化的本质提升。研究机构Forrester 曾在之前的一份报告中指出:“这些工具为我们提供了大量的原始数据,但能洞察出埋在这些数据中的有价值信息的能力还是非常稀缺的。”(来源:Turn Big Data Inward With ITAnalytics)

综上所述,无论人员组织、流程规范还是技术工具方面,国家核电运维管理中心都提出了迫切的改进和建设需求,以建立一套适应业务和管理成熟度客观规律的科学化IT服务管理体系,有效支持业务的稳定运行与发展。

网络拓扑视图

卡管系统的应用服务器数量较多,应用服务器均需要有保密和备份机制。

令IT运维团队感到欣慰的是,智能运维(AIOps)踏着人工智能的时代浪潮应运而生。

建设目标

从故障管理角度看,全面采集设备资源、应用、服务等告警信息,多种告警机制,自定义配置告警阈值。将告警信息数据按照时间、资源、性能类型等维度以图表等形式展现。当业务系统出现问题时,可直接定位故障源头并将报警信息及时推送给运维人员,保证运维人员第一时间了解故障点并进行解决,对各种问题进行统计分析,多元化的展现给运维人员。

为促进公共交通持续发展的需要,市民卡运营管理信息部门在政务管理信息化、信息服务社会化方面做了大量工作,在业务应用系统开发、基础数据库建设和信息化基础设施建设等方面取得了明显成效。

Gartner在2016年发布的报告中首先提出了基于大数据及算法(Algorithmic IT Operations)的 IT运维概念。随着人工智能的快速兴起,Gartner 将 AIOps 的概念从原本的基于大数据及算法,扩充为基于人工智能(ArtificialIntelligencefor IT Operations,AIOps),期望通过大数据、现代机器学习及更多高级分析技术,提供具备主动性、人性化及动态可视化的能力,直接或间接地提升目前传统IT运维(监控、自动化、服务台)的能力。

国家核电是中央管理的53家国有重要骨干企业之一,需要从各个方面对全国各级单位进行统一管理。国家核电决定开展统一运维监控项目,实现总部及所有成员单位的统一运维流程管理、统一运维监控管理、统一IT资产管理;总部与各成员单位统一使用一套运维平台, 通过分权分域确保数据权限的有效隔离。

统计分析视图

随着信息应用的专业化程度不断深入,其网点规模愈发庞大,应用的复杂性越来越高,业务开展高度依赖信息化平台的支持,整个卡管系统的管理维护能力将直接影响到信息化应用的正常开展,因此对IT管理部门的支持与服务保障提出了较高的要求。

AIOps 为IT运维提供了全新的管理思路。AIOps 的定义涵盖的两个阶段,可概括为两个层次的提升:数据到信息分析层次的提升;信息到知识提取层次的提升。

国家核电希望通过全国范围内统一部署网络运维平台,建立起一套综合性、整体性的大运维管理体系;同时要求运维平台能够较强的扩展性,具备方便、快捷整合第三方软件与平台的接口和能力,从而建立规范有序、运作顺畅、确实有效可行的运维机制,全面提升集团及二级单位信息化服务的支持与保障能力,实现从粗放运维到精细运维、从职能管理到流程管理、从被动服务至主动服务的转变。

从运维交付角度看,服务流程管理结合了ITIL最佳实践,对服务请求、事件、问题、变更、发布等流程进行工单管理,有助于构建量化的服务质量管理绩效体系,跟踪和监控服务整个过程,以便衡量业务可用性和连续性;加强了客户和服务台的服务态势感知能力,改善和提升IT部门的服务能力,体现运维部门价值。

市民卡运维部希望通过先进的技术手段和管理理念,实现对整个设备网的实时监控和全面管理。

澳门新浦京娱乐场网站 5

平台设计思路

流程交付视图

现状描述及需求分析

从数据到信息的分析,更多的是采用数据统计方法,帮助运维相关人员更好地从众多运维数据中了解系统的运行状态,分析并定位故障,实时获取统计数据。而信息到知识的提升更多的是希望借助人工智能算法,在信息分析的基础上通过机器学习的方式实现异常状况检测、故障/趋势分析、故障关联和精准告警。

勤智运维为国家核电设计的IT运维管理平台包括:“IT运行集中监控、IT运维流程服务、统一运维门户”三个部分。底层基础平台主要实现对底层数据的采集、存储、分析等工作,为上层监控及流程系统提供基础数据;IT运行监控主要完成对基础设施故障、性能、配置等方面的全面监控管理,实现主动式的IT管理;IT运维流程服务主要根据IT服务管理的国际标准ISO20000,并结合ITIL最佳实践,梳理出事件管理、问题管理、变更管理等运维流程,实现对日常运维工作的流程化、规范化管理,提升IT服务的质量。统一门户主要实现对监控信息、运维流程信息的集中展示。

从数据的意义上看,数据质量的高低、优劣,将直接影响运维分析和决策。借助大数据平台针对性进行运维数据分析,可以挖掘出更多更细的指标和数据,通过将数据整合关联,可以辅助精准分析和决策,最终保障良好的用户体验。简而言之,数据可以产生价值。

为了满足业务需求,市民卡公司不断扩充卡管系统设备资源。比如,某卡管系统全网网络设备的数量多达100多台,设备厂商多达5种,还有近100台主机和应用系统,终端用户数量已经上万。然而,市民卡运营管理信息部门管理人员较少,面对多个厂家、不同类型的网络设备、主机及应用系统,一旦出现故障,难以定位故障原因并及时有效解决。

根据权威机构Gartner的预测,比起现今5%这样的数据比例,到 2019 年,全球25%的公司都将系统性部署实施 AIOps 平台支持两个及以上的主要 IT 运维功能。到2022年,40% 的大型企业会通过大数据和机器学习的能力来帮助甚至逐渐取代传统运维中的监控、服务台及自动化流程。

平台三个子系统关系如下:

运维大数据分析视图

v 需要对卡管系统IT软硬件统一监控管理,及时了解IT软硬件设备的运行趋势,快速定位故障;

AIOps重新定义了IT运维的管理方式,为IT运维团队适时提供适当信息,以便实现以下几点。

(1) 以IT运行监控为“基础”

可视化运维基于系统中各种设备的运行状况,能及时发现系统中出现的故障,并采取相应的措施保障系统的正常稳定运行,帮助运维人员解决问题、提高效率,让运维由繁化简。

v 当设备或应用系统出现故障后,能通过预置的报警方式及时通过邮件、短信等方式通知指定管理人员,并能生成告警分析统计报告,提供主动式的故障解决方式。

通过采集当前环境中的运维数据,集成现有IT运维管理工具,利用聚合数据分析的技术,对IT系统中各个环节的问题进行快速定位、故障排除和预测。

IT运行监控是对被管对象运行的状态以及其配置资产信息进行统一监控、管理、分析,对系统运行性能进行实时监控,并对各种状态信息进行汇总、分析以及预测。另外,还包括对IT系统的全部配置资产统一管理,对配置信息的异动进行检查及告警。

解决方案

对来自业务环节中各个分布系统的数据进行整体分析,合理优化IT服务,挖掘关键业务 KPI 指标,反哺业务端,帮助其做出明智决策。

(2) 以IT服务管理为“导向”

澳门新浦京娱乐场网站,根据市民卡运营管理部门的运维需求,勤智建议采用OneCenter运维监控平台。

通过大数据和人工智能技术分析用户的行为日志和运维数据,发掘潜在的系统安全和合规问题,为企业的信息安全保驾护航。

IT服务管理主要依据ITIL架构进行建设,为IT系统的维护服务提供电子化的控制手段。系统通过事件管理、问题管理、变更管理、配置管理等功能,为IT维护人员提供以流程为基础的服务管理方式,以便快速消除IT系统故障、解决潜在问题,减少不规范的系统变更引发的系统故障率和故障隐患,实现对IT系统的主动式服务,提高服务水平。

通过资源监控管理功能,统一管理卡管系统中的各种资源,监控网络设备、主机的运行情况;利用报表分析功能,根据用户自定义的方式周期性提供设备负载分析相关报表;针对卡管系统运维管理人员关注的数据,提供个性化支撑和多种效果展示;通过告警管理功能,在卡管系统出现故障后,及时通过短信等方式通知运维管理人员,并生成告警分析统计报告。

澳门新浦京娱乐场网站 6

(3) 以统一运维门户为“展现”

逾期收益

那么AIOps究竟在IT运维中有哪有典型的应用场景呢?常见的场景大致如下。

统一运维门户是整个系统的对外界面,通过统一的权限管理和统一风格的B/S展现,为系统的操作使用人员提供统一的系统接口,做到一点接入,通观全局,能够以灵活的展现方式,定义用户、角色、组织机构,并为每个不同角色提供不同的功能模块,为每个用户分配不同的展现内容,方便用户进行集团整体的运行维护管理。

通过OneCenter一体化监控功能实现全网上千种IT资源的统一管理;

全局日志检索

解决方案

通过OneCenter的故障告警功能,可以直接获得IT资源的故障告警通知; 

以一个典型金融行业为例,他们有上百个业务系统,面对每天产生的大量日志数据(几TB),日常运维过程中,当运维人员需要排错或日志巡检时,需要逐台登录服务器, 无法集中查看和管理日志数据;另外,日志查询方式比较原始, 比如 Windows 服务器,手动查看Event Log, Linux服务器则只能通过less、grep和awk等常见的Linux指令,无法从时间段、关键字、字段值统计等方面进行多维度查询。

勤智运维以统一运维平台为依托,结合国家核电实际情况推出一体化智能运维管理平台解决方案。

远程无代理模式的监控,不需要现场到设备跟前,也可以及时了解设备的运转状态;

AIOps平台通过收集各类数据源(包括操作系统、系统软件、数据库、应用日志等),统一进行管理。不同于以往每次仅可查看数量有限的几种日志,运维人员可通过智能运维平台所提供的关键字、统计函数、单条件、多条件、模糊查找等功能,在多个系统中快速定位故障信息,帮助运维人员从全局视角查看系统的运维数据信息。

统一资源监控:资源管理范围不仅包括传统的主机、网络、软件、应用资源等 IT 基础设施,还支持存储、虚拟化、链路设备等。通过资源可视化管理、运维自动化管理、知识管理等,实现智能的IT运维,使运维工作越来越轻松。

通过报表管理,收集设备每周每月的状态。

复杂多维报表,应用深度监控

平台使资源运行可视、拓扑可视、网络状况可视;实现了分权分域,不同二级单位和不同权限的人只能查看和管理自己权限范围内的数据。

方案亮点

AIOps将各系统的运维数据进行统计分析并生成各类实时报表,对各类运维数据(如应用日志、交易日志、系统日志)进行多维度、多角度深入分析及可视化展现,以业务视角实时展示各种业务指标,具体如下。

值得一提的是,系统发现重大问题时可以通过集团统一短信,通知相关运维人员,并可通过短信回复实现流程工单处理,提升了运维事件发现问题、处理问题、解决问题的效率。

以IC卡电子应用和企业管理信息化为主攻方向,同时完善信息网络,统一标准体系,强化技术保障,确保系统安全,实现各部门、系统间的信息数据资源共享、互连互通; 建成卡管工程部调度控制和安全生产的现代化保障体系。勤智IT运维成为市民卡运营管理部门信息化建设道路上的有效助力。

快速发现故障,精准告警

澳门新浦京娱乐场网站 7

实时采集各类运维数据(日志、监控系统告警、性能数据等),通过对历史数据的挖掘和分析,AIOps 可以找出哪些告警和事件是频繁一起出现的,并将其认看作同一类故障的告警,从而把多个告警和指标合并,推送给运维人员,做到精细化告警,避免传统监控工具因一故障而导致的告警风暴,生产告警噪音。

统一流程:国家核电集团总部初期一共梳理出七支流程,包括事件、问题、变更、发布以及停电申请、广域网线路申请、广域网停运申请、三支垂直化申请流程,现已经全面运行,产生了一万多个流程工单。国家核电总部增加了垂直化管理流程,二级单位可直接提交工单到集团,加强了集团化运维管控能力。

缩短故障解决时间

同时,机房巡检实现了人工巡检与智能巡检的结合;在人工巡检时,自动调取业务监控状态,并可以通过人工确认提交巡检单。

通过运维数据可视化(复杂多维报表,热力图)及精细化告警信息,结合以前发现问题的经验知识库和模型,从而将运维信息从平面变为立体,立体展现故障树分析,通过推导路径使运维人员对于问题的定位更加快速、直观,使得问题的解决更加容易。

通过统一流程,规范了IT运维团队工作标准,对运维事件、问题、变更、发布、知识等流程实现统一管理,统一运维理念得到进一步落地。运维流程中,实现短信通知以及短信回复驱动流程工单,大大提高了运维效率。

预测未来

通过与服务支撑系统的配合联动,最终实现PPTR(ITSS标准四要素:人员、流程、技术、资源)的统一管理,从而更好的支撑IT运营目标。

进行数据挖掘,生成分析类报表,进行趋势/容量/故障预测。例如,某些故障之间有时间上的先后关系,交换页不足、内存不足会逐渐导致系统故障或应用故障,该系统建立关联模型,发现前者故障,提醒用户可能后继可能发生系统故障或应用故障。在故障产生真正业务影响前,告知运维人员事先解决问题。

澳门新浦京娱乐场网站 8

IT辅助决策支持

统一资产配置管理:根据国家核电集团的资产统一编码规范,运维团队梳理出计算机设备、网络设备、安全设备、终端设备、存储设备、输入输出设备、机房辅助设备、计算机软件八大类别,共计58个子分类,目前已经有效地管理近万个资产。

通过采集海量多维度数据,构建多元结构化底层数据仓库,以搭积木的方式适配各类运维场景,并在场景里刻画系统和人员画像,通过画像形式来辅助企业进行IT 决策。

通过固化IT资产编码规范,核电集团实现IT资产的统一录入、统计及全生命周期管理;可以按照成员单位展现和查看资产视图;在资产维保到期时收到提醒,包括短信提醒和系统提醒。

澳门新浦京娱乐场网站 9

业务服务可视化管理:统一运维平台从业务角度出发,提供可视化的业务视图,可直观查看业务架构及业务系统所依赖的组件;业务系统性能、故障信息在业务视图上统一展示;从业务角度提供性能、容量趋势分析,可提前预知业务性能和容量瓶颈,进行容量调整,从而避免业务故障发生;当业务发生故障时,可通过业务视图快速定位故障根源;统一的业务视图,让业务部门和IT部门能够拥有统一的管理视角,从而保障业务稳定。

AIOps与现有ITOM平台的关系具体如何呢?传统IT运维管理平台,即 ITOM 平台,往往是为完成单一管理任务而设计的,更偏向于管理某一细分专业领域。

综合报表管理:系统自动获取支撑业务系统的所有IT资源的运行数据,为用户提供性能报表、告警统计、TOPN报表、可用性报表、趋势报表、分析报表和综合报表7种报表,作为IT设备性能分析、IT投资分析、资源调配等决策动作的数据依据。

监控系统:负责IT系统的健康及可用性管理

澳门新浦京娱乐场网站 10

IT服务管理平台:负责配置管理,资产管理,事件/问题/变更等服务流程管理

澳门新浦京娱乐场网站 11

SOC平台:专注于信息安全管理

领导视图:提供面向国核总部和各下属单位的整体管理视图。领导视图集中展现总部和各二级单位统一的广域网流量分析、设备故障分类、业务可用率、工单解决率统计等信息,便于各级领导及时了解全网的整体状态。

APM平台:应用逻辑拓扑管理,应用故障诊断等

统一展现:通过部署统一展现子系统,为总部及二级单位领导实时提供全网范围内的网络可用性、业务可用性、运维支持能力和运维分析报告。同时,统一展现将监控子系统、流程和资产子系统在一个页面中集中展示,提高系统易用性和操作便捷性;无需访问各个子系统,国家核电就能通过统一展现了解监控告警、流程和资产的所有信息。

城里人卡卡管系统运转监察和控制化解方案,国家核电统一运营管理平台案例。而AIOps平台则构建在传统ITOM平台的上层,把ITOM作为分析的源头,通过接口集成将各个 ITOM平台组件中的孤立运维数据进行汇总,使其突破数据孤岛的壁垒,其次借助自身的关联分析、机器学习、数据建模、全局搜索能力,帮助企业从IT系统的行为、状态、配置、故障和事件中等多个维度,产生趋势预判、快速故障定位和商业洞察等价值。

澳门新浦京娱乐场网站 12

澳门新浦京娱乐场网站 13

统一运维门户:通过与集团总部统一门户有效整合,OneCenter帮助用户实现快速认证登陆、用户信息实时同步,省去了多系统之间单独登录的繁杂操作。通过将用户的代办工单等信息实时同步到统一门户,实现国家核电内部办公信息在门户网站的统一呈现;用户在门户网站即可实现相关工单的处理和查看,极大的方便了用户的操作。

在信息架构与应用系统日渐庞大的今天,如果再通过人工分析定位的运维方式,很难适应目前日益快速增长的业务需求。规模不断扩大的 IT 系统、日益复杂的系统架构,以及海量的 IT 运维数据对使用传统ITOM的运维人员而言都如芒在背。因此,我们有理由相信AIOps能够帮助企业及各类运维人员在大数据中找到合适的发展模式。现在是时候用一些类似人工智能的思维方式来为IT产业服务,使大数据的分析方向转到IT运维上了。

建设意义:经国家核电及各成员单位的共同努力, IT统一运维平台目前运行效果良好,完成了既定的工作目标。

目标达成:

1、完成与国家核电总部统一门户的集成,并实现单点登录和统一待办。

2、完成与统一认证平台用户同步的接口,实现与统一认证平台的集成。

3、完成与统一短信平台的对接,实现告警短信发送、工单短信通知、短信回执推动工单流程等流转,实现移动办公。

4、完成统一监控部署,确保所有成员单位指定监控设备的添加和监控、告警阈值调整、分权分域的管理模式。统一监控实现了对各单位网络、主机、服务器、数据库、业务系统的实时监控/报表统计/预警告警等功能。

5、完成统一流程部署,确保所有成员单位均通过统一的事件、问题、变更流程,实现运维工作的可追溯和绩效考核等,并实现成员单位向总部发起的垂直化管理流程,强化了集团信息化统一管理。

6、完成统一资产部署,让所有单位的资产都具有符合国家核电统一资产编码,并实现资产信息化的统一管理。实现集团IT资产的统一录入、统计及IT资产全生命周期管理。

7、总部及各单位信息化领导可通过领导展现视图,直观了解整个集团及本单位的网络可用率、业务可用率、运维支持能力。

通过OneCenter IT统一运维平台的全面部署,IT运行集中监控、IT运维流程服务、统一运维门户三者实现有效整合,不仅实现了国家核电统一管理的管理目标,充分保证了国家核电IT系统的可用性及可靠性,还可随国家核电业务系统的发展而扩展,为国家核电业务发展提供有力的IT支撑和保障。

本文由澳门新浦京娱乐场网站发布于服务器,转载请注明出处:城里人卡卡管系统运转监察和控制化解方案,国