对话百家医院,锐捷“乐享”实力破解医院十大高频IT运维难题
互联互通
精细化管理
高效运营
……
打造智慧医院,信息化建设日益复杂
业务系统相互融合,日常管理复杂度持续加大
信息中心面临巨大挑战
近日,百家医院医信大咖相聚线上
对话锐捷网络
乐享智能运维管理平台
现场一一破解医院十大高频IT运维难题
PART 1 IT资源监控管理类
关注度:★★★★★
Q1:监控指标多而杂,有很多无用指标的问题我之前遇到过,非资深运维工程师说不清楚这个指标是什么意思、干嘛用的。
答:您好,这个问题在乐享智能运维管理平台里面会解决,业务专家会进行模型领域分析、用途分析、部署形态分析(几种部署方法)、关键属性分析、与周边对象在业务上如何交互分析等。梳理出常见的故障分析(现象、原因、排查步骤、处理步骤)、容易忽视的风险分析、为了满足故障和风险分析需要的指标、这些指标怎么采集(协议、指令/脚本、运算规则)、其他需要关注的指标/信息项。此外,也考虑到在监控系统中如何展示,才更符合用户的操作习惯,如:哪些信息需要重点展示,哪些需要合并展示等。
Q2:我院的网络结构每年都会变动一两次,之前用的运维软件,每次变动完都得重新在系统上手动去更换设备。乐享智能运维管理平台是否能够支持自动识别网络结构的变化、自动更新网络拓扑呢?
答:您好,这是可以支持的,系统后台会定期执行发现任务,发现网络结构的变化后,会将不可用的资源标记为“无法被监控”,会将新增的资源呈现在拓扑中,调整节点布局并保存就可以了。
PART2 业务系统故障快速定位类
关注度:★★★★
Q3:请问业务系统自动发现拓扑、关联分析,关联的前期工作是自动的吗?咋知道业务系统关联的对象呢?
答:您好,自动发现的原理是采用命令方式采集每台服务器的进程通信列表并交叉匹配,通过进程名、IP和PORT(端口)汇聚出所有服务器上应用的通信关系,绘制出应用间的连接关系拓扑,根据操作系统的进程特质,构建OS间的部署和运行关系,通过SNMP、SSH、IPMI等协议的方式发现网络设备、服务器的连接关系,结合CMDB中的管理和属性数据联邦,形成实体设备与物理机房、机柜的映射,从而实现IT资源间复杂关系的关联。
因此,在所有的应用服务器操作系统发现并纳管之后,由运维人员指定应用系统相关服务器的范围,然后系统即可通过以上方式自动发现支撑应用系统运行的各类组件,并自动绘制组件的关联关系。在业务部署拓扑中呈现业务运行环境各组件的运行状态,帮助运维定位责任主体。
Q4:我院也有业务访问问题,请问定位业务卡慢环节的这些数据是怎么获取到的?
答:您好,我们是通过对用户访问业务系统的数据包分析来实现用户访问体验的量化的。在用户访问业务系统的数据传输路径上,选择一个位置做用户访问业务的全流量镜像,从全流量数据中获得所有真实用户访问业务系统时产生的网络数据包,然后通过深度包分析技术进行分析,通过应用响应时延、服务器建连时延/成功率、网络时延、DNS查询时延/查询成功率等指标量化用户访问业务过程中各环节的体验,帮助运维人员定位业务系统卡慢的原因,保障业务系统的稳定运行,提升问题处理效率。以便获取用户访问业务的全量数据。
PART3 日常巡检防患风险类
关注度:★★★
Q5:乐享智能运维管理平台能够做到提前发现数据库的风险,原理是什么?
答:您好,我们梳理了近百家医疗行业客户最近两三年发生过的故障实例,对这些故障实例发生前的特征表现一一标注和梳理,并对客户业务场景出现故障时的分析逻辑和处置办法进行汇总整理。针对每一类故障,我们的数据库专家团队(来自京东、360、每日优鲜等大厂)根据这些实例故障前的特征,整理出来若干风险隐患,包括如何识别、如何分析、如何处理,并结合自身多年的数据库维护经验对以上信息进行完善和补充,从而为客户提供了这个可以开箱即用的风险识别与分析的知识库。
单资源报告
多资源报告
Q6:请问我院有好多的交换机,有些科室私自接交换机拉网线,还有有些科室乱弄网线导致网络有环,这些通过乐享智能运维管理平台都怎么处理?
答:您好,乐享智能运维管理平台有个IP地址管理的功能,如果是下面另外私接小HUB,我们就会扫描到一个IP对应两个MAC地址,同时也能看到上联设备和接口,可以快速找到设备并要求整改。
另外,后期我们也会推出网络风险检查功能,去检查设备有没有开启防环指令,来避免环路。
同时也给个小建议,针对环路问题,需要在对应的网络设备上开启RLDP等环路防护协议,尽量减小环路的影响范围。
PART4 项目管理类
关注度:★★
Q7:每年项目都很多,预算分配简单,管理难,你们有好办法吗?
答:锐捷乐享智能运维管理平台具有项目管理功能,支持新建资金来源、资金使用方向分类,可实时统计、呈现资金使用进度,支持对某项资金池做费用调整或撤销处理,让费用流向清晰可控。
Q8:如果通过乐享智能运维管理平台对项目进行分类,原则是什么?
答:您好,项目分类原则主要是根据院内项目管理规定来灵活分类,客户可自定义项目模板,当前以西安交通大学第一附属医院为例,项目分类原则是按照项目的形态和特性分成四大类:软件类项目、货物类项目、工程类项目和服务类项目。像软件类,就是要关注是否有复杂需求变更、软件开发周期等,每一类都会有自己的管理规范。
PART5 其他类
关注度:★
Q9:锐捷有没有服务流程的方案,进行故障报修?
答:您好,我们医疗行业解决方案里有流程的方案,可以进行科室故障报修、项目管理、值班排班等,现在很多三甲医院都有应用。
Q10:我们医院之前也用过锐捷的RG-BMC运维平台,新的乐享智能运维管理平台对比之前老品RG-BMC有什么新亮点吗?
答:您好,感谢您一直以来对锐捷运维产品的信任和支持,对比老品,主要有以下5点:
◎ 系统架构:
采用K8S+Docker架构,保证系统高可用,应对大节点和高并发不卡顿。
◎ 业务监控:
① 24小时拨测感知业务系统故障,早于业务部门发现故障,提升信息部门口碑;
② 自动生成业务拓扑图及数据流图,会随设备调整自动更新,异常快速定位。
◎ 健康检查:
内置开箱即用的风险检查库,可自动识别风险隐患,并给出处置建议,帮助医院避免常见故障的发生,大幅提升效率。
◎ 故障定位:
① 利用黄金指标体系,保证告警可精准推送;
② 通过告警压缩技术,合并同类告警,摆脱告警风暴;
③ 基于多年累积的运维经验,明确问题根因,提供可能的原因及处置建议。
◎ 工作台和报表:
通过拖拉拽操作,灵活定制运维工作台,实现高价值数据统一呈现,快速满足运维管理者和运维工程师不同角色个性化管理需求,节省使用时间,提高管理效率。
微信扫码关注该文公众号作者