互联网使各项工作变得更加便利,而承载这些业务和工作的网站则肩负了巨大的责任。面对某些互联网企业的规模庞大、结构复杂的数据中心,必须有一个功能强大的网络管理软件来进行管理。其中一个大规模的互联网企业为了提升用户的满意度,降低网络故障带来的损失,经过了多年的考察以及小范围内的多次试用,最终选择了游龙科技的网络管理系统来协助其保证网络的稳定。
面临的挑战
对于网管系统来说,想要实现一个庞大复杂的数据中心自动运维有着几方面的难点,而最大的问题在于底层网络设备的监控。对于网络规模庞大、网络设备众多的企业来说,从功能度的角度来看,想要落实底层的网络监控必须要完善几千个相关的监测指标,同时,这样规模的网络对于一个网络运维系统的性能是一个严峻的考验。
其次,规模大的企业网络运维人员比较多,而且不同的运维人员管理的网络所面向的业务和部门也不尽相同,如何针对这些运维人员做到合理完善且便于更改的权限划分也是一个比较棘手的问题。
第三方面在于针对网络管理者的报表呈现。某些企业的网络管理部门的领导倡导精细化管理,这就要求网络运维系统对于网络的规划、运营、升级等工作提供出客观的依据,究竟哪些业务系统需要增加服务器、增加投入,那些业务系统的IT开支应该压缩,这些取舍都需要有深层次的报表提供依据。
解决办法及亮点
面对着多重的考验,游龙科技经过深入的分析研究以及数次的实地考察,采用了业内先进的分布式架构来应对数据中心底层网络监控带来的挑战。他们将整体网络进行有效的划分,在各个划分出来的网络中放置了负责采集底层数据的网络运维系统服务器,最后通过一台总服务器对这些分布在各个网络区域的子服务器进行管理。利用这种分布式的分级管理,使得多台服务同时监测几千个运维指标成为了现实,而且,在这几千次的数据检测中,故障问题的报警正确率达到了100%。不仅如此,游龙科技在针对大规模级别的项目中实现了创新性的“自适应网络运维”模式,使得网络的运维工作更为自动化,更为智能。
举例而言,某个企业每年的业务有30%的增长,当他们每增加一台服务器的时候,他们并不需要针对这台服务器重新配置网络运维系统,被监测对象可以自动被添加进网络运维系统中,同时网络运维系统可以根据该网络设备所承载的业务应用自动设置报警阀值以及相关的报表。
用途和特性相同的网络设备,游龙科技实现了批量调整配置,大大缩短了网络运维系统的配置时间,提升了用户网络升级改造的速度,加快了新业务系统的上线时间。可以说,在底层的网络监测功能中,游龙科技不仅成功地解决了面临的困难,而且迎难而上,做出了巨大的突破和创新。这个创新充分解决了网络运维平台和系统管理方法的对称性问题,而这个创新也是游龙科技多年的经验积累所衍生而来的产物。
在网络运维系统的性能方面,游龙科技的网络运维系统基于自有的数据库,可以支持很大的并发量,同时,在几千个网络节点的轮巡中,平均轮巡频率在5分钟左右,系统可以根据不同的轮训时间对网络设备进行分组监测,这样就可以大大的降低系统的并发监测数量,提升网络运维系统的性能。
在针对网络运维人员的权限设置划分问题上,游龙科技将自身的经验与用户的需求相接合,根据用户的人员结构、职能划分设计出了合理的权限树,并且利用自身的先进技术使得这个权限树的易用性达到了最佳。
在报表呈现方面,游龙科技根据网络承载相关业务的特点,提供了详细、丰富且多样的报表,使得网络的管理者在进行网络的升级改造工作中掌握了第一手的数据资料,为网络的发展提供了丰富的数据保障。
项目的意义
对于网络运维系统来说,无论是底层的数据采集、还是管理者的权限设置、报表的生成,这些功能并不是什么新鲜话题。但是,在大规模级别的案例中把网络运维系统的各个功能和性能特点都充分发挥到位并且加以功能创新,这是非常不容易的,就好比一个人管理一个花园很容易,但是如果让一个人管理一片森林就很困难。
这个大规模的案例标志着国产网络运维系统在功能度和性能方面上升了一个新的台阶,也标志着用户对于网络系统的认识和应用进入了一个更新的阶段。
网友评论