| |
| 破解IT系统维护难题的探索 |
|
|
| www.comcw.cn 2007-08-22 09:14 中国通信运维网
|

上海天玑科技有限责任公司 总监 滕长春
很荣幸能够参加今天这个高层论坛,另外很高兴在这里有机会和大家进行交流。下面我代表天玑科技有限责任公司在IT代维系统维护方面做一些探索。 其实IT代维系统的维护探索实际上是在IPO这个领域。今天我报告的内容有两大块,第一个是简单介绍一下天玑公司,第二个是把天玑公司在代维服务方面的经验分享。 那么天玑科技公司是一个比较年轻的公司,我们公司01年10月在上海注册成立,当时是由6位前中国惠普资深经理人发起成立。今年3月我们非常荣幸地邀请到前中国惠普的高级副总裁担任公司的CEO。我们成功地吸收了HP、IBM、富士通等著名厂商的工程师,来共同发展工作。公司在08年形成覆盖全国的服务网络平台,更好地位我们国内的运营商或者是其他行业的用户提供全方位的、专业的IT技术架构。 那么我们天玑科技的目标是成为一家令人尊重和信赖的IT服务供应商,并且是不带任何的倾向,比如说产品或者是服务偏向的公司。 到目前为止我们的IT服务领域共分三大块,一块是S和M,针对硬件产品,比如说网络服务器存储和安全这些硬件设备的保修和支持。另外一方面是为用户提供IT领域整个的产品服务、解决方案、培训、咨询等等专业的范畴。第三块就是我今天所汇报的,是IT的代维外包,为我们一些选定的,尤其是重点的电信运营商的支撑网以及它的办公网,提供外包和代维的解决方案。那这是我们天玑公司目前三大块的IT服务产品的类别。 我们天玑并不是做IT的,但是我们IT涉及的范围很广,我们侧重的领域主要是技术平台和架构的层面。是区别于一般的集成商和开发商,我们主要是侧重软件架构和硬件架构还有中间件、数据库、操作系统、网络、服务器、存储等等安全的架构。理论讲是可以为各个行业的用户服务。那么到目前而言,我们天玑公司最重要的服务的客户主主要是来自电信行业。 那么到了今年,我们基本上已经形成了对整个东部地区的业务覆盖,那么明年我们基本上会形成一个全国的覆盖网络。天玑公司虽然很年轻,发展历史也不长,但是我们公司非常注重企业文化的积累和建设,我们奉行客户至上的理念,我们用开放、灵活、鼓励创新,通过团队合作达到共同目标,以城为本,不断学习根据业绩获得奖励,信任并尊重个人,共同发展公司文化。这个文化理念是我们天玑公司所尊崇的价值观。 我们天玑公司的总部在上海,06年我们全国服务的销售收入达到了8000万人民币。05年我们通过维保和运维外包通过了ISO9001体系,05年我们建立了7×24小时的8000/400客户的服务中心。HP和IBM还有HDS和Symantec、SUN等公司是我们合作伙伴。我们的公司有正式员工165名,其中技术工程师115名,随着业务的发展,我们年底会突破200名的员工数额。我们公司现在是跨平台,以及异构平台下的技术环境团队。我们给客户提供一揽子服务的综合性产品。这就是为什么天玑可以为大型的客户提供整体的IT的代维外包解决方案。 这是我们公司代维和维保的ISO9001认证的证书。这一页是讲我们天玑公司在公司内部有一个大的演示试验的环境,有业界最住列的服务器存储、网络、数据库备份等等的环境,我们可以帮助用户做一些升级测试、迁移测试等等。包括我们在运维过程中、代维过程中,如果前方有一些问题,我们在这里可以通过应急的情况进行故障问题的重现,来进一步进行问题的定位、诊断和解决。同时为我们的用户提供非常好的培训和试验的环境。这是我们天玑公司的亮点。 下面讲一下我们天玑公司几年来的代维服务的一些心得。运营商的网络实际上就是非常复杂的,有各家各代的产品。实际上在维护和使用的过程中,我们运营商的IT的业务支撑的部门,面临着非常多的一些挑战和难题。比如说人手紧张,一个人要同时是多面手,是千手观音或者是救火队员,或者是项目建设的执行者等等。另外,就是说在维护、项目建设包括厂商的产品等等各方面,都缺乏一整套有效地考核和评价的机制。对于多年建设所形成的这样一个庞大的网络和平台环境,整个资产管理不过明晰。 另外由于多年来形成这样的环境里面,涉及大大小小国内、国外综合的厂商。怎么跟这些厂商进行有效地沟通,都是摆在面前一个非常重要的课题。 面对越来越复杂的运行网络,运维工作消耗了我们大量的人力和物力,另外有一些重复性的耗时耗力的工作。而一些重要的工作又控制在相关人士的手里面。对于IT技术人员的挑战越来越大,他们实际上没有更多的精力深造和发展。这都是摆在我们国内运营商面前困惑的问题。也有一些运营商接收到外包领域,那么怎么通过外包降低成本,解决他所面临的问题,更好地为他的业务和网络进行支撑?这都是摆在运营商面前的问题。 那么我下面通过我们天玑公司通过几年以来,在IT系统里面的经验的积累,来试图在解决这些问题方面,提供一些有建设性的探索。 那么实际上,几年以来,我们有关的厂家运营商已经在IT方面做了一些尝试性的工作,我们天玑公司实际上在03年开始在国内成为第一家做BOSS的厂商进入代维领域。实际上,都是从业界、运营商和服务厂商的角度,已经非常重视这个代维和外包的新兴的市场了。那么天玑公司也是从IT服务这个大的市场,我们几年以来,一直专注在服务领域,那么代维也是我们其中一个非常重要的组成的部分。 针对运营商所面临众多的困惑和一些问题,天玑公司提出了我们自己的解决方案,就是专业的公司做专业的事。那么我们推出了系统平台、代维和外包服务产品还有解决方案。来帮助运营商达到增效和解决困惑以及IT系统维护和管理的一些难题。 几年下来,我们已经有一些大的比较成功的案例,比如说我们03年有浙江移动IT系统的平台支持服务,那么现在浙江移动IT系统的平台支持系统有上千台的网络设备,都是天玑集团进行维护的。那么还有江苏移动、网通的IT系统平台代维服务。 那么天玑的IT系统的代维,我们有一个清晰的定位,主要是面向大型的客户,比如说电信运营商这样的级别,对它的IT系统的平台,基础架构层面,就是说应用软件以下的管理和维护,主要是系统级的硬件和软件的平台。而我们的目标是通过天玑专业的代维服务的管理理念,我们专业的服务团队,来帮助运营商提高它的业务支撑IT系统维护平台的质量和维护水平,使我们的用户可以集中精力发展自己的主业。在风险得到有效控制的情况下,享受到高效、安全的IT的服务,提高它自有客户的满意率。并且使我们的客户获得一个非常好的服务的体验,因为服务于这种产业是一种体验经济,不是像其他的销售或者是代理通过实物或者是载体可以体现,用户的体验是非常重要的。 那么天玑实际上这张图里面,比较清晰地展示我们代维服务的模型。那么我们天玑是大大小小的SP之间,我们作为一个统一的负责的点,来帮助用户做好他的基础架构层面的管理和维护。 现在很多省,一些运营商里面,维护工作都是交给集成商或者是开发商做,但是国内很多的集成商和开发商要么是说集成对于产品或者是解决方案掌握的能力不够深,或者是应用厂商更注重业务和应用的层面,它对于架构和管理还有团队不受重视。所以,这样多多少少会给我们的运营商的IT系统维护方面带来问题。那么天玑的介入,实际上可以有效地帮助我们的运营商解决这样一个问题。通过天玑专业服务的引入,可以帮助我们的运营商更有效地对其自有的客户做好服务,集中精力做好自己业务的拓展,那么IT工作人员可以集中精力进行市场的配合,他可以有自身更好的发展空间和实际的专业计划。 那么开展服务的前提,是要定义好有关各方的界面。那么这张图是把我们和运营商一个很好的分工的界面,用户更关注自己的利润以及内容、应用服务,那么我们通过网管系统进行报警,故障及时发现排除,并且对用户系统进行加固、审计、健全等等。参与系统用户的建设,做好系统建设,变更管理,容量管理。这样我们通过和运营商的配合,可以实现对整个的IT系统平台有利地支撑和保证。 为了确保我们这个服务可以有效地开展,我们设定了这样一个组织的架构,我们称之为自己的体系。我们在每个代维服务试验场,会组织一个现场的团队,为用户提供贴身的服务。另外我们有热线中心,接受您的呼叫请求和投诉建议等等。同时我们组建一个专家的团队,作为我们现场服务的后端的资源。 在公司有大型的试验环境,可以帮助用户做故障的定位、深入分析等等,以及它在一些迁移、升级甚至做一些灾难恢复测试等等,这些都是可以全方位地帮我们的用户做IT系统的管理和运维。 另外强调一点,我们的IT代维不是说替代我们运营商自己的服务团队,我们是跟他有效地进行沟通,我们共同来维护和管理我们的运行环境。我们在这里有模型,来明显分工的说明。我们是跟运营商的管理团队一起,共同做维护的管理。 实际上天玑公司虽然规模不是特别大,但是我们公司经过多年的发展,有自身积累的一些优势。在优势的保障和支撑下,天玑可以成功地位一些大的用户做好IT的代维。实际上我们05年就通过了ISO9001的质量体系认证,我们我们在运维当中紧密低于用户ITSM系统相结合,我们非常注重运维的品质。我们非常注重人才的培养,我们所有的工程师在上岗前要经过认证和考核,每个工程师都具有原厂中高级认证资质。 天玑渠道的优势就是我们有来自各厂商的技术专家,我们有知名的IT原厂商具有良好的合作关系,可以直接或间接获得原厂商的技术资源支持,我们可以在一些领域进行深入的合作,也可以得到一些友商的技术支持和服务。最重要我们可以得到技术的资源和有利地保障。 在这个过程中,我们总结了几点我们工作的方法,不见得是很规范的。这就是这几年我们的一些经验和心得。 我们认为配置管理是我们工作的起点,配置是一个作为流程管理或者是让你的工作流畅起来的最基本的要素。那么我们在开始代维工作之前,第一步不是急于上手打开屏幕,第二是看一下系统的状态。我们要说我们的团队先熟悉我们的运营商、客户的系统和业务特点着手。了解、搜集、分析他系统的软件的科技信息,帮助用户来完善他的配置管理信息库。同时,要掌握各个业务子系统之间复杂的关联关系,他的数据流、业务流,如果一个系统发生问题的话,可能会影响到其他几个系统等等。这都是要获得有关各项操作,无论是原厂商还是软件提供商等等,这些有关的联系和支持的办法,这是我们作为工作的起点。所以,我们把上述的这些要素,经过缜密的搜集、整理之后,才可以开始有效地工作。 在运维过程中,运营商实际上有很多的政策或者是运营商经常会有多方面的文件的下发,要求我们学习多系统的特点。那么天玑作为一个代维的厂商,我们跟用户紧密配合,我们做了很多方面的系统的加固、数据的容灾等等做了很多的工作。我们认为只有这样,才可能有效地跟用户结成一个非常紧密的合作关系。 第三点安全保密。把这些作为长抓不懈的要点。这几年大家可以经常看到这样的案例,比如说SP或者是软件厂商的工程师,擅自窃取一些用户资料以及机密信息,或者是以一种敲诈勒索为目的。这些事件已经经常有报道,所以我们最近非常重视,我们从项目开始就要跟厂商签署这样的安全保密的协议。同时,要签署公司层面的,跟每一个工程师签署这样的协议,并且在每一个工程中,要经常性地对员工进行灌输,让他的大脑里面有一个深刻、清醒地认识。因为用户交给我们的信息是很多没有加密的,如果这些信息被暴露或者是泄露出来,实际上对用户会造成非常大的损害。 第四点,就是结合用户系统的特点,比如说移动,每个省之间都有比较大的差别,系统的架构、维护的规范、团队的组织结构都有区别。实际上我们并不可能说真正来定一套非常标准的规范,去限定用户。那么按照我们的要求来说,我们希望利用一个很灵活的策略,跟用户的具体情况相结合,把我们在IT服务运维理念的积累,跟用户的实际相结合。包括在一些领导理念下,真正设计一套符合用户自身特点的规范。同时,根据工作需要,我们定义一些标准化的模块和文档。 日常工作我们是放在一个非常重要的层次,我们通过在过程中的不断编写、完善我们的维护作业手册,和清楚各种处理事件的规程。通过我们的ITSM的系统,通过流程管理,作为一条驱动,以及网管报警系统,这两个驱动方向来做我们的管理和维护。 第二方面就是我们文档的强调,通过连续不断地按照标准化操作这些模块,来掌握对系统运行态势的控制。通过一系列变化的数,来反映系统运行的态势,并且为系统今后进一步的扩容、升级提供第一手变化的一些素材。因为每一个系统都需要上新系统,我必须要大的服务器,多少CPU多少内存,以前的厂商有一些经验值,但是通常不适合于我们运营商自己的平台。我们时刻在积累这样的数据,帮助运营商提供第一手的资料,这是最真实的数据。 通过定期的考核,就是我们以季度或者是月度按照我们定义考核的规程,在不同的时间点,进行检查。这样不断地来完善和修正我们在运行的过程中的质量,如果有偏差要及时进行调整。另外我们通过长期的运维之后,实际上我们为运营商后续项目的建设提供之间和指导,这些都来自第一手的实际运维工作,或者是我们编写的程序或者是网管系统来获得真实的结果。 有的项目可能还没有验收就仓促地交给维护部门,实际上让这个团队有很冤的感觉,因为他还没有把这个系统调优,仓促上网,可能一上线之后面临很大的问题。那么我们不能这样来影响我们客户定义的团队,来维护这个交接的流程。之前必须有我们定义的标准,经过事先定义好的培训,我们的工作人员经过了考核之后,才可以维护。实际上这个系统的规模非常大,涉及很多的部门、团队、厂商等等,我们非常强调在这个里面沟通起到很重要的作用。 实际上开展代维的过程中,我们主要从以下几大块作为我们工作维护的内容。 第一点是采取预防性的维护。我们不是发生了事情去救火,我们是积极地监视系统的运行,发现端到端的问题,把问题当它有苗头的时候就及时地解决掉。 第二点是通过IT系统相应流程的呼叫,在这个流程化的过程里面进行工作。同时发现系统的问题、流程的问题进行系统化的调整。并且对定期有一些问题存在,或者是后续项目扩容的系统进行分析和评估。包括系统架构层面的调整、故障的处理以及代表我们运营商的技术人员来共同与集成商一道参加项目的建设,我们称之为随工。另外,从只是传递的角度,我们会定期地交给运营商的团队来做。我们会有这样的制度,我们定期在维护过程中发现的问题,一些经验的积累,会向我们的运营商汇报,进行有效地沟通。 在开展IT的代维服务的过程中,我们重视流程的管理。实际上是以ITSM为驱动线开展工作,把传统的被动的,或者是混乱的IT管理向一个标准化、工业化的服务体系进行转变。那么在这个过程中,实际上几年下来,我们是帮助用户建设、完善它的整个流程系统。无论是HP的OSD等等,我们实际上都有一个很好的使用的经验。既是我们日常过程中使用它,也是我们技术的特点,反过来是把它的需求提供给厂商,厂商根据这个不断地进行流程的优化和再造,这样保证我们运营商的ITSM系统是一个非常有效的,而且符合他的运行特点的情形。 那么实际上天玑公司根据我们在维护代维方面的经验积累,我们开发了自己的流程管理。我们称之为Service View Helpdesk,我们是针对重点的企业做这样的流程管理。因为我们的运营商都是购买了这样的项目,基于HP、CA等等。那么我们对于一些中小客户,如果他没有很大的财力来购买这些非常大型的ITSM软件的情况下,我们可以给他提供我们自己的服务流程管理。 另外,实际上我们所代维的系统,规模是一天一天在扩展。单靠一个个人或者是团队对这个系统没有办法实现全程、连续不间断地监控。实际上非常重要的要素,就是发挥网管系统的重要作用。网管是一个忠实地系统,他帮助你记录、跟踪这些系统运行的态势。并且,帮助你默写系统运行这些最原始性能的数据、资料等等。可以帮助您对于系统的一些性能、故障的隐患做一些定位,在发生故障的时候,可以及时地通知你。 那么IT代维服务怎么来进行考核呢?实际上我们在以下几方面进行考核。在每个用户里面考核的项目所占的比重不尽相同。我们通常考虑的是对系统的可用率,或者是系统的稳定性。有多少时间是不可用的,那么都是作为扣分进行考核的。另外对于在ITSM环境里面,有多少任务单等等是达到了用户给我们规定的完成比例。还有对日常维护质量、可交付物的质量、维护服务的规范性、项目建设配合,这些都是运营商对我们代维外包进行考核的一些方面。 那么实际上用户通过采用我们天玑的代维和外包服务,已经取得了这样的一些成效,对客户实际上是帮助他有效地降低他的管理和维护的成本。尤其是一个重要的,就是他人力资源的压力,使客户的IT人员解决出来,真正地做完善和发展,包括从事管理方面的工作。同时帮助客户建立自身的ITSM系统和网管系统。对于我们而言,由于天玑有自己的比较专业的技术团队,那么以前发生问题的时候,原厂商对自己的产品可能在一些问题或者是故障,尤其是他的差别有缺陷的时候,他还会起诉,如果你对这个产品和这个客户没有了解的情况下,你可能就糊弄过去了。我们天玑在这方面可以帮助用户,对厂商有一个很好地控制。那么我们作为中立的第三方的进入,实际上约束了这些厂商按照他和客户签署的标准服务。那么这里面也有几个案例。 比如说他们在操作过程中的不规范,或者是故障处理、定位不准确,以前可能都没有这方面的处罚。那么我们天玑介入之后,我们反而是在第一时间里面,解决了一些这样的异构的问题,那么针对IT服务厂商他们的人员被开除等等。那么对于IT服务厂商,他们也会调配自己的资源对我们的运营商进行支持。 另外对软件厂商,我们可以不断地改进和优化软件系统的架构、稳定性和性能。因为我们的技术人员可以具体定位哪个线程存在问题,以前没有定位,他只能说你的CPU99%需要扩容。但是如果你轻松地把他问题的瓶颈定出来了,包括你对他的业务流程梳理,发现问题是他的代码,没有进行有效地调优,那么实际上他会反过来会哑口无言,他自知理亏,他会很积极地配合你把这个调优做好。 最后做一个总结,实际上我们提炼了在代维服务和外包服务里面有7个成功的要素,我们称为外包七键。 第一个是IT+业务,如果没有业务IT系统实际上是一个很空泛的东西,必须深入学习和领会系统的业务特点。第二是要严格遵循规范进行开展工作,严格按照流程进行办事。第三是遵循安全和保密的原则,让我们的运营商放心地访问网络。第四是有效地使用网管系统,对整个的系统全局进行监控和报警。另外IT用户涉及到多厂商的复杂的事情,必须要有计划,不能够随意地根据系统的情况做出判断。并且要定期召开工作例会来进行沟通协调,有很多的问题不是我们的运营商和服务厂商自己能解决带的。必须把有关各方召集起来,通过一个座谈的形式把这个过程进行解决。另外每个工作的环节,包括调优和鼓掌处理、升级、迁移、日常维护等等,在每一个层面上,都要能够传递下来,使每一个过程是有迹可寻的,这样可以保证整个的服务是受控的。 以上就我简要介绍我们天玑公司在IT系统代维方面的经验和心得,谢谢!
|
|
| |
| 【 责任编辑:郭智信 】【打印】【关闭】 |
| |
|
|
| 相关文章 |
|
|
|
|
中国通信运维网版权与免责声明:
① 凡本网注明"稿件来源:中国通信运维网"的所有文字、图片和音视频稿件,版权均属中国通信运维网所有,任何媒体、
网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载
使用时必须注明"稿件来源:中国通信运维网",违者本网将依法追究责任。
② 本网未注明"稿件来源:中国通信运维网"的文/图等稿件均为转载稿,本网转载出于传递更多信息之目的,并不意味
着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并
自负版权等法律责任。如擅自篡改为"稿件来源:中国通信运维网",本网将依法追究责任。如对稿件内容有疑议,请及时与我们联系。
③ 如本网转载稿涉及版权等问题,请作者在两周内速来电或来函与中国通信运维网联系。
|
|
|
|