中石化西北油田分公司消防中心设备维护服务施工方案

中石化西北油田分公司消防中心设备维护服务施工方案
仅供个人学习
反馈
文件类型:.zip解压后doc
资源大小:270.85K
标准类别:施工组织设计
资源属性:
下载资源

施工组织设计下载简介

内容预览随机截取了部分,仅供参考,下载文档齐全完整

中石化西北油田分公司消防中心设备维护服务施工方案

4.7服务质量考核与评价 20

中石化西北油田分公司消防应急中心肩负着塔河、天山南、巴楚等油田地区的公共安全、消防、气防、医疗救助及应急救援的艰巨任务。“时间就是生命”,面对中石化西北油田900多口油气井、几十个厂、站、灌区及周边环境等重点消防单位,无论是灭火战斗还是抢险救援,接警后第一时间赶到现场,都将为最终取得胜利做出有力保障。

西北地区应急中心主机设备是应急指挥中心信息系统运行的基础环境,也是应急指挥中心重要基础设施,它的正常运行是其它各应用系统正常运行的基础。为了保证应急指挥中心信息网络以及各业务系统的高效可靠安全稳定运行,西北地区应急中心将通过IT运行维护服务体系建设,把公司内部IT运维资源与社会资源的高效整合,充分利用各种资源为企业信息化发展服务,进而提出了西北地区应急中心信息机房主机设备维护服务项目建设,为实现更大的社会经济价值服务。

DB11/T 948.6-2013标准下载太极华谐公司IT运维服务实践和经验

西北地区应急中心是太极华谐公司高级合作伙伴,也是太极华谐公司重点服务客户。一直以来,太极华谐公司积极参加了应急指挥中心信息化建设,深深懂得应急指挥中心企业发展的目标以及信息化建设在业务发展中的作用。

在本项目中,太极华谐公司积极总结石油行业IT服务的最佳经验和知识技能,为应急指挥中心提供高质量的运维服务。

太极华谐公司非常荣幸能有机会参与西北地区应急中心信息机房主机设备维护项目,感谢用户给予我们的机会。我们衷心希望我们的运维服务系统设计能满足用户系统服务的需求,并希望能够与用户一起将这些先进技术和维护经验综合并付诸实现,确保用户的系统成功实施。

新建成的应急指挥中心是中石化西北油田分公司在塔河油田地区应急消防安全指挥的中心枢纽,信息网络的建设是保障指挥中心稳定运行的前提。原有机房设备将合理分配、搬迁至新建机房,损坏设备及时更新,将高效的为西北地区应急中心信息机房主机设备提供高质量的技术支持服务,为西北地区应急中心信息系统运行提供有效保障和提升信息系统整体服务质量,太极华谐公司根据实际要求和应急中心的具体需求提供本次服务项目的技术方案。

根据对贵单位整体硬件和软件环境现状的了解,太极华谐公司对本项目的产品服务范围理解如下:

系统间的相关硬件连接:服务器之间的连接线,服务器之间的心跳交换机,存储阵列和服务器之间的光纤连接线,设备和显示设备之间的连接。

与系统紧密相关的网络设备

与系统紧密相关的网络设备:

24口、千兆Trunk自适应,20/24光纤模块

系统间的相关硬件连接:

数据库服务器之间的连接线

数据库服务器之间的心跳交换机

存储阵列和服务器之间的光纤连接线

设备和显示设备之间的连接等等

视频监控服务器的搬迁与维护

视频抓拍服务器的搬迁与维护

数据库服务器的搬迁与维护

语音接警服务器的搬迁与维护

查看主机设备状态,做到尽早发现工作异常的设备。

检查主机设备的状态灯是否正常。

登录到关键设备上观察设备工作状态,如CPU、内存利用率、温度等。

定期备份主机设备配置。

提供系统切换、微码升级、设备扩容服务。

提供移机安装等技术服务。

对甲方系统运行提供合理化建议。

与主机设备及系统的相关工作。

西北地区应急中心信息机房主机维保服务主要是保证主机设备以及其他各应用系统的正常稳定运行。

应急指挥中心维保服务分为2个部分,分别是硬件设备维保和相关应用软件维保。在硬件设备中需要对西北地区应急中心信息机房中的服务器、网络设备及存储设备提供维保服务,使这些设备可以正常运行。如果发生故障,需要太极华谐公司响应,做相应的故障处理。应用软件主要针对的是数据库和中间件,维保服务主要包括软件的使用、日常管理及维护、性能调优以及各种意外问题的解决。

交接阶段,太极工程师会对应急中心的维保设备,服务器、存储、网络设备以及相应的应用软件的使用情况进行详细的调研和记录。这个过程有助于工程师未来排除故障时缩短所需要的服务时间。在调研完成后,太极华谐公司工程师制定维保计划。之后,双方工程师会经过多次沟通,进行实施项目计划的修订,确保所制定的服务计划切合应急中心的现场情况。日后太极工程师维护将依照此计划进行维护。设备调研工作如下:

建立全面设备档案,包括设备编号、保修期限、使用人、详细硬件配置和软件配置;

根据设备硬件配置,建立每台设备的驱动程序库;

建立网络维护文档,包括网络结构图、网络设备(交换机、路由器和服务器)的具体配置调试说明等;

建立软件使用手册,包括操作系统、常用软件的安装流程,特殊软件的建立过程和维护说明等;

建立标签体系,与设备编号一一对应,避免由于使用人的变更造成管理上的混乱;

登记特殊设备,并建立相关FAQ文档;

正常维护服务阶段,维保服务正式开始。包括常规服务工作、系统升级、系统补丁、故障处理、技术咨询、系统预防性检查、应急处理等。

实施总结阶段,合同期前2周进入到实施总结阶段。太极华谐公司将整理服务文档,同时进行系统健康检查,健康检查完成后,进行项目年度服务总结(系统情况、故障次数、故障分析、预防措施等等)。根据项目实施实际,对服务质量进行评估和总结,并提出改进措施,提交全年服务检查文档。项目合同最后一周进行项目的验收。

根据应急中心维保项目所提出的需求,维护内容将分为三部分,分别是日常工作、定期巡检、故障处理和主机设备的非日常维护。

应急中心维保服务日常工作由驻场工程师提供日常检查。主要服务内容如下:

查看主机设备状态,做到尽早发现工作异常的设备。

检查主机设备的状态灯是否正常。

登录到关键设备上观察设备工作状态,如CPU、内存利用率、温度等。

定期备份主机设备配置。

提供系统切换、微码升级、设备扩容服务。

提供移机安装等技术服务。

对甲方系统运行提供合理化建议。

与主机设备及系统的相关工作。

针对应急中心维保项目,太极华谐公司制定了4个级别的巡检服务,每个级别的巡检服务的侧重点并不相同,争取做大最大限度的保持系统稳定。

例行巡检即预防性维护并提供例行巡检报告。

由太极华谐公司指派有经验的高级工程师对设备进行巡检。

主要工作内容为:通过查阅应急中心驻场工程师的日常运维报告,对出现故障的设备进行全面检查。并与应急中心IT运维人员进行技术沟通,解决在日常实际过程中遇到的问题。备份主机设备配置,提供系统切换、微码升级、设备扩容服务。并对每台维保设备做如下操作。

电源稳定性和线路检查;

补丁程序是否满足需求;

系统错误报告的分析、记录和清理;

及时更换有潜在故障的部件

设备物理检查(包括机体、风扇、风道及过滤器等)与清洁;

如果客户需要,协同客户进行生产系统的切换测试;

由太极华谐公司指派有经验的高级工程师对设备采集系统信息,进行分析并提供分析报告。

主要工作内容:根据日巡检和周巡检对应急指挥中心运行的设备提供性能改进措施建议。对出现过故障的设备进行重点监控,防止出现2次故障。对发现的系统性能运行瓶颈,提供相应的解决方案。如果应急指挥中心有移机需求,太极华谐公司将派遣工程师进行技术支持,保证移机后系统可以正常运行。

由太极华谐公司指派有经验的高级工程师提供系统服务季度报告。

主要工作内容:总结上个季度西北地区应急中心主机与存储系统的维护工作。根据上季度应急中心的维护情况提出下季度维护计划,提交此季度的维护报告。

本次维保服务的主机设备根据应用系统部署情况,可分为冗余环境的系统设备和非冗余环境的系统设备,根据故障定位可分为硬件设备环境故障和操作系统环境故障,按照故障对业务系统影响程度可分下述三个等级

指设备/系统在运行中出现的对功能和性能影响不大,关键业务不受影响的故障。

由于一般性错误引起的,如硬件设备日常报警,系统日志满;系统备份异常;空间增加等等;

冗余环境中,单一设备/系统出现影响系统功能和性能的故障,但环境中其它设备可以接替其工作,系统整体性能下降

硬件/系统功能性故障,单一设备或系统进行需要修复;整体环境可以正常运行。如:集群环境中一台设备硬件故障。

非冗余环境中,设备功能完全丧失,不能继续工作,问题的解决对业务至关重要,关键业务已经不能正常运行。

硬件/系统功能完全丧失,不能继续工作。

(2)二级故障:核心设备核心网络发生紧急故障,大部分业务仍能正常运转,必须在30分钟内响应,先由驻场工程师做应急处理,技术专家2小时内到现场,无硬件故障情况下4小时内恢复。太极本部技术委员会30分钟启动故障评估及技术处理方案制定,支持现场应急处理。

(3)一级故障:核心设备核心网络发生紧急故障,业务不能正常运转,驻场工程师30分钟响应,若需要技术专家2小时到现场,无硬件故障情况下3小时内恢复;太极本部技术委员会30分钟启动故障评估及技术处理方案制定,支持现场应急处理,并根据现场情况建立厂家技术专家委员会提供更高级别的决策支撑。

设备/系统环境变更正常运行状态至故障状态时,太极华谐公司的技术人员将按以下故障处理流程(图4.4.1a故障处理流程计划)进行操作,迅速查找故障原因,协助用户修复相关环境,使其正常运行。

出现系统运行状态变更,技术人员首先判断隶属于硬件设备故障还是操作系统故障。

硬件故障:先期分析设备所处系统结构;

如冗余环境,按相关处理流程进行故障处理

如非冗余环境,按相关处理流程进行故障处理

系统故障:先期分析所处系统结构,

如冗余环境,按相关处理流程进行故障处理

如非冗余环境,按相关处理流程进行故障处理

故障修复后,由太极华谐公司技术人员及应急指挥中心技术人员进行相关硬件设备/系统测试。

系统上线正常运行,变更运行状态等级为[正常]。冗余环境故障处理流程

[说明:在非冗余环境中,如遇无法及时修复的故障,需要安排相应的备用设备/系统计划,以避免对业务环境的长时间影响。]

凡硬件出现故障需要更换时,根据设备维护级别,保证在下述期限内提供备件现场更换。

7×24×4,服务工程师服务

7×24×4,人工和备件服务(备件由乙方承担费用)

7×24,人工服务(备件由甲方另行承担费用)

5×9,人工和备件服务(备件由乙方承担费用)

故障处理结束后,制定事故处理记录表,记录故障及处理方法、结果,作为故障处理日志归档保存。

当应急指挥中心主机设备系统结构或者系统应用发生更改,由此带来主机设备的配置更改、系统升级。太极华谐公司在对设备进行此类操作时,严格按照应急指挥中心科技信息部的运行维护管理办法,进行变更处理。

在维保服务期间,太极华谐公司将对应急指挥中心系统设备的现场支持、例会、技术交流和技术支援等所有技术服务提供免费服务。

如果西北地区应急中心客户在计划实施较重要的项目(如安装、升级、联网、业务合并或拓展等)时,如需要太极华谐公司配合或协助,双方公司在得到通知后积极予以响应并派工程师到西北地区应急中心设备现场。

通过规范化的技术文档,与西北地区应急中心客户之间组织定期的技术交流活动,这样有利于双方技术人员水平的提高,更能有助于提高设备的管理效率和可靠运行。同时,太极股份会根据客户的需要,提供硬件、系统和数据库方面的培训,如果西北地区应急中心设备需要改造、升级,我们将为西北地区应急中心客户提供免费的咨询服务。

根据硬件设备及系统资源的升级情况,为西北地区应急中心客户提供必要的技术支援,包括系统升级的培训,寄送相关技术资料和系统补丁光盘(或现场安装),并提供系统性能优化的解决方案。

根据客户的特殊情况,如新系统上线,系统迁移,迎峰渡夏时期、各类政治保电时期等。太极华谐公司将指派工程师提供24小时现场值班服务,由相关资深技术工程师为客户提供专门的事前隐患检查和现场保障支持服务,以保证整个系统在重要时期内不出现严重的故障。

维保期终止前十五日内,太极华谐公司派遣工程师前往现场,对设备进行一次全面检查,双方签署《维保期终止备忘录》。若有遗留问题,双方另行商定。

太极华谐公司质量保证体系

为确保本项目的整个系统高质量完成,太极华谐公司将遵守有关国际标准(ISO9000)和国内质量标准,在服务项目过程中,从系统运维,详细维护方案,维护详细设计,到系统设备的维护过程、维护的详细指标、现场巡检、故障定位等全部过程进行严格的质量控制,强化管理,加强合作,责权明确,按照“创新、高效、优质、规范”质量方针,保证施工管理均衡有序,保证服务质量。

质量标准体系与制度规范

本公司针对本服务项目中的质量管理主要依据ISO9001来进行管理。相关的质量标准体系与制度规范如下:

服务项目定期评估制度;

根据不同维护主机设备、软件的特点,对服务项目进行针对性分析评估,包括:

非技术背景要求,如管理能力、综合素质、经验要求等。

在服务的过程中对组织结构进行分析或合理性设计变更其组织的结构,使其维护资源配备更加合理,需要充分考虑如下因素:

组织机构(组)总体的合理性;

各个相关专业的齐备性;

各个专业人员的配置比例;

各个岗位人员的综合背景和经验;

对本项目的需求的匹配性。

在项目的管理过程中,通过对服务项目质量进行监控,客观地检查和监控“过程及服务的质量”。具体工作包括:

客户意见的征集和反馈;

工程师工作质量的评测与绩效考核;

工作规范符合性评测制度的执行情况检查;

问题发现、处理工作制度的执行情况的检查;

各类维护文档管理情况的检查;

评估组具有越级上报的及时性,随时向高层报告服务过程中的质量状况。

通过上述管理机制,太极计算机公司将项目的质量控制与如上所述的员工个人绩效考评密切结合起来;并通过一系列的工作制度,保证了系统集成工作流程的规范化;通过阶段性检查等措施,对具体工作的开展质量进行综合评估,确保项目整体目标的实现。

太极华谐公司基于戴明质量环质量控制体系

太极华谐公司将通过戴明质量环质量控制体系,提供维护服务所需要进行一些活动。而维护服务的质量又在很大程度上取决于这些活动被组织起来的方式。戴明质量环(如下图)提供了一个简单而又有效的质量控制模型。该模型假定:为提供适当的质量,下列步骤应当反复地进行。

计划(Plan)——做什么,何时做,谁来做,怎样做以及用什么来做?

实施(Do)——计划的活动得到实施。

检查(Check)——确定活动是否达到了预期的效果。

改进(Act)——根据检查中收集的信息对计划进行调整。

有效而及时的对西北地区应急中心维护进行调整意味着活动应当被分解为一个个的流程,并且针对每个流程都制定具体的计划和确定检查的时机。应当明确的是,谁负责组织这些活动,他们拥有多大的权限来修改计划和活动的规程,这些计划和规程不仅仅是针对每一项活动,同时也包括每一个流程。

质量管理是在提供服务的组织中工作的每一位员工的职责。每一位员工必须清楚,他们对组织的贡献会对他们同事的工作质量产生什么样的影响,以及最终会对组织作为一个整体所提供的服务产生何种影响。质量管理同时也意味着要持续地寻找改进组织的机会和实施质量改进活动。

质量保证是组织内部的一个政策。它是指被组织用来确保其所提供的服务能够持续地满足客户的期望及相关协议的一整套措施和规程。质量保证可以确保由质量管理所产生的质量改进能够得以维持。

质量体系是与职责、规程和实施质量管理所需的资源相关的组织架构。

太极华谐公司一直认为一项ISO认证不能为提供的服务质量提供绝对保证,然而,它可以表明太极华谐公司已采取严格的质量保证措施并准备对其进行改进。

太极华谐公司、厂家协作约束体系

本项目服务由于涉及到的维护体系不仅包括应急指挥中心与太极华谐公司运维协作,还包括太极与原厂(IBM、HP等)之间的运维协作体系,通过客户关系管理模型,通过供需关系的管理制定西北地区应急中心、太极华谐公司、原厂厂商的责任、义务,保证客户业务系统正常运行,保证服务协作约束的有效执行,需要三方的通力合作与配合。

通过客户关系管理模型,制定出各组织机构的责任和义务,能够更好的对西北地区应急中心提供全面和完整的技术运维服务,以免出现推诿责任等现象,西北地区应急中心、太极华谐公司、原厂商需要从以下方面做遵守以下协作约束条目:

西北地区应急中心需做到以下几点:

制定系统日常管理维护制度及流程,防止不当使用、滥用系统,或使用中发生意外事故或疏忽。

对关键性业务系统,必须有现场操作记录日志和现场环境记录日志。

有完善的安全措施,能有效阻止来自公司内外对关键性业务系统的非法侵入和恶意攻击。

制定公司内部的问题处理和升级渠道。

制定、实施并测试灾难恢复计划。

购买系统和网络管理软件。

定期监控系统性能参数,评估系统能力。

制定并实施系统软件/硬件版本的升级方案。

系统管理工程师每天填写日常维护表

制定并规范项目管理流程。

协助太极华谐公司收集信息(如描述故障现象、故障经过,收集trace等)。

严格执行维护协议的服务条款规定的各项服务内容;

定期对客户软、硬件环境进行巡检,总结;

每季度一次服务质量测评会议,提交季度测评报告;

组织并主持每半年召开一次的服务交流会议,提交服务报告;

协助贵单位系统制订实施主机设备、中间件及数据库日常维护管理制度和流程;

记录系统配置和软件/硬件版本信息,以便系统升级维护;

与第三方产品提供商充分合作。

严格执行维护协议的维护条款及规定的各项内容;

严格执行与太极华谐公司之间的服务协议,及时做到对客户的响应;

协助太极华谐公司和客户做好软件、硬件的升级;

协助太极华谐公司和客户维保服务巡检;

原厂家维护工程师定期到场进行预防性维护服务;

原厂家维护工程师到场进行基本的系统性能分析及调整。

有成熟保障体系和戴明质量控制体系的管理机制保证,运维有了科学的监督体系。针对于本项目运维管理属于服务性工作,质量难于量化,质量管理也因此变得非常重要。运维服务质量管理太极华谐公司是通过记录追踪、服务监督、问题响应和考核管理等方法实现对运维工作的质量进行监督、检查,从中发现质量问题,提出改进方案,做出质量评价。

集成运维质量管理主要是针对运维技术支持人员和技术支持小组的维护质量进行监督、考核,通过目标管理法对质量进行控制和考核,对运维质量效果做出评价。

服务质量监督是一种常用的质量管理办法,目的是通过监督来促进服务质量,发现质量问题。监督也是服务质量考核的一种手段。

运维技术支持人员和支持小组直接服务于西北地区应急中心科技信息部,日常工作与他们结合紧密。特别是科技信息部人员,将是运维技术支持人员和技术支持小组的工作质量的直接监督者。对于运维技术支持人员和技术支持小组的工作能力、工作态度、工作效率最有发言权。科技信息部对运维工作的评价将直接与运维工程师的工作质量考核挂钩。

相信人的主观能动性,是现代企业管理理论的重要部分。相信人的自我价值追求,培养人的主动性,是现代管理方法的一种重要思路。通过指导、教育,协助运维工程师提高自身的质量意识,实现自我监督。

太极华谐公司也可以根据报告、巡查或用户意见,判断技术支持人员和技术支持小组的服务情况,并对明显有态度的人员做出更换的决定。太极华谐公司在决定更换人员之前要以告知用户,并明确告知用户替换人选的到位时间,在得到用户认可后方可执行。

由于软、硬件安装、配置导致同一重大问题连续重复出现三次,或者出现运维工程师工作多次不能按时独立完成工作,或在所承担的主要技术方向上多次不能解决问题时,用户可以提出更换技术人员的要求,太极华谐公司会在3日内做出答复,1周内派出替换人员。

采用目标管理法来进行运维服务的质量考核,对达到考核目标的给予认可。目标管理法是企业经营管理的一项基本管理办法,在运维管理中引入该方法是为了更好的提升服务质量,做到对工作的正确评价。

设定要达到的运维考核指标和评价方法。考核指标是指具有代表性的运维工作,评价方法是对这些工作以量化的方式化分出差别,再通过汇总得到对运维工作的综合评价。考核指标与量化标准见下表。

是否认真填写《检查日志》

广州市建设工程造价管理站关于发布《广州市城市绿地常规养护工程年度费用估算指标》(2019)的通知是否认真填写《维护日志》

是否能够很好领会用户意图,并积极帮助用户解决问题

是否认真组织召开周巡查例会,了解情况,解答问题

所负职责内是否出现重大系统问题

是否有过对于用户反映的问题即没有明确答复也没有正式向上汇报,时间达3小时以上的情况

到达现场后不能解决问题DB/T 29-103-2018标准下载,需要再派人员的情况

目标法只是对运维工作考核的方式之一,对运维工作做出公正评价是一个相当复杂的工作,通过考核指标打分得到的结果会是做出评价的一个重要参考。另外,考核不是为了惩罚而是为了促进更好的工作,正确、公平的评价同样也会促进运维管理工作。

©版权声明
相关文章