行业动态
数据中心机房管理
发布时间2016-07-08 阅读:15211次
       随着社会信息化建设的不断提高,数据中心的建设规模越来越大,机房计算机系统的数量与日俱增,设备密度越来越高,对机房的管理要求也越来越高。下面我们探讨一下数据中心机房管理的要求:

【机房管理之设备管理】

1、设备登记、编号。
  新购或外来设备进场需要进行设备进场登记,每件设备进场均需填写设备进场登记表,并由网络管理员和设备提供方共同签字。
 
  将机房内所有设备按类型进行编号,以英文前缀加数字的格式记录。记录中除设备编号外,还应包括产品名称、型号、购入时间、提供厂商、保修时间和客服联系方式等,作为资产管理表,并结合设备的硬件维护表和设备使用状态表进行统一的管理。
 
2、设备状态定期检查
  为确保设备的长期稳定运行,必需采用每月一次的定期设备检查。主要检查设备外观、设备指示灯、电源接口以及设备灰尘等多项内容,并建立设备使用状态表,记录设备使用时出现的各种症状,提前做好预防,以避免突发设备故障给用户带来的麻烦。
 
3、设备借用
  机房设备均为专用,在未报废前不得转为其它用途。借用机房设备应向主管部门提交书面申请。获批后进行详细登记,登记项包括借用设备名、借用机构、借用经手人、借用日期、欲借用时间及归还时间。
 
4、设备采购
  根据机房发展的需要采购适时的设备。以咨询、调研等万式确定所采购的设备是否能满足机房使用的需要,具体细节可参考各企业流程。
  
5、设备报废
  通过查看设备使用状态表中的设备情况进行采购新设备计划。即便设备未损坏,但已不能满足工作需要时,应列入报废计划,避免因设备发生故障所带来的经济损失。未损坏的电子设备在使用至第四年时应进入报废程序,同时启用新设备的采购进度。在新设备购入后,老设备转移到其它非重点环节使用,直至无法使用。

6、硬件日常维护
  一般情况下,正常运行的设备,其印刷电路板和接插件等部件是不能随便触动的(除了支持热插拔的板件),维护人员对网络设备硬件的日常管理和维护主要是除尘保养和技术维护。

  技术维护就是维护人员对网络设备的硬件部分进行日常观察和定期检测,发现问题及时排除。其主要工作内容包括定期检测设备运行状况、处理器负荷等,根据报警信息的提示,及时对可疑部件进行检测和维修,并根据工作需要调整电路板的位置,更换有故障的电路板和部件。

  对于网络设备硬件部分的技术维护,应严格按照操作规范和厂家说明书的要求进行。特别是更换电路板时,操作人员应带"防静电手锡"或手摸机架(须具有良好接地条件,的金属外壳,待释放掉身上的静电后方可操作。对更换下来的电路板或模块要及时装入专用的防静电塑料袋中。对于电路板的修理,一般需要有专门的检测设备方可进行,可请厂家帮助修理,用户最好不要贸然拆卸。

  硬件日常维护只能由机房管理人员进行,如更换损坏硬件、处理故障硬件、清洁使用中的硬件。硬件日常维护必须由维护人员填写硬件维护表,其内容有设备编号、处理事项、维护日期等。
 
7、硬件特殊维护
  硬件特殊维护可以由机房管理人员、专家或硬件制造商来进行。

  专家和硬件制造商进行硬件维护时应由机房管理人员全程陪同,并填写外来人员进入机房实施细节表,其内容有维护日期、设备编号、处理事项、实施细节、维护时间、维护人员所属机构、维护人员签名、机房管理员签名。
 
8、系统软件维护
  管理人员负责日常操作系统、网管系统、邮件系统的安全补丁、漏洞检测及修补、病毒防治等工作。

  管理人员负责日常操作系统的系统日志分析,对分析出来的结果采取相应措施,并记录在案。

  管理人员应经常保持对系统安全最新技术的掌握,做好操作系统的补丁修正工作。

  集中管理的网络服务器的病毒防治宜由网络管理员负责。托管网络服务器的病毒防治宜由用户负责,管理员可以进行指导和协助。
 
 
9、应用软件维护
  管理人员应统一完整保存计算机、服务器、网络设备及其相关的驱动程序、应用软件及重要的程序文件。

  未经上级管理人员书面许可,当班人员不得在服务器上安装新软件,若确为需要紧急安装,安装前应使用电话联系上级管理人员取得口头许可。

  用户在对集中管理的服务器上安装服务器操作系统或修改服务器配置时,应向管理人员提出申请,并对新安装的或修改的服务器硬件、软件情况进行登记。
 
10、线缆管理
  在机房,经常会看到机柜前面或后面是一堆非常杂乱无章、如同"挂面"一样的线缆。出现这种情况的根本原因在于,在很多人眼里,机房布线只是一个小问题,对最初的布线系统没有进行智能管理,随着用户机房设备的增加,线缆越来越多的时候,"挂面式"线缆的雏形便逐渐显现出来。

  杂乱无章的线缆不但降低了机房管理人员的效率,而且一旦网络出现故障,故障的查找与排除将变得较为困难。
  并且,随着网络扩容及设备冗余度提高,安装新设备是经常要做的事,而旧设备的删减也会经常发生。"挂面式"线缆会让管理员无从下手。

  另外,"挂面式"线缆对散热也有影响。因此,线缆的管理也成为最让管理员头疼的事情,线缆管理正受到越来越多的重视,成为机房或机柜整体解决方案的重要组成部分。针对"挂面式"线缆可能会带来的诸多问题,采用智能综合布线系统管理线缆成为了热点。

  之所以称为智能综合布线系统,是相对于传统的管理而言。传统的布线管理方法主要有书面记录、电子表格或数据库管理软件等方法,这些方法最大的缺点就是管理员的工作量大,所有的数据更新都需要手工操作,即使不存在"挂面式"线缆的状况,由于管理员没能及时更新数据而导致管理工作出现失误是经常发生的事。另外,管理员也很难对大型网络系统中的各个分支机构的布线系统进行实时监控。智能综合布线系统则不同,具有自动检测端口之间的连接、了解端口的状态、记录跳线的连接事件、实时管理远端的布线系统等功能。

  主流布线厂商纷纷推出了综合布线的智能管理系统,如美国泛达公司推出的PANVIEW实时布线管理系统、康普公司的SYSTIMAX iPatch智能配线系统、Molex公司推出的RealTimePatcMng实时布线管理系统,这些系统都能很好地解决用户综合布线系统智能管理的问题。当然,在项目规划时就要考虑采用智能管理系统,便"挂面式"线缆彻底远离你的机房。因为当"挂面式"线缆雏形出现之时,危机就已经存在了。因此,在机房线缆管理过程中应使用智能管理系统。
  
11、数据安全
  操作系统管理、数据库系统管理、网络数据备份等与系统安全和数据安全相关的工作由机房主要管理人员承担,其它机房工作人员配合机房管理人员做好相关工作。

  (1)根据数据的保密规定和用途,确定操作人员的存取权限、存取方式和审批手续。禁止泄露、外借和转移应用系统数据信息。

  (2)制定应用系统数据的更改审批制度,未经批准不得随意更改应用系统数据。

  (3)定期制作数据的备份并异地存放,确保系统一旦发生故障时能够快速恢复,备份数据不得更改。

  (4)应用系统数据必须定期、完整、真实、准确地转储到不可更改的介质上,并要求集中和异地保存,保存期限设计至少两年。

  (5)备份的数据必须指定专人负责保管,由管理人员按规定的方法同数据保管员进行数据的交接。交接后的备份数据应在指定的数据保管室或指定的场所保管。

  (6)备份数据资料保管地点应有防火、防热、防潮、防尘、防磁、防盗设施。
 

 
【机房管理之人员管理】

机房的管理人员首先应该有过硬的技术,能够及时处理机房中软件、硬件、网络等突发情况,并能对未发生的状况有一定的预见性。其次,管理人员应该有高尚的道德,不能对机房的任何设各有恶意损坏、恶意攻击其它计算机甚至盗窃机房设备的想法。最后机房管理人员应该有很强的责任心。应该肩负一个机房的维护、建设、保护等多重任务。

1、出入管理

  (1)严禁非机房工作人员进入机房,特殊情况需经中心值班负责人批准,登记表后方可进入。

  (2)进入机房人员应遵守机房管理制度,更换专用工作鞋;机房工作人员必须穿着工作服。

  (3)进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品。 
 
2、操作人员管理

  (1)中心机房的数据实行双人作业制度。

  (2)操作人员遵守值班制度,不得擅自脱岗。

  (3)严格按照每日预制操作流程进行操作,对新上业务及特殊情况需要变更流程的应事先进行详细安排,并书面报负责人批准签字后方可执行;所有操作变更必须有存档记录。

  (4)严格按规章制度要求做好各种数据、文件的备份工作。所有重要文档定期整理装订专人保管,以备后查。

3、值班人员管理

  (1)要按规定的时间上下班,未经批准不能擅自调换班次或离开岗位。值班期间不得做与工作无关的事情。

  (2)值班人员要全面了解本机房各种设备的工作原理、技术标准、应急处理办法。值班期间要尽职尽责,未经上级同意不得随意中断电路,停闭或调换机线设备,不得随意改动交换设备数据。

  (3)值班人员应严格执行交接班制度,做到手续清楚,上下衔接。

  (4)未经授权批准,值班人员不得私自引领外单位人员到机房内参观。经批准来机房参观者,进出机房均应办理登记手续,原则上不允许拍照和摄像(除非特批,方允许进行)。

  (5)值班人员要密切注意设备运行状态,做到腿勤、眼尖、耳灵、手快、脑活,及时发现和处理隐患。

  (6)要严格按照巡视规定,准时检查设各各运行数据,必须认真、如实、详细填写机房日志等各种登记簿,以备后查。

  (7)值班人员必须严格遵守劳动纪律,不得将与工作无关的物品带入机房,特别禁止的是食品。

  (8)保持机房清洁卫生,搞好文明生产。
 
4、机房参观管理

  (1)经授权批准,外来人员才予以安排参观。

  (2)外来人员参观机房,须有指定人员陪同。

  (3)涉及重要设备或用户托管设备操作时,不得接待参观人员或靠近观看。

  (4)操作人员可以按陪同人员要求在一定程度上演示或回答咨询的问题;对参观人员的不合理要求,陪同人员应婉拒,参观人员不得擅自操作。
 
  (5)经上级管理人员同意,参观人员可以实地操作设备。但须有管理人员指导,不得调阅重要数据和设备配置信息。

  (6)参观人员不得拥挤、喧哗,应听从陪同人员安排。

  (7)参观结束后,操作人员应整理如常,并检查机房环境。


【机房管理之综合管理】
 
1值班人员和操作人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理、掌握消防应急处理步骤、措施和要领。并不定期对机房内设置的消防监控设备进行检查,以保证其有效性。
 
2应保证机房内的整洁,每周对主机房、电池间、消防间、配电间等进行一次清洁;对人员经常活动的区域,应每天进行清洁。
 
3机房内严禁吸烟、喝水、吃食物、进行剧烈运动。
 
4机房内禁止放置易燃、易爆、腐蚀、强磁性物品。
 
5值班人员须经常注意机房内温度、湿度、供电系统是否正常,如没有相应管理软件,应定时远程登录或实地察看相关设备运行数据。空调等重要设施由专人操作,严禁随意开关。
 
6机房管理人员,未经批准不得将工作记录或其它保密资料带出机房。
 
文章来源:数据中心运维管理
联系我们 | 加入我们 | 客服中心