去百度文库,查看完整内容>
内容来自用户:RT伽
运维架构层
分类
楼宇基础
IDC基础设施层网络硬件设备
服务器硬件设备
设备管理网络基础知识二层设备三层设备冗余技术网关技术网络运维要点网络故障排查服务器系统安装系统基础服务器管理系统
网络基础
基础应用服务
数据
应用服务
文件存储
集群层
集群层云技术
管理
运维管理
运维实际工作内容
楼宇系统:系统监控报警webapp等楼宇安全:视频监控系统楼宇安全:自动化检测系统楼宇安全:生物特征识别系统楼宇安全:物理安全门禁系统楼宇自动化:电梯照明空调系统楼宇自动化:烟雾火灾监测系统IDC选型:总出口带宽稳定性(ping)电力供应(双路)空调服务(7*24)网络设备选型:确认网络需求IP地址vlan虚网络路由防火墙安全管理等
服务器硬件设备:Dell,HP,联想,浪潮等确认服务商的服务级别和400电话网络服务器 网络流量 监控报警设备的资产管理设备之间连接关系网络是否可用,网络问题定位接入层情况:从用户到接入层交换机路由协议定义,流量路由方向双机热备,排除单点故障划分安全区域,安全区域之间联通了解公司网络情况,网络配置管理,了解网络基础协议硬件服务器及虚拟服务器安装系统安装服务器管理系统 安装服务器监控系统IP地址管理人员IT认证管理邮件管理系统即时通讯系统代码管理系统软件包管理分布式缓存NoSQlDB单机存储单机存储扩展共享存储分布式缓存分布式消息队列SOA层Web层应用层
idc机房运维工作的工作内容:保障机房设备正常运行,通过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。
确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。
互联网数据中心(Internet Data Center)简称IDC,就是电信部门利用已有的互联网通信线路、带宽资源,建立标准化的电信专业级机房环境,为企业、政府提供服务器托管、租用以及相关增值等方面的全方位服务。
扩展资料:
IDC机房的分布:
北京皂君庙机房、北京酒仙桥机房、北京三元桥机房、北京苏州桥机房、北京中关村机房、北京亦庄联通数据中心、北京惠普机房、北京雍和宫机房、北京广渠门机房、北京石景山京西机房、北京华威桥机房、北京京东机房、北京万寿路总参机房、北京工体机房。
IDC机房的功能:
IDC主机托管主要应用范围是网站发布、虚拟主机和电子商务等。比如网站发布,单位通过托管主机,从电信部门分配到互联网静态IP地址后,即可发布自己的www站点,将自己的产品或服务通过互联网广泛宣传。
虚拟主机是单位通过托管主机,将自己主机的海量硬盘空间出租,为其他客户提供虚拟主机服务,使自己成为ICP服务提供商;电子商务是指单位通过托管主机,建立自己的电子商务系统,通过这个商业平台来为供应商、批发商、经销商和最终用户提供完善的服务。
IDC即互联网数据中心。它是伴随着互联网不断发展的需求而迅速发展起来的,成为了新世纪中国互联网产业中不可或缺的重要一环。
它为互联网内容提供商(ICP)、企业、媒体和各类网站提供大规模、高质量、安全可靠的专业化服务器托管、空间租用、网络批发带宽以及ASP、EC等业务。
IDC是对入驻(Hosting)企业、商户或网站服务器群托管的场所;是各种模式电子商务赖以安全运作的基础设施,也是支持企业及其商业联盟其分销商、供应商、客户等实施价值链管理的平台。
IDC起源于ICP对网络高速互联的需求,而且美国仍然处于世界领导者位置。在美国,运营商为了维护自身利益,将网络互联带宽设得很低,用户不得不在每个服务商处都放一台服务器。为了解决这个问题,IDC应运而生,保证客户托管的服务器从各个网络访问速度都没有瓶颈。
参考资料来源:百度百科-IDC机房
基础设施管理主要是检查、监控、维护和操作各种基础设施设备。本体系统阐述了上述内容的具体方法和相关要求。本系统的指定目标是保证计算机房基础设施和设备的正常、安全、可持续运行,规范日常运行和管理工作,有效监控计算机正常使用环境下设备的运行。急诊室。该系统适用于基础设施中的所有相关岗位。
一、日常巡检内容
供配电系统日常巡检内容包括:
(1)配电室环境温度、洁净度,注意有无异味、异常声响等;
(2)查看各个开关的仪表显示应正常;
(3)查看各开关状态确认无误;
(4)检查各开关有无异常声响、变形;
(5)用点温仪测量开关温度并记录;
(6)检查变压器温度、声音、电压、电流、风机启动有无异常;
二、维护保养
1.月维护
A.清洁设备表面和场所的卫生;
B.对日常维护记录中反映出来的主要数据的变化规律进行分析,发现异常要进行调整或检修;
C.检查转动和震动部件,紧固其不应松动的紧固件(不包括电气接点,电气接点的维护、紧固应有计划的停电进行);
2.季维护
供配电系统季维护属于部分检修性维护,应根据具体情况对相关设备停电后进行。
A.完成设备的月维护工作。
B.针对日巡视及月巡视相关记录对负荷量较大及负荷变化较大的线路及开关接线处进行检查,对松动部件进行紧固。紧固工作应停电进行,停电前注意确认,以防误操作。
C.对配电柜进行全面除尘,除尘应使用专用工具,并且工作人员不可踩踏配电箱柜。
3.巡视检查注意事项
(1)巡检时必须严格遵守各项安全运行工作制度。
(2)巡检时应禁止带手表、手链等金属物件。
(3)巡检时应携带对讲设备以保持通讯畅通。
(4)巡检应二人进行,巡检完成后应向机房运维岗位负责人汇报巡检情况。
(5)巡检时必须严格执门禁管理方面的规定,只在授权区域内进行巡检。
(6)在巡检中发现设施或设备工作异常时,应立即向机房运维岗位负责人汇报并按照机房运维岗位负责人的安排进行处理,协助机房运维岗位负责人或相关人员填写相关报告。
三、UPS系统
UPS(Uninterruptib1e Power Supply)意为“不间断供电电源'',是一种含有储能装置(常见的是蓄电池),以逆变器为主要组成部分的恒压恒频的交流供电设备。
UPS的日常巡检
(1)检查卫生环境、温湿度状况;
(2)检查UPS运行状态,记录各种运行数据,包括电压、电流、频率、功率、带载率等;
(3)观察UPS风扇有无异响,运行是否正常;
(4)观察UPS主机内部有无异响、震动;
(5)观察UPS输入、输出柜各进出线开关状态(检查项同普通开关柜);
(6)观察电池外观有无明显鼓胀、渗液或开裂;
深圳计通交流分享,希望可以帮到你。
根据你的提问我把你需要的功能按照分层架构设计思想进行建设,共分为三个层次:采集与控制层、数据层和应用层,这样的设计增强了系统的灵活性和扩展性。
系统的管理对象包括:网络设备、安全设备、机房环境、主机系统、数据库系统、应用系统等。系统的采集数据方式:分布式主动轮询或被动接受的方式采集数据,支持标准的SNMP、Syslog、WMI、WBEM等协议的数据采集,支持(定制的)数据库接口采集,支持(定制的)API接口采集等多种方式,支持(定制的)集成第三方管理平台组件进行数据采集,对么。
中国电信IDC业务包括主机托管类、资源出租类、增值服务类等业务。
1、主机托管类业务:指用户的主机托管在电信部门的标准机房环境中(包括:空调、照明、湿度、不间断电源、防静电地板、机架机位等),采用带宽独享或共享方式通过高速数据端口接入互联网。用户可以通过远程方式维护主机,并根据与局方签定的代维协议委托局方完成指定的维护工作。主机托管类业务主要包括:
(1)机位出租:指在公用机房为用户设备提供机位以及对设备的日常基本管理服务。
(2)机架出租:指在公用机房为用户设备提供机架以及对设备的日常基本管理服务。
(3)VIP机房(机笼)出租:指为用户提供相对独立、封闭或半封闭的环境寄存用户设备。
2、资源出租类业务
(1)虚拟主机业务:电信部门在数据中心的标准机房环境中(包括:空调、照明、湿度、不间断电源、防静电地板等)提供与互联网相连的服务器磁盘空间和带宽出租服务。包括独享主机(Dedicated Hosting)和共享主机(Shared Hosting)。
(2)数据存储服务:指提供用户信息存储的磁盘空间。
(3)数据备份服务:指为用户提供数据的备份。
3、增值类业务
(1)内容分发服务:通过内容分发技术将数据中心用户所提供的内容推送到CHINANET骨干网节点的流量服务器内,并且结合广域网的负载均衡技术使各地的用户首先访问离自身最近的流量服务器,使用户的请求得到最快的响应。
(2)多址镜像加速服务:指根据用户请求,将内容信息镜像到中国电信网络节点的镜像服务器,使用户的请求得到最快的响应。
(3)负载分担:根据用户需求,将IDC用户的主机放置在中国电信分布在骨干网节点的若干IDC中,根据广域网的连通状态和延迟时间将访问请求定向到最适合的主机。
(4)异地容灾:指将用户数据存储在不同地域的数据中心内,当其中一地发生不可预测的灾难时,可以迅速恢复用户的数据和功能,提高用户系统的容灾性和安全性。
(5)系统安全:安全管理服务分为两大类,一类是硬件和软件防火墙,另一类是提供、安全咨询定期、安全扫描和入侵检测等服务。
(6)统计分析:为用户提供流量分析等服务。
机房运维管理 支持对机房UPS、精密空调、温度、湿度、漏水、其它干节点运行状况的实时监测 UPS 监测UPS的输出电压/电流/功率、电池剩余电量、交流供电/电池供电状态等 精密空调 监测精密空调的设定/入风/出风温湿度、制冷/制热/加湿/除湿状态等 温度监测 监测机房关键区块的温度参数 适度监测 监测机房关键区块的湿度参数 漏水监测 监测机房关键区块的漏水状况 其他干节点 监测机房其它干节点的实时运行状况 服务器管理 支持对AIX、HP-UX、Windows、Linux等操作系统的服务器运行状况的实时监测,通过 SNMP Polling、SNMP Trap、Syslog、CLI等协议或Agent代理,对资源进行远程或代理监测 Disk 监测服务器的磁盘空间使用率 CPU 监测服务器的各CPU的利用率 Memory 监测服务器的Memory使用率 Log 监测服务器的用户登录日志 WinService 监测Windows服务器的各个服务状态 Net 监测服务器的网卡流量情况,包括出入流量、丢包率等 File 监测服务器的Core文件、大文件、日志文件的生成与变更 DiskI/O 监测Unix服务器的磁盘I/O情况,包括磁盘读写速率、事务处理速度等 Process 监测服务器应用进程数量、是否存活、内存及CPU利用率以及僵死进程告警等 HA 监测服务器HA获得服务地址、获得接管地址、Cluster节点状态、端口状态等 网络系统管理 支持对Cisco、H3C、华为等主流网络设备以及其它可网管网络设备运行状况的实时监测, 同时支持自定义网络拓扑、自动拓扑生成、网络性能管理、网络故障管理、IP地址管理等功能 CPU利用率 监测网络设备的CPU利用率 Memory利用率 监测网络设备的Memory利用率 端口状态 监测网络设备的指定端口的端口状态 端口流量 监测网络设备的指定端口的入出流量、组播流量等 温 度 监测支持温度指标的网络设备的温度情况 PVC流量 监测指定PVC端口的入出流量 Ping 监测网管主机到目标设备的Ping包延时、丢包率 TCP端口 监测指定服务的TCP端口是否打开,以及端口的延时 设备配置 监测主流网络设备的配置文件是否产生变化 基础应用管理 支持对HTTP/HTTPS、SMTP/POP3、FTP、DNS、LDAP、Apache等基础应用运行状况的实时监测 HTTP/HTTPS 监测HTTP/HTTPS服务的运行状况,包括端口和服务是否正常 SMTP/POP3 监测邮件的发送、接收服务的工作状态(包括被监测账户邮件数量和邮箱使用量) FTP 监测FTP服务的工作状态和模拟传输分析 DNS 监测DNS服务的运行、DNS服务延时及DNS服务的正确性 LDAP 监测LDAP服务的运行、延时、查找性能和查找指定内容等 Apache 监测Apache服务的运行时间、每秒钟请求及处理字节数、繁忙及空闲作业数等 数据库管理 支持对Oracle、Sybase、SQLServer、MySQL等数据库运行状况的实时监测 可用性 监测数据库能否正常访问、特定进程的状态和进程数等 性 能 监测数据库连接数是否过大、缓存命中率是否过低、死锁及回滚数是否过高等 容 量 监测数据库表空间和数据文件的大小、状态和使用率、FSFI碎片比率等 非法访问 监测数据库会话,检查是否有未经授权的IP地址、用户、时间段访问数据库的行为 中间件管理 支持对WebLogic、WebSphere等业务中间件运行状况的实时监测 JVM 监测中间件JVM堆栈大小、JVM堆栈利用率等 JTA 监测中间件资源错误/系统错误/应用程序导致回滚的事务数及比例等 JDBC Pool 监测中间件活动连接数、等待连接数等 Thread Pool 监测中间件总共线程数、空闲线程数、运行线程数、等待线程数等 EJB 监测中间件EJB实例数目、响应时间、缓存大小等 JMS 监测中间件JMS消息服务状态、消息队列大小等 WEB应用 监测中间件WEB应用工作状态、WEB请求并发数、Servlet响应时间等 安全事件管理 支持对安全设备、安全系统的事件进行采集、识别、规整、过滤、压缩、归并、关联、丰富、统 计,对相关信息通过报表的形式展现,同时通过短信、邮件等方式进行告警 运行维护管理 支持B/S结构的智能总控中心、报表中心、工单管理系统、知识库、资产管理等功能 【接包方必备的条件】需有稳定的开发团队,能提供现成开发和维护服务.【其他要求】有可能要整合开发硬件监控产品【地域要求】12月13日,修改需求如下:【项目内容描述】环境动力管理 支持对机房UPS、精密空调、温度、湿度、漏水、其它干节点运行状况的实时监测 UPS 监测UPS的输出电压/电流/功率、电池剩余电量、交流供电/电池供电状态等 精密空调 监测精密空调的设定/入风/出风温湿度、制冷/制热/加湿/除湿状态等 温度监测 监测机房关键区块的温度参数 适度监测 监测机房关键区块的湿度参数 漏水监测 监测机房关键区块的漏水状况 其他干节点 监测机房其它干节点的实时运行状况 服务器管理 支持对AIX、HP-UX、Windows、Linux等操作系统的服务器运行状况的实时监测,通过SNMP Polling、SNMP Trap、Syslog、CLI等协议或Agent代理,对资源进行远程或代理监测 Disk 监测服务器的磁盘空间使用率 CPU 监测服务器的各CPU的利用率 Memory 监测服务器的Memory使用率 Log 监测服务器的用户登录日志 。
一、机房人员日常行为准则 1、必须注意环境卫生。
禁止在机房内吃食物、抽烟、随地吐痰;对于意外或工作过程中弄污机房地板和其它物品的,必须及时采取措施清理干净,保持机房无尘洁净环境。 2、必须注意个人卫生。
工作人员仪表、穿着要整齐、谈吐文雅、举止大方。 3、机房用品要各归其位,不能随意乱放。
4、机房应安排人员值日,负责机房的日常整理和行为督导。 5、进出机房按要求必须换鞋,雨具、鞋具等物品要按位摆放整齐。
6、注意检查机房的防晒、防水、防潮,维持机房环境通爽,注意天气对机房的影响,下雨天时应及时主动检查和关闭窗户、检查去水通风等设施。 7、机房内部不应大声喧哗、注意噪音/音响音量控制、保持安静的工作环境。
8、坚持每天下班之前将桌面收拾干净、物品摆放整齐。 二、机房保安制度 1、出入机房应注意锁好防盗门。
对于有客人进出机房,机房相关的工作人员应负责该客人的安全防范工作。最后离开机房的人员必须自觉检查和关闭所有机房门窗、锁定防盗装置。
应主动拒绝陌生人进出机房。 2、工作人员离开工作区域前,应保证工作区域内保存的重要文件、资料、设备、数据处于安全保护状态。
如检查并锁上自己工作柜枱、锁定工作电脑、并将桌面重要资料和数据妥善保存等等。 3、工作人员、到访人员出入应登记。
4、外来人员进入必须有专门的工作人员全面负责其行为安全。 5、未经主管领导批准,禁止将机房相关的钥匙、密码透露给其它人员,同时有责任对信息保密。
对于遗失物品的情况要即时上报,并积极主动采取措施保证机房安全。 6、机房人员对机房安全制度上的漏洞和不完善的地方有责任及时提出改善建议。
7、禁止带领与机房工作无关的人员进出机房。 8、绝不允许与机房工作无关的人员直接或间接操纵机房任何设备。
9、出现机房盗窃、破门、火警、水浸、110报警等严重事件时,机房工作人员有义务以最快的速度和最短的时间到达现场,协助处理相关的事件。 三、机房用电安全制度 1、机房人员应学习常规的用电安全操作和知识,了解机房内部的供电、用电设施的操作规程。
2、机房人员应经常实习、掌握机房用电应急处理步骤、措施和要领。 3、机房应安排有专业资质的人员定期检查供电、用电设备、设施。
4、不得乱拉乱接电线,应选用安全、有保证的供电、用电器材。 5、在真正接通设备电源之前必须先检查线路、接头是否安全连接以及设备是否已经就绪、人员是否已经具备安全保护。
6、严禁随意对设备断电、更改设备供电线路,严禁随意串接、并接、搭接各种供电线路。 7、如发现用电安全隐患,应即时采取措施解决,不能解决的必须及时向相关负责人员提出解决。
8、机房人员对个人用电安全负责。外来人员需要用电的,必须得到机房管理人员允许,并使用安全和对机房设备影响最少的供电方式。
9、机房工作人员需要离开当前用电工作环境,应检查并保证工作环境的用电安全。 10、最后离开机房的工作人员,应检查所有用电设备,应关闭长时间带电运作可能会产生严重后果的用电设备。
11、禁止在无人看管下在机房中使用高温、炽热、产生火花的用电设备。 12、在使用功率超过特定瓦数的用电设备前,必须得到上级主管批准,并在保证线路保险的基础上使用。
13、在危险性高的位置应张贴相应的安全操作方法、警示以及指引,实际操作时应严格执行。 14、在外部供电系统停电时,机房工作人员应全力配合完成停电应急工作。
15、应注意节约用电。 四、机房消防安全制度 1、机房工作人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理、掌握消防应急处理步骤、措施和要领。
2、任何人不能随意更改消防系统工作状态、设备位置。需要变更消防系统工作状态和设备位置的,必须取得主管领导批准。
工作人员更应保护消防设备不被破坏。 3、应定期进行消防演习、消防常识培训、消防设备使用培训。
4、如发现消防安全隐患,应即时采取措施解决,不能解决的应及时向相关负责人员提出解决。 5、应严格遵守张贴于相应位置的操作和安全警示及指引。
6、最后离开的机房工作人员,应检查消防设备的工作状态,关闭将会带来消防隐患的设备,采取措施保证无人状态下的消防安全。 五、机房用水制度 1、禁止将供水管道和设施安装在机房内。
2、应格遵守张贴于相应位置的安全操作、警示以及安全指引。 六、机房硬件设备安全使用制度 1、机房人员必须熟知机房内设备的基本安全操作和规则。
2、应定期检查、整理硬件物理连接线路,定期检查硬件运作状态(如设备指示灯、仪表),定期调阅硬件运作自检报告,从而及时了解硬件运作状态。 3、禁止随意搬动设备、随意在设备上进行安装、拆卸硬件、或随意更改设备连线、禁止随意进行硬件复位。
4、禁止在服务器上进行试验性质的配置操作,需要对服务器进行配置,应在其它可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置。 5、对会影响到全局的硬件设备的更改、调试等操作应预先发布通知,并且应有充分的时间、方案、人员准备,才能进行硬件设备的更改。
6、对重大设备配。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:3.203秒