服务器常见软故障解决思路

网络技术飞速发展,计算机网络被广泛应用于学校、科研部门、政府机关及商业等各个领域。网络管理的好坏将直接影响网络的有效使用,其中对于服务器的安全维护十分重要。服务器的管理维护包括软件和硬件两个方面,哪一方面出问题都会让服务器运行出现故障甚至瘫痪。下面就给大家说一说本人在实际中遇到的一次HP服务器故障排除。

服务器的管理人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。

服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。下面分别举例说明各类软件故障的维修方法。

  1. 服务器故障不用忙 找对方法解迷茫
  2. 服务器故障排除大汇总
  3. 怪异服务器故障带来的经验

对于此类软件故障,操作员最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。

相比之下,软件冲突造成的故障判断比较困难,需要管理人员有比较丰富的经验以及敏锐的观察力。

HP服务器故障排除四、经验总结

还有一种软件故障是人为因素造成的,它一般是人为误操作包括没按操作流程的操作)、意外关机包括电源突然不供电)或非正常关闭应用程序造成的。

人为误操作因素只要加强管理都可以避免此类故障发生。在这里就详细说明意外关机或非正常关闭程序造成故障的方法。

HP服务器出现噪音变大的故障,初期可能只是风扇转速减慢,系统还能继续工作,但由于系统负荷逐渐加大,环境温度升高,使服务器内部温度升高,加大了风扇的负荷,最终导致一组风扇损坏,将排风散热的工作由另一组风扇负担,系统初始启动时,系统产生热量较小,一组风扇还可以承担。当系统运行一段时间后,机箱内温度开始升高,当系统检测到温度已超过其阈值时,于是发出指令提高风扇转速,加速散热,从而导致服务器主机内的声音突然加大。如果各组风扇都运行正常,则可以保证服务器主机内的温度在正常范围内,从而保证系统正常运行。

目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种操作系统下的驱动程序,方便了客户在各种操作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。

有一台HP LH6000R服务器,配置为双PIII XEON
700带2M高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常VRM)的错误,报错的信息是:“Voltage
Regulator Module (VRM) over/under-voltage
2.88V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它LH6000R上的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板CPU
Management
Control)的固件FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。

按面板右侧的上下箭头,选择进入子菜单;当光标处于“Event
Log”时回车进入,选择“System
Event”再进入,即显示系统引导、死机、管理、硬件故障信息等内容。通过查看记录即可知道异常情况的原因及时间等信息,为解决问题提供依据。

FIRMWARE升级方法是,在服务器的NAVIGATOR导航光盘)中提取CPU管理板CMC)FIRMWARE的刷新程序,程序为FLASH.EXE,然后将从网上下载的LH6KC.BINCPU管理板的FIRMWARE)拷贝到一张DOS启动盘上,用这张盘启动服务器。然后在DOS下运行”FLASH
/CMC
A:LH6KC.BIN”,刷新完成后重新启动服务器后即可。这种升级方法也适合刷新系统BIOS等,只是FLASH命令的参数不同以及更新FIRMWARE及BIOS文件名不同,参数请参考服务器的说明。

任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,而应该经常更新服务器的FIRMWARE及BIOS,只是在升级之前应该小心谨慎,错误的升级方法会导致严重的后果。

  1. 服务器常见故障排除十四法
  2. 从零起步教您常见DNS解析故障排除方法
  3. DHCP和DNS常见故障

FIRMWARE升级方法是,在服务器的NAVIGATOR导航光盘)中提取CPU管理板CMC)FIRMWARE的刷新程序,程序为FLASH.EXE,然后将从网上下载的LH6KC.BINCPU管理板的FIRMWARE)拷贝到一张DOS启动盘上,用这张盘启动服务器。然后在DOS下运行”FLASH
/CMC
A:LH6KC.BIN”,刷新完成后重新启动服务器后即可。这种升级方法也适合刷新系统BIOS等,只是FLASH命令的参数不同以及更新FIRMWARE及BIOS文件名不同,参数请参考服务器的说明。

HP服务器故障排除二、故障的排除

正常关闭系统程序非常重要,尤其是WEB服务器。我的一个朋友就是因为没有正常关闭系统程序而经历了一次数据损坏甚至丢失的经历。我的朋友是使用的HP
web hosting server appliance,因此我向他提供了一些使用规则。

服务器的管理人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。