网管员须知 常见网络故障快速解决法

互联网 | 编辑: 杨雪姣 2009-04-13 17:05:00转载 返回原文

第一页

今天的网络发展得真是太快了,关键的问题是它还包含企业的重要应用和服务。单位内的用户和雇员在很大程度上需要依赖网络工作。在这种环境中,网络技术人员往往要诊断一些复杂的网络故障,保持网络运行的通畅。本文讨论网络技术人员经常碰到的九种网络问题的症状、原因和解决方法。

问题一:无法获得IP地址

症状:网络看起来不可用。操作系统可能会警告说无法从DHCP服务器获得IP地址。在检查了网卡后,也没有获得IP地址。

原因:

1.DHCP服务器可能缺乏可用的IP地址,

2.服务器的DHCP服务可能关闭,

3.终端设备使用了静态IP地址而不是自动获得IP地址

4.终端设备的DHCP请求没有传送给服务器。在为VLAN配置一个新设备时,这种问题常常发生,此时并没有设置VLAN将DHCP请求转发给DHCP服务器。

解决方法:

关键的问题是,这种故障是仅限于某个用户或是多个用户都受到影响?如果仅有一个用户受到影响,应检查网卡的设置,确保它使用了DHCP服务。

下一步,检查交换机,看一下端口、VLAN,看是否配置了VLAN成员。检查这个VLAN上的其它设备是否可以获得IP地址。如果这些设备都无法获得地址,问题可能是由于路由器没有将DHCP请求转发给DHCP服务器造成的。如果多个子网上的多台设备都有这个问题,问题有可能是服务器自身造成的。服务器可能并没有运行DHCP服务,或者它可能没有足够的IP地址可供分配。

问题二:无法连接到应用程序服务器

症状:用户试图打开的应用程序发出警告说,无法连接到应用程序服务器。在使用电子邮件服务器或CRM应用程序时,常会出现这种情况。

原因:

多种原因可导致此问题。关键问题是问一下用户这种故障是经常发生还是偶尔出现。如果用户拥有此连接的正确IP地址,那么,在用户和服务器之间可能存在着路由问题。技术人员可通过使用一个简单的Ping命令来确认问题。如果只是偶尔地丢掉连接,可能是由于服务器过于忙碌,导致无法响应客户端的请求。

解决方法:

如果不是路由问题,应检查服务器的负载和资源,如服务器是否正在忙着运行另外一个任务(如备份)?如果服务器并不忙碌,应检查客户端和服务器之间的网络负载,如果有WAN连接的话,应特别检查一下。通常情况下,客户端和服务器之间周期性的过高网络应用会导致客户端的连接问题。检查的最好方法是利用一个 SNMP工具,用它来监视这些链接上的网络利用率。此外,还要检查所有交换机和路由器上的以太网错误,这些错误可导致客户端和服务器之间的数据包丢失。

问题三:错误的VLAN分配

症状:在向网络上安装新的服务时(如无线或VoIP),经常要使用VLAN来隔离与其它用户的通信。这就要求配置每一个支持这些服务端口的正确的VLAN。如果配置不当,服务就无法运行。IP电话可能无法在呼叫管理器注册,连接到电话的电脑可能无法连接到关键服务器,无线用户有可能无法获取无线环境的正确地址。

原因:

可能没有正确配置负责连接这些服务的交换机。交换机没有与单位内的设备通信,没有对交换机进行重新配置来支持这些新服务。

解决方法:

测试端口验证支持了哪些VLAN。如果可能的话,使用一个VLAN标记来生成VLAN的特定通信,检查端口上配置了哪些VLAN。检查DHCP服务器所提供的IP地址,进而决定哪个未标记的VLAN被提供给了端口。另外,还应检查交换机的配置,验证VLAN的配置。

问题四:双工不匹配

症状:双工不匹配,将导致连接工作异常。交换机和网卡上的连接指示灯显示非常活跃。网络性能极大降低,吞吐量降到100kbps或更低。

原因:连接的一端工作在全双工(同时传送和接收),其它的设备工作在半双工(同一时刻只能传送或接收)。全双工一端有可能中断半双工端,导致半双工一端异常中断传输。如果传输中断,就需要重新传送数据帧。这会极大地减少半双工端能够利用的带宽。

解决方法:

在几乎所有的故障中,双工不匹配都是由于强迫连接的一端(通常是交换机)工作在全双工的结果,这会使另外一端的电脑自动发起连接会话。问题是自动发起会话将造成被强迫的全双工并匹配这种配置。但远不如此简单。被强迫工作在全双工的一端再也不能发送正确的信号,这种信号正是自动发起连接会话赖以决定速度和双工的信号。连接过程中,自动发起连接会话的一端需要猜测连接的双工状态。在无法确定的情况下,自动发起连接会话将一直工作在半双工。这是网络中多数双工不匹配问题的发生机理。为此,将网络中的所有连接设置为“Auto negotiation”,如下图所示:

除非你有明确的理由不这样做。在这些特例中,如交换机的相互连接中,一定要将两端的设置为全双工。

第二页

问题五:应用程序性能降低

症状:应用程序运行起来似老牛拉破车,在存取数据时程序好象凝固在某个屏幕。

原因:许多问题可导致应用程序性能降低。在正常工作时间发生的服务器备份、数据库服务器的缓慢响应、网络数据包的丢失等属于最常见的原因。从网络技术人员的观点来看,需要决定的最重要的事情是这种问题是由服务器引起的,还是由网络引起的。为此,可从某客户端捕获应用程序数据,查找客户端和服务器之间的数据重发,如果存在重发,那么,就可以断定在网络上存在着数据包的丢失情况,这会严重地影响应用程序的性能。如果并不存在重发,并且建立了客户端和服务器之间的网络连接,那么问题可能出在服务器上,可从这方面解决问题。

解决方法:

在跟踪问题时,虽然数据包的分析工具难以使用,但这些工具常常配置了简单的可以显示TCP重发的计数器。管理员可以使用这种计数器来帮助决定在客户端和服务器之间的网络上是否存在数据包的丢失。要查找客户端和服务器之间的任何交换机和路由器上的以太网的错误(如FCS错误)。如果有错误,就应关注由于广域网连接的过度利用所造成的数据包丢失。

问题六:网络打印问题

症状:打印无法连续地在网络上运行。打印机看似可用,但发送给它的打印任务并没有完成。

原因:需要检查并确定是一个用户或多个用户正遇到此问题。如果只是一个用户遇到此问题,原因可能是这台电脑并没有正确地映射到打印服务器。如果不是一个用户的问题,问题可能出在客户端与打印机之间的网络上。数据包的丢失可引起打印问题,打印机自身的连接也会引起打印问题。

解决方法:

检查打印机的配置,确保它拥有正确的IP地址,并且如果它属于外部打印服务器,还要检查它可以访问打印机。有时,更新打印机驱动程序可以解决打印问题。总之,要保障发往打印机和来自打印机的通信可以通过网络,并保障打印驱动程序的最新。

问题七:电缆故障

症状:如果某台电脑能够连接到网络,性能就严重降低。这台电脑也可能根本无法连接到网络。

原因:在今天的网络中,到达桌面的千兆连接非常普遍。这种连接要求四对电缆,低于五类线的任何线缆都无法实现千兆的速率。在一些较老的建筑中,必须考虑这个问题。此外,电缆的任何松散都会引起信号丢失。这会导致交换机端口或网卡上的FCS错误。

解决方法:在与电缆有关的多数问题中,解决的最简单方法就是替换电缆。如果问题是由于电缆松散造成的,重新加固可以解决问题。如果你的网络要支持新技术,如千兆技术或Power over Ethernet,电缆就必须是五类线或更高标准。

问题八:DNS问题

症状:用户无法访问互联网或关键应用。网络看似已经“宕”掉。

原因:可能是DNS的原因。客户端电脑无法用被访问服务器的IP地址来解析服务器的名字,所以它将无法发送连接请求。这通常是由于在客户端上错误配置 DNS服务器选成的,这时的客户端发送DNS请求后,DNS服务器无法在数据库中找到记录,或是发生了数据包丢失。DNS是一个基于UDP的协议,所以丢失的数据包无法转发,导致DNS故障。

解决方法:

检查客户端的配置,查看其使用了什么DNS服务器。如果服务器配置错误,就要在客户端中或在DHCP服务器中调整这种设置。反复通过客户端连接进行测试,进而决定是否由于数据包的丢失导致了响应延迟。如果数据包丢失,就应查找客户端与服务器之间的以太网错误。捕获失败的DNS请求,根据所获取的信息决定是否存在来自服务器的响应。理想情况下,管理人员可以设置一种可以持续地测试DNS服务器的工具,在发生问题时这种工具可以发出警告。

问题九:无线客户端无法连接

症状:客户端可以检测到无线接入点,但无法连接到无线网络。

原因:安全凭证、无线信道串扰、盲点等都可导致此问题。因为无线连接是看不见、摸不着的,所以如果没有一种恰当的工具,想要跟踪这些问题是非常困难的。

解决方法:使用一种无线监视工具来测量受影响区域的信号强度,如果可能的话,在此区域中执行一次现场检查,查找欺诈性或未知的接入点。这种接入点可能在配置时重叠了无线通道,所以影响正常的合法用户。检查来自周围的接入点信号中的噪音,以及微波和无绳电话的噪音。在客户端试图连接到接入点时,可监视客户端,看哪一步发生了故障,是联系故障,还是身份验证故障,还是授权故障?

在此,我们仅仅看了几个技术人员可能遇到的九种常见的网络问题。在许多情况下,可以进一步缩减故障范围,并进而解决之。此外,使用了恰当的工具,有助于快速隔离和解决问题,以尽量短的时间改善网络性能。

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑