随着电信业的迅猛发展,作为交换机的优选机型,EWSD市场在日益扩大。随着EWSD交换机数量的增多,加之扩容、设备使用年限的增加等诸多因素,SN的故障也渐渐多了起来。鉴于SN在EWSD交换机中的特殊地位及相关维护手册的过于繁文缛节,很少会有局方维护人员愿意独立作出及时处理,而TAC人员的现场处理既受到时间的限制又是一个不必要的人财物的浪费。因此,让广大维护人员克服心理障碍并掌握一定的方法来处理SN的故障就显得越来越有必要。其实,只要掌握SN故障检测机制并有一个清晰思路,大家会发现SN的维护并不是一件多么伤脑筋的事。基于此目的,并应许多局方维护人员的要求特写此文,只求能抛砖引玉,共同促进提高EWSD的维护水平。
一、SN的Safeguarding机制概要
SN的维护手段大致可分为例行测试和按需测试两种。为了便于对本篇的理解,我们首先对它们做些介绍:
1、SN的例行测试
SN的例行测试是SN的自我监视、自动检测的系统操作,其检测手段主要有以下五种: ⑴ 由SGC后台监视程序(包括对PLL电路、HWC电路、RAM及EPROM存储器的监视)自发向CP报告故障信息,另外由MBUS对其与SN接口的监视(包括电缆断等); ⑵ CP以一定的时间间隔(20秒)向SGC发送一条测试命令,根据SGC环回的情况的不同(有无应答,应答值是否与原值相符等)来判断SGC是否失效,这称之为接口检查; ⑶ 由于SN无法得知任何设置命令的正确与否,必须有一种方法来检查CM中内容的正确性, 这就是对CM(Control Memory)的读写检查。具体来说就是,在写操作之前SGC先读出CM的信息并将之与预期值比较,若连续两次失败则有条件地使相关SN单元退出服务; ⑷ CP周期性对MCH做测试,即CP按一定的时间间隔(CP113为10秒)交替通过激活和备用的MCH向所有工作中的LTG传送TECO命令,MBUL根据LTG的响应在发现错误时向CP报告相应的MCH出错消息,并使用统计的方法(例如为每个TSM模块上所连的LTG提供至少4条MCH的测试, 为每个SSM16/16模块提供至少16条MCH的测试)在MCH的故障分析程序的参与下进一步定位:某LTG的单侧MCH出错还是双侧MCH出错(若双侧MCH出错则进一步确认是否LTG出错),或者进一步根据标准MCH分配表(参见图六)定位出某SN模块出错(注意,如果某SN模块无LTG相联或相联的LTG数量很少则该检测手段无法实现或很难实现,进而言之, 如果部分SN的模块没有插好或是没有开电或所有类型的电缆未插好,则很难定位MCH的故障尤其是不能定位单个MCH的故障); ⑸ 利用COC(Cross Office Check)测试SN的话音通路线路单元,这是SN最重要的检测手段,我们特做稍加详细的说明。与MCH的测试不同,COC需借助于呼叫建立来完成。具体说来,根据路径的不同COC可分为三部分(参见图一:COC的测试路径): ◆ PATH 1, 在每个呼叫建立前,由A侧LTG的LIU发起COC,即由LIU模块中硬件TRAG发出测试码,通过ACT侧的SN,至B侧的LTG经LIU、GS或SPMX环回,再经过ACT侧的SN,然后由A侧LTG的LIU模块中的TRAEC对结果进行比较分析。如果结果正确则允许呼叫建立;如果结果不正确,这次测试所经过的所有SN模块的COC的错误计数器加1,并且由A侧LTG发起第二次测试(由A侧LTG至B侧LTG共有4条路由,可知第二次测试的路由与第一次相同的概率只有25%),若结果正确允许呼叫建立;否则, COC的错误计数器再加1。 ◆ PATH 2,与PATH 1类似,只是只经过备用侧的SN,且环回路由至B侧LTG的LIU中的多路复用器折回,并未经过GS或SPMX。如果PATH 2的测试未通过,则COC错误计数器加1,且不再进行第二测试。 ◆ PATH 3,不经过SN,只经A侧LTG的GS或SPMX做环回测试,且与PATH 1类似,在COC测试失败后重选路由再测,每次失败后, COC的错误计数器加1。 COC是基于统计的,具体来说,如果30分钟内ACT一侧的SN某个模块计数器达到20, 且备用侧为STB状态,则所有接收侧的LTG会得到通知切换至备用侧,并通知SN进行ACT/STB倒换;若COC错误计数器在30分钟内累加至门限值60,则按以下顺序对该侧SN采取相应处理步骤:若其中95%都经过某LTG或TSM,则相应的TSG置为UNA; 若其中95%都经过某SSM8/15或SSM16/16,则相应的SSG置为UNA;若未发现95%故障定位于某单元时,则等待COC错误计数器在30分钟内累加至200,则对DE5型的SN而言,该侧部分或所有的TSG或SSG状态将变至UNA(对DE4而言,该侧整个SN状态变至UNA)。 需要说明的是,PATH 1、3时对呼叫有影响的,而PATH 2不影响呼叫。

图一 COC的测试路径
COC的出错统计计数器对维护人员定位故障时非常有用的。其格式如下:
FAILURE STATISTICS:FD:COC LTG t-l t-l t-l t-l t-l t-l t-l t-l t-l t-l t-l t-l t-l ERRORS xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx MODULE 00 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 ------------------------------------------------------------------------ TSG-n-t xx xx xx xx xx xx xx xx xx xx xx xx xx xx xx xx . . SSG-n-s xx xx xx xx xx xx xx xx xx xx xx xx xx xx xx xx SSM-n-s xx xx xx xx xx xx xx xx xx xx xx xx xx xx xx xx
解析:这是按照故障频度由大到小依次列出前13个LTG的COC的统计值。第一行表明该信息是COC的统计数值,第二行即为故障率排在前13位的LTG的编号(t:TSG编号,l:LTG编号),第三行为LTG相应的出错次数(xxx),第四行为TSG或SSG中模块(如LIS/TSM、SSM16、LIS/SSM8)的板位号,第五行以后分别为LIL/TSM、SSM16、LIS/SSM8各模块的错误统计计数(在上面格式中用xx表示,其中n代表SN的0、1侧,TSG-n-t代表LIL/TSM,SSG-n-S代表SSM16,SSM-n-s代表LIS/SSM8)。在第五行以后的各行中一般会出现等于60甚至200的值,伴随的现象是某TSG或SSG状态或单侧所有TSG或SSG变至UNA。我们可从该统计值中得出某模块或其关联单元失效的推论。 在以上五种方法中,前两者只涉及到SN的核心部分(SGC,LIM等),而对线路单元(如SM、MUX、LIS、LIL电缆等)的故障监测需要借助于LTG的配合,这也就是后两种方法所涉及。 应该说,以上所述的SN的自我检测功能已经足够,SN始终处于很好的自我监视中,因此正常情况下按需测试是不必要的。
2、SN的按需测试
SN的按需测试主要指我们通常所说的诊断(DIAG)及测试(TEST)命令,通常在以下情况必须使用: ①新开局或SN扩容局,用以检出工程质量并去掉隐患; ②证实自我检测时发现的故障的可信性; ③对自我检测时发现的未能准确定位的故障(例如某TSG的状态为UNA)进一步定位; ④在换模块或电缆后验证故障清除是否成功。 SN的诊断和测试作用各不相同,其对应命令的功能有很大差别。 SN的DIAG命令只涉及SN的中央控制单元,包括LIM、SGC、 PLL电路,HWC 、TSM模块的CM(Control Memory)、SSM8/15模块的CM以及SSM16/16模块的CM。 而其他如TSG与LTG间的电缆、SN内部电缆(即TSG与SSG间的LIS电缆)、LIS及LIL模块、SSG中的MUX以及所有speech memory都只能用TEST命令才能检测。有一点请注意,SN(B)的DIAG命令与SN有很大不同,由于其结构上的原因(在此不赘述),SN(B)的DIAG命令覆盖了除LTG与TSG间电缆、TSG与SSG间电缆外所有单元,从而将SN(B)的DIAG命令故障检测深度由SN的30%左右提高至约95%。 SN的TEST命令分为快速测试及完全测试两种。快速测试覆盖整个SN的每个端口,但每端口只测一条路径;完全测试试图测试所有可能的路径(去掉NUC、已建立的话音连接、非激活的LTG等),故足以检出一个故障单元。快速测试及完全测试是由命令区分的,前者不带参数SUBUNT,后者带参数SUBUNT。 其实,SN的诊断相当于前面所述自动测试手段⑴,而SN的测试其本质大致相当于前面所述自动测试手段⑸,即COC,但其与呼叫建立时系统自动发起的COC有所不同的是,其路径只建立于备用侧单元(MBL或STB状态)。另外诊断命令只作用于SN自身,故不会增加CP的负载;而对测试命令而言,由于CP要调动LTG配合做大量路径的通路检测,必然要增加CP的负载。为了不影响正常的呼叫处理,在测试过程中,如果某一PATH没有通过,则测试立即停止并将这一PATH的信息输出到操作维护终端。 SN的诊断和测试命令在执行前所测试的设备都需要置为MBL状态,而相关设备可置于STB状态,被测试设备在执行中状态为SEZ。
二、SN的结构关系图
以上对SN的Safeguarding机制做了概括说明,但这对SN维护而言还远远不够,一个系统维护人员最应了解和关注的是硬件配置信息,诸如模块结构、位置,电缆(包括SN与LTG间的电缆、SN内部电缆、SN与MB间的电缆等)接法、位置、关系。这里所提到的许多资料可在EWSD的MMN和NM维护手册中查到,但许多维护人员可能会觉得无从下手,其实只要你掌握了SN的基本维护思路,并抓住LTG-TSG-SSG的连接关系这样一条排除SN故障的主线,问题都会迎刃而解。 下面将这条主线概括如下(为了便于理解,本篇只给出示意图):
1、 LTG与TSG及TSG内部连接图

图二 SN(DE5)中LTG-TSG连接关系图
说明:① 图中,LTG的编号为N-X(“N-”略去),X如上图所示(取值1-63),N随DE5的类型而变化,如对DE52而言,N可取值0,1,2,3;TSM、LIS所在TSG的编号亦然。 ② TSM的编号等同于LIL的编号,因为二者是配对使用的。 ③ 由本图可见,对DE5而言,LTG与TSG之间的连接关系及TSG内部连接关系其方式是相对固定的,不随DE5类型的变化而发生变化。
2 、TSG与SSG间连接关系图
因篇幅所限,只能以现今网上最普遍使用的DE52 SN(A)及SN(B)为例:

图三 SN(A)(DE52)TSG与SSG间连接关系图

图四 SN(B)(DE52)TSG与SSG间连接关系图
说明:① TSG与SSG之间只靠LIS电缆相连,如图中箭头连线所示。 ②图中只示出直连关系,并未示出交叉关系,实际上,位于机架背面的LIS电缆每组由8根(4对)组成,0、1侧直连为两对,交叉为两对,每对又分为上收下发两根;对每个LIS(TSG或SSG中) 端口而言,接有4根电缆,分别去SN对端(SSG或TSG中)的0、1侧。 ③SSG中LIS(LISB)编号等于SSM8/15(SSM8B)的编号。 ④图中PATH0至PATH3不同于COC中的PATH,因篇幅所限不再祥述。 ⑤TSG与SSG间的连接关系是随DE5的类型的不同而各异的,也就是说LIS电缆的连接关系是随SN的类型而变化的。
3、SSG内部关系图

图五 SSG内部关系示意图
说明:① 同TSG中的LIS一样,LIS分为接收和传送部分。 ② SSM8/15的外侧与LIS相连,为8端口,内侧端口与SSM16/16相连,为15端口,每端口接1块SSM16/16;每块SSM16/16为16端口,每端口接一块SSM8/15模块。 ③ 对DE5而言,SSG内部连接关系其方式是相对固定的,不随DE5类型的变化而发生变化。
由以上可以看出,SN的结构关系中随SN的类型而变化的只有LIS电缆连接关系,恰恰是这个原因,EWSD的设计人员将TSG和SSG分放在不同机柜,而二者之间靠LIS电缆连接。可以说,能否弄清LIS电缆的连接关系是SN维护的关键。
三.SN常见故障处理思路
有了以上说明,如何排除SN故障的问题就很明了了。在日常维护中我们经常遇到的SN 的故障大致可分为两类:
故障现象一,单侧TSG或SSG故障;
故障现象二,LTG单侧MCH状态UNA的故障。
下面我们将其方法叙述如下:
1、故障现象一的解决方法
① 先排除MB的影响或相关因素; ② 使用DIAG命令对相关单元做诊断,注意根据故障大致部位选择TA参数,一般应选择TA=ALL; ③ 使用不带参数SUBUNT的TEST命令对相关单元做多次测试,缩小疑点,然后使用带参数SUBUNT的TEST命令确认疑点; ④ 查出有关的模块位置、电缆位置,并按照先模块后电缆的顺序更换直至排除故障。在更换LIS电缆时请注意电缆的0、1侧关系,只换同侧直连电缆即可,而交叉关系在开局或扩容时已确认无问题,并且在日常工作时很少让SN交叉工作,故在实际故障处理中除非必要,否则可不做交叉测试。
2、故障现象二的解决方法
在文章的开篇我们提到过自动测试⑷即MCH的测试是很难准确定位故障的,那么操作维护人员如何处理LTG的单侧MCH为UNA状态的故障呢? 我们知道,所有LTG皆通过MCH与MB相联, MB的T/RC0负责LTG1-15, T/RC1为16-31,T/RC2为32-47,T/RC3为48-63,结构清晰,且MB与SN间无交叉关系,因此若故障在MB,则很容易排除。 而MCH在SN内部的情况如何呢?在正常情况下, 系统根据一张MCH标准分配图分配0/1侧的ACT/STB状态(注意该状态与话音通路在接受侧LIU中的状态无关,话音通路永远走SN的ACT侧),MCH标准分配图因SN类型的不同而异。我们仍以DE52SN(A)为例来说明MCH标准分配图。假设某局的SN为DE52、满配置使用且所有LTG均为ACT状态,这时利用命令 <STATLTG:LTG=X-X; 得到就是一张LTG的标准MCH分配图,我们再利用图二及图三,我们可画出一张SN内部MCH分配图,见图六: 图中,SSG-n-0或SSG-n-1中的n可取值为0、1,分别表示SN的0、1侧;LTG与TSG的关系因一目了然未做标示。 当某LTG单侧MCH故障,这时无论MCH的标准分配如何而将该侧MCH置为UNA,另侧为ACT。那么,在出现LTG单侧MCH故障时,应如何着手处理呢? 首先要区分是个别LTG有故障还是多个LTG有故障:若多个LTG有故障,则找出其规律,例如LTG-0-32至LTG-0-47皆0侧MCH故障,我们有理由怀疑是MB-0-0的M:T/RC2模块坏;假如LTG-1-4至LTG-1-7中多个LTG的1侧MCH故障,我们首先应怀疑是TSG-1-1的M:TSM-1模块坏;假如LTG-2-35、LTG-2-39、LTG-2-43……LTG-2-63中多个LTG的1侧MCH故障,应首先考虑TSG-1-2的LIS7或SSG-1-1的LIS-13、SSM8-13或相关的LIS电缆坏。 如果虽然是多个LTG有故障但找不到以上规律,或只有一个LTG出现故障,则先对相关的TSG及MBUL做CONF命令,如仍不能激活,再从SN内部MCH分配图找到有疑点的模块和电缆定位后依次更换即可。模块主要是TSG及SSG中的LIS、SSG中的SSM8/15,而SSM16/16可以先不换,一般情况下都能迅速排除故障。如果不奏效,再从MMN:MCH或NM:MCH手册中查阅MCH相关模块关系的列表,更换其他模块。

图六 SN内部MCH分配图
四.SN故障处理实例
为了更加具体地说明SN故障处理方法,针对以上两种故障情况各举一个实例:
实例一:
现象:荣成756局反映TSG0-0状态经常UNA。 现场处理: ①SN为SN(B)型,DE51,用DIAG命令诊断未发现故障,且证实与MB无关。 ②使用如下命令多次: <TESTTSG:SN=0,TSG=0,TA=SPEECH; 故障定位如下: UNIT SUBUNT LTG-0-x TSG-0-0 TSMB-y SSG-0-0 SSM8B-2 SSG-0-0 SSM16B-0 SSG-0-0 SSM16B-0 SSG-0-0 SSM8B-2 TSG-0-0 TSMB-5 LTG-0-z 在上述信息中,每次测试结果y随x的变化而变化,z在40至43间变化,其他信息不变,初步判断故障疑点为SSG-0-0中的SSM8B-2模块、LISB-2模块、SSM16B-0接至LISB-2的LIS电缆,再做如下命令: <TESTSSG:SN=0,SSG=0,TA=SPEECH,SUBUNT=SSM-2; 测试结果同上,更换SSG -0-0的SSM8B-2、LISB-2,再做测试,故障依旧;查手册知SSG-0-0的LISB-2的直连电缆接至TSG-0-0的LISB-1,更换之,再做测试,故障依旧。 ③这时疑点集中到LIS电缆,因现场无备用电缆,经考虑决定将之与TSG-0-0的 LISB0上的LIS电缆互换,查手册知TSG-0-0的LISB-0与SSG-0-0的LISB-0直连。 查手册知电缆位置如下: TSG-0-0 机柜 SSG-0-0机柜 06C203P1(收) 06C151P3(发) LISB-1 LISB-2 06C203P3(发) 06C151P1(收) 06C187P1(收) 06C125P3(发) LISB-0 LISB-0 06C187P3(发) 06C125P1(收)
将两对电缆互换后,做命令: <TESTSSG:SN=0,SSG=0,TA=SPEECH,SUBUNT=SSM-2; <TESTSSG:SN=0,SSG=0,TA=SPEECH,SUBUNT=SSM-0; 前者未发现故障,后者出现故障,也就是说故障已随电缆转移至SSM-0。可见TSG-0-0的LISB-1去SSG-0-0的LISB-2的两根直连电缆至少一根有问题,待更换新电缆后,故障排除。其实,仔细的读者已发现,对SN(B)而言,若DIAG未发现问题而TEST发现问题,则基本上可断定是LIS电缆的问题,而LTG至TSG间电缆故障的可能性很小,这是由SN(B)DIAG命令的特点决定的,请参见DIAG命令的功能说明部分。 注意:发现电缆故障后,非特殊情况下最好不要拆用交叉的LIS电缆,以避免风险。 实例二:
现象:泰安822局,DE52,SN (A),陆续发现多个LTG单侧MCH状态UNA,由于一直未处理,有逐渐增多之势。 现场解决: ①确认MB,SN的状态正常,SN工作于直连状态(即ACT的TSG,SSG在同一侧),单侧MCH为UNA的LTG有: LTG 0-31,LTG 1-33 ,LTG 1-43 为0侧UNA LTG 2-39,LTG 2-43为1侧UNA ②先着手处理LTG 2-39,LTG 2-43为1侧UNA的问题,做如下命令皆无法解决问题。 <CONFMBUL:MB=1,MBUL=2,OST=MBL; <CONFMBUL:MB=1,MBUL=2,OST=ACT; <CONFTSG:SN=1,TSG=2,OST=MBL; <CONFTSG:SN=1,TSG=2,OST=STB; ③做命令 <CONFTSG:SN=1,TSG=2,OST=MBL; <DIAGTSG:SN=1,TSG=2,TA=ALL; 未发现故障,再做命令 <TESTTSG:SN=1,TSG=2,TA=SPEECH; 重复4次后,故障定位信息如下(注意每次SUBUNT的变化): COMPONENT UNIT SUBUNT LTGA LTG-a-b TSMA TSG-1-c TSM-15 (TSM-14 TSM-5 TSM-9 ) SSM8x15 SSG-1-1 SSM-11 (SSM-9 SSM-12 SSM-13) SSM16x16-AB SSG-1-1 CSM-3 (CSM-1 CSM-5 CSM-4) SSM16x16-BA SSG-1-1 CSM-3 (CSM-1 CSM-5 CSM-4) SSM15x8 SSG-1-1 SSM-13 (SSM-13 SSM-13 SSM-12) LTGB LTG-d-f 请注意在以上结果中,每次都出现了SSM-13,也就是说,系统在做通路测试时每到SSM-13处即出错退出。 ④查SN(A)DE52的LIS电缆表知,SSG-1-1的LIS-13直连的为TSG-1-2的LIS7。决定先更换相关模块,在更换SSG-1-1中的LIS-13后LTG-39及LTG2-43皆正常。 ⑤其实对于无规律的LTG单侧MCH的状态为UNA的故障,在做完②的工作后若故障依然,直接根据SN内部MCH分配图 分别换TSG及SSG中的LIS、SSM8/15或相应的LIS电缆,故障排除率在90%以上,因为在实际工作中很少发现SSM16/16出现故障,而理论上SSM16/16出现故障会导致较大范围的故障。 ⑥其他几个LTG单侧MCH的状态UNA的故障也一一解决,并进一步证实了利用MCH的分配图解决此类问题的简单、有效、快捷。 建议局方维护人员尽快根据自己局里的SN的型号准备一张SN内部MCH分配图,它会为你解决大多数的SN故障,并省却查MMN、NM手册的劳顿之苦。如果你愿意可将其再做加工,得到一份内容更加丰富更为全面的SN维护信息表,做为你SN维护工作的得力助手。
|