账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
数位电路故障的因果关系与数位示波器除错效能
向「头痛医脚」的尝试错误(Try & Error)除错法Say Good Bye!

【作者: 吳俊賢】2009年02月02日 星期一

浏览人次:【12418】

前言

工程师面对电路故障时如同医师面对病患问诊,医师会先观察病患的症状进而判断可能造成症状的种种可能因素,最后是针对最可能引发症状的病因对症下药。例如感冒与肠病毒的初期症状几乎一样,如果医师误将肠病毒以一般的小感冒处置则后果便可想而知了。同样地工程师是否累积足够的知识进行电路故障诊断,与上述的例子有异曲同工之处。了解电路故障的因果关系,方能与「头痛医脚」的尝试错误(Try & Error)除错法Say Good Bye!本文将探讨数位电路故障的因果关系,并就电路除错的步骤进行逻辑性的探讨,以及有效地应用数位示波器进行除错。


数位电路故障的因果关系[1]

数位电路故障的原因不外乎是来自杂讯的干扰或是时序出了问题(Timing issues)。我们以数位电路最常发生的突刺(Glitch)及矮波(Runt)现象来做分析。


@中标造成电路的误动作或错误资料的突刺(Glitch)现象


造成突刺((Glitch)现象的杂讯种类如下:


串音(Crosstalk)

串音的主因来自于耦合容抗​​这个看不见的路径所造成的杂讯干扰,小反射则是加重串音干扰的次因。耦合容抗的大小则视工作频率及印刷电路板布局(PCB Layout)而定。由于耦合电容是物理现象无法完全避免,唯一可降低耦合电容所造成的串音,是尽可能使用串列汇流排来取代并列汇流排,这也是目前不管高速(例如SATA、PCIe)或低速(例如I2C、SPI)的应用都使用串列汇流排的原因之一。


运用串列汇流排可降低串音的杂讯、缩小印刷电路板的使用面积、缩小连接器进而降低成本。小反射会造成波形前缘的振铃现象,由于振铃现象会导致信号高频成分的振幅加大,进而使串音的现象更严重,避免反射的现象必须确保电路的阻抗是匹配的,阻抗方面的除错则必须使用时域反射器(TDR)来除错。


大的反射(Reflection)

大的反射能量则会直接造成突刺现象[2]。


另外造成突刺(Glitch)现象的时序问题则包括:


竞态条件(Race Condition)的问题

我们常直觉地认为突刺现象的发生应该都是硬​​体的错,其实不然。竞态条件造成的突刺现象,可能是软体或硬体时序的问题。硬体的时序问题通常来自传导延迟(Propagation Delay),我们在数位逻辑设计所学的时序,通常先将传导延迟视为理想(零)的情形下进行分析。实际上,电路行为会因为有闸间传导延迟与时脉传导延迟等情形,一旦忽略此时序问题,便可能直接造成突刺现象。


数位/类比转换器的错误数位值

数位/类比转换器的错误数位值也会直接造成突刺现象,图一的波形可清楚看到这个现象。



《图一 数字/模拟转换器的错误造成的突刺波形(Measured by Tektronix MSO4104)》
《图一 数字/模拟转换器的错误造成的突刺波形(Measured by Tektronix MSO4104)》

造成数位电路无法判断的资料进而影响效能的矮波(Runt)现象


《图二 矮波现象的因果关系图》
《图二 矮波现象的因果关系图》

造成矮波(Runt)现象的杂讯种类仅有串音,先前已讨论过串音的原因在此不加赘述。


至于造成矮波现象的时序问题则包括:


因设定/保持时间违规(Setup/Hold time violation)所造成的介稳态(Meta-stability)现象

D型正反器是所有暂存器的基本单元,任何数位电路都会应用暂存器,一旦量测工程师忽略此一关键的时序问题,便可能造成矮波的现象。如果是因为传导延迟造成的设定/保持时间违规,量测时脉的数量不够是不可靠的验证方法,必须至少验证4000~10000个时脉或应用示波器的触发功能来检查是否有此现象。



《图三(a) 设定/保持时间的定义;(b)因设定/保持时间违规的介稳态现象[3]》
《图三(a) 设定/保持时间的定义;(b)因设定/保持时间违规的介稳态现象[3]》
《图四 运用矮波触发(Runt Trigger)捕捉的介稳态波形(Measured by Tektronix MSO2024)》
《图四 运用矮波触发(Runt Trigger)捕捉的介稳态波形(Measured by Tektronix MSO2024)》

因上升/下上时间(Rise/Fall time)过慢造成的非法位准(illegal level)

以图五为例,在虚线的时序上原本应到1的位准(绿色的上升时间),因为上升时间过慢后(红色)导致处于非0非1的非法位准,这种现象如果发生在由同一时脉驱动的同步数位电路,因为时脉上升时间变慢所造成的时序问题子称为Clock Skew。


《图五 上升时间变慢造成的非法位准示意图》
《图五 上升时间变慢造成的非法位准示意图》

因果关系归纳

从上述的因果关系归纳出数位示波器必须具备的能力:


  • ●杂讯的观察必须仰赖示波器有足够的系统频宽,并做出正确的设定。


  • ●脉波宽度触发功能(Pulse width Trigger):触发突刺现象,多半的示波器具有此触发功能,但是这只是发现到问题,无法找到原因。


  • ●矮波触发功能(Runt Trigger):触发矮波现象,一般的示波器不具备此触发功能,就算具备此功能也只是发现到问题,无法找到原因。


  • ●设定/保持时间违规触发功能(Setup/Hold Time Trigger):此触发功能才能快速发现矮波的原因。


  • ●上升/下降时间或回转率触发功能(Rise/Fall Time or Slew Rate Trigger):此触发功能才能快速发现非法位准的原因。


  • ●可能造成突刺或矮波的传导延迟问题,必须应用高取样率(如图六所示的范例,此时序分析仪具有60.6ps的时序解析度)、多通道的时序分析仪(Timing Analyzer)进行除错。数位电路的除错单靠示波器无法完全发现问题原因,还必须搭配解析度够高的时序分析仪方能直指问题的核心。




《图六时序分析仪的量测结果范例(Measured by Tektronix MSO4104)》
《图六时序分析仪的量测结果范例(Measured by Tektronix MSO4104)》

除错三大步骤[4] —认知、发现、解决电路

认知问题(Aware)

电路故障现象是连续发生还是间歇发生?

一般电路除错如果遇到功能性故障通常是显而易见的,但是如果是性能上的问题(Performance Issues)或间歇性问题(Random Anomaly)就比较难以认知问题的存在,此时必须仰赖示波器具有适切的波形更新率。何谓适切的波形更新率?一般而言频宽越高的示波器因观察的信号速度不同,波形更新率应随示波器频宽越高而必须更快。


表一 波形更新率参照表

频宽

应用

适切的波形更新率

100MHz-200MHz

类比、嵌入式系统

3,500次/秒 以上

100MHz-300MHz

数位

50,000次/秒 以上

350MHz-1GHz

数位

50,000次/秒 以上

1GHz-3.5GHz

数位

250,000次/秒 以上

4GHz-20GHz

数位

300,000次/秒 以上


厘清软体或硬体问题是嵌入式系统除错首要关键!

厘清问题才能避免影响除错的方向,文中提到造成突刺现象的竞态条件,也可能是软体的问题,此时示波器可以观察实体层的信号完整性。而资料链路层(Data Link Layer)的解码以往都必须仰赖人工解码,运用新式示波器便能同时观察这两者的对应关系,并透过对于串列汇流排或并列汇流排的触发便可迅速厘清。图七则为示波器触发I2C遗失确认(Missing Ack.)的除错范例。



《图七 因突刺引起的I2C遗失确认波形(Measured by Tektronix DPO4104)》
《图七 因突刺引起的I2C遗失确认波形(Measured by Tektronix DPO4104)》

发现问题(Finding)

如何运用仪器直接且立即地发现问题?

透过更新率快速的数位示波器观察到现象后,从波形样貌的观察选择触发条件直接触发到问题的核心。看不到问题便无从选择触发条件,这是更新率的重要性,有足够的更新率来认知问题却不具备发现问题的触发能力,两者都让除错变成劳神费时的工作。应有的触发能力可参考文中因果关系分析后的归纳结果。


是否能提供更有用的资讯以协助电路改善的决策?

除了触发之外数位示波器还提供搜寻的功能来解决困难的时序量测。目前的搜寻技术有两种:


  • ●以量测方式针对记忆体中的每一周期的信号进行量测



这是依据搜寻的条件从量测值中标记符合条件的事件,此方式的优点是有多少种量测参数便有多少种搜寻条件;缺点是量测不准时便找不到。许多时序上的参数本身就有互斥性存在,例如上升时间量得准时频率就量不到,频率量测准确时上升时间便量不准,这种搜寻技术难以应付困难的时序问题(诸如上升/下降时间、设定/保持时间违规等)。


  • ●以触发电路来搜寻



这种搜寻技术因为是硬体线路,所以不会因为垂直或水平档位设定的问题造成搜寻不到的现象,基本上是触发得到就找得到。图八是以设定时间0ns、保持时间4ns的规格,针对1M记忆体中的4000个时脉与资料,搜寻出设定/保持时间违规的应用范例。以往验证4000个时脉的违规现象必须花冗长的时间量测,如果使用量测作为搜寻技术的示波器,找不出这个问题。运用以触发作为搜寻技术的示波器,此一范例的量测时间含仪器设定则仅需不到5分钟的时间。



《图八 运用搜寻功能在3999个频率中找出52笔设定/保持时间违规之波形(Measured by Tektronix DPO4104)》
《图八 运用搜寻功能在3999个频率中找出52笔设定/保持时间违规之波形(Measured by Tektronix DPO4104)》

解决问题(Solving)

在执行改善后为确认问题消失,此阶段会反覆进行几次量测,以确认问题消失并储存波形以便制作报告。在此阶段示波器的操作介面是否简易、以及是否具备在示波器上便可快速编写长注解的功能,可加速工作的完成,以Linux或Windows为作业系统的示波器,因支援键盘等周边,在这方面的效能都较私有专属(Proprietary OS)的作业系统优异。在除错三步骤中示波器所需具备的能力犹如鼎之三足,三足方能鼎立,不可偏废。


结语:准确为量测之本

量测的误差包含三种来源:分别是人为误差、系统误差及随机误差。随机误差为扣除人为误差及系统误差后不明原因的误差故有其不可控制性,本文最后我们将重心放在可控制的人为误差及系统误差上。


人为误差通常是三种误差来源中影响最大的,所有仪器的规格都是在正确的设定下才能发挥出此仪器的最佳系统规格,我们在多年的教育训练中发现,有65%以上的工程师是以不正确的方法进行量测。以示波器为例,用正确与不正确的方法量测同一待测物,量测值的差异可能超过20%,要消弭人为误差最重要的还是要懂得正确量测的技术。


系统误差在购买仪器做出抉择的当下便决定了,同样100MHz频宽的示波器,垂直准确度有1.5%、3% 或5%误差,当工程师选择3%误差的示波器后,本身系统误差便决定了。系统误差在购买仪器后,仅能从定期的校正​​来确认是否合乎出厂的标定规格,所以在选择仪器时,必须仔细评估量测系统的误差是否足以验证工程师的待测物,毕竟准确为量测之本,功能性的设计及操作介面的难易都还在其次,切勿本末倒置。


君子务本,本立而道生,工程师的本便是准确量测,因为测试与量测涵盖电子产品完整的生命周期,从先期设计验证到售后维修除错,无一不靠量测结果作为判断准则,适切的系统以及正确的操作可让量测结果更具可靠性;靠得住的量测结果才能为产品品质把关,毕竟量测​​是门严肃的科学,过程与结果都应锱铢必较且不容妥协。


(本文作者为Tektronix太克科技资深行销业务经理)


<参考书目:


[1]嵌入式系统设计验证与除错测试认证课程讲稿 [书籍]/作者:吴俊贤。台北市:太克科技股份有限公司,2008。


[2]微电子电路(下)Microelectronic Circuits Third edition [书籍]/作者:SedraS.Adel和SmithC.Kenneth,译者:曹恒伟和林浩雄。台北市:台北图书有限公司,1993,第十四章双载子数位电路/讯号传输册,页1313。


[3]本图出处为On Semiconductor安森美半导体。


[4]数位示波器原理与准确量测技巧技术研讨会讲稿 [书籍] /作者:吴俊贤。台北市:太克科技股份有限公司,2007。 >


相关文章
今天的工程师对示波器有什麽需求?
PCIe技术跃升主流 高速数位测试需求持续升温
数位分析不可或缺 逻辑分析仪为除错而生
逻辑分析仪与时俱进 快速找出数位问题
提升取样率 为示波器讯号品质把关
comments powered by Disqus
相关讨论
  相关新闻
» R&S推出精简示波器MXO 5C系列 频宽最高可达2GHz
» 是德科技扩展自动化测试解决方案 强化後量子密码学安全性
» R&S在关键通信世界CCW 2024展示测试方案 协助成功过渡至任务关键宽频通讯
» 是德科技成功验证符合窄频非地面网路标准的新测试案例
» UL健康建筑验证标志全台首发 由南山人寿取得头筹


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK85L98R272STACUK6
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw