可靠性設(shè)計(jì)問題最早是在軍用電子設(shè)備上提出來的,以后逐步發(fā)展到各種民用電子設(shè)備。可靠性工程本身的發(fā)展也是一個(gè)從定性要求到定量描述,經(jīng)過一系列工程方法實(shí)現(xiàn)定量控制,逐步發(fā)展成為一個(gè)專門學(xué)術(shù)及工程技術(shù)分支的過程。可靠性工程涉及面十分廣泛,它有一套實(shí)用的理論和方法。在這里只介紹一些基本概念和基本實(shí)用的方法。
一、可靠性的概念
1、我國相關(guān)可靠性術(shù)語定義的標(biāo)準(zhǔn)變化
在了解相關(guān)可靠性概念之前,必須要對我國有關(guān)“可靠性”的相關(guān)術(shù)語與定義的國家標(biāo)準(zhǔn)的變化情況做一介紹。在1982年我國曾發(fā)布了GB 3187-82《可靠性、維護(hù)性術(shù)語》,該標(biāo)準(zhǔn)在1994年進(jìn)行了修訂,修訂版本為GB/T 3187-94《可靠性、維護(hù)性術(shù)語》。在1993年,我國又發(fā)布了GB/T 14733.3-93《電信術(shù)語 可靠性、可維護(hù)性和業(yè)務(wù)質(zhì)量》。然而,在2008年發(fā)布了GB/T 2900.13-2008《電工術(shù)語 可信性與服務(wù)質(zhì)量》,該標(biāo)準(zhǔn)代替了GB/T 3187-94和GB/T 14733.3-93。在2016年我國又發(fā)布的GB/T 2900.99-2016《電工術(shù)語 可信性》,該標(biāo)準(zhǔn)代替了GB/T 2900.13-2008中的 “可信性”部分的術(shù)語與定義,其有關(guān)“服務(wù)質(zhì)量”部分仍然有效,也即GB/T 2900.99-2016部分代替了GB/T 2900.13-2008。
2、基本概念
關(guān)于可靠性(reliability)的定義,由于上述我國國家標(biāo)準(zhǔn)的變化也是有所變化的。下表1-2-1中給出上述各標(biāo)準(zhǔn)中關(guān)于“可靠性”的定義,以了解其變化情況。
表1-2-1:我國國家標(biāo)準(zhǔn)中相關(guān)“可靠性”的定義
可靠性(reliability)就是指產(chǎn)品在規(guī)定的時(shí)間內(nèi)和規(guī)定的條件下完成規(guī)定功能的能力。如果將這句話改成“在規(guī)定的時(shí)間內(nèi)和規(guī)定的條件下完成規(guī)定功能的成功概率”這就是可靠度的含義。這是一個(gè)定量指標(biāo)。
“完成規(guī)定功能”有不同含義。如果“完成規(guī)定功能”是指系統(tǒng)的技術(shù)性能,則可靠性指標(biāo)可用系統(tǒng)平均故障間隔時(shí)間(MTBF,Mean Time Between Failures)來描述。它依賴于系統(tǒng)中各元器件正常工作的概率和系統(tǒng)的組成。通常所指的可靠度就是這個(gè)含義。如果“完成規(guī)定功能”是指系統(tǒng)的維修性能,則可靠度就可用系統(tǒng)的平均維修時(shí)間(MTTR,Mean Time To Repair)表示。這種條件下的“成功概率”通常稱為“維修度”。如果“完成規(guī)定功能”是指技術(shù)性能和維修性能的綜合,則可用可用度A來表示:
A = MTBF /(MTBF+MTTR)
對于可維修系統(tǒng)來講主要是采用可用度A以及有關(guān)的MTBF和MTTR。人們對可靠性的認(rèn)識是逐步深化的。在過去的產(chǎn)品中主要是以機(jī)電產(chǎn)品為主,傳統(tǒng)的安全設(shè)計(jì)比較保險(xiǎn),往往會(huì)看到傻大粗黑的產(chǎn)品。它們主要矛盾常集中在幾何尺寸、重量等的加工質(zhì)量的保證上。人們首先關(guān)心的是性能可靠性及裝配的合格率。隨著電子產(chǎn)品的不斷出現(xiàn)和增多,產(chǎn)品質(zhì)量的含義就越來越廣泛,它的重要性也越來越突出。長期以來對通信產(chǎn)品沒有可靠性指標(biāo),但是隨著通信技術(shù),尤其是程控交換技術(shù)的發(fā)展,逐步在通信產(chǎn)品的技術(shù)規(guī)范中也提出了可靠性指標(biāo)。
注意:在GB/T 2900.99-2016中,將平均故障間隔時(shí)間(MTBF)也稱為平均失效間隔工作時(shí)間(MOTBF,Mean Operating Time Between Failures);將平均維修時(shí)間(MTTR)改為平均恢復(fù)時(shí)間(MTTR,Mean Time To Restoration,棄用Mean Time To Repair)。它們的定義詳見下表1-2-2中。
表1-2-2:GB/T 2900.99-2016中MTBF與MTTR的定義
3、和可靠性指標(biāo)有關(guān)的一些基本定義
在討論可靠性計(jì)算以前先來弄清一些有關(guān)術(shù)語和定義。
1)失效率和平均故障間隔時(shí)間。失效率就是單位時(shí)間內(nèi)出現(xiàn)的失效次數(shù),即失效速率。從一定意義上講失效率是時(shí)間的函數(shù)。但是對于大量電子元件構(gòu)成的電子設(shè)備來說,經(jīng)過一段老化以后,失效率是一個(gè)常數(shù),這點(diǎn)從理論上也已得到證明。把失效率記做“λ”,單位為1/h(或記做h -1),國外也有用FIT=10-9 h或% / h為單位的(例如10-5/h可記做%/10-3h)。對于可維修系統(tǒng)來說,失效率也稱做故障率。
和失效率相對應(yīng)的為“平均故障間隔時(shí)間”,即是經(jīng)常碰到的MTBF。失效率和平均故障間隔時(shí)間互為倒數(shù),即
MTBF = 1 / λ
2)修復(fù)率和平均故障修復(fù)時(shí)間。單位時(shí)間內(nèi)修復(fù)的故障數(shù)叫做修復(fù)率,記做μ,單位為h-1。和修復(fù)率相對應(yīng)的是平均故障修復(fù)時(shí)間MTTR。它們的關(guān)系為:
MTTR = 1/ μ
3)可靠度和維修度。前面已經(jīng)說過,可靠度就是“在規(guī)定的時(shí)間內(nèi)和規(guī)定的條件下系統(tǒng)完成規(guī)定功能的概率”。可靠度是時(shí)間的函數(shù),用R(t)表示。在時(shí)刻t的可靠度為:
R(t)= e – λ t
對于可維修系統(tǒng)來說,系統(tǒng)的可維修的概率稱做維修度。它的定義為“可維修系統(tǒng)在規(guī)定的條件和規(guī)定的時(shí)間內(nèi),完成維修而恢復(fù)到規(guī)定功能的概率”。在時(shí)刻t的維修度為:
M(t)= 1-e – μ t
4)可用度和不可用度。對于可維修系統(tǒng)來說,要考慮系統(tǒng)的維修率因素。這時(shí)系統(tǒng)在規(guī)定時(shí)間內(nèi)和規(guī)定條件下完成功能的概率叫做“可用度”或“有效度”,記作A。在系統(tǒng)穩(wěn)定運(yùn)行時(shí)λ和μ都接近為一個(gè)常數(shù)值。這時(shí)可用度為
A=μ /(μ+λ)= MTBF/(MTBF+MTTR)
和可用度相對應(yīng)的是“不可用度”或“失效度”。它是在考慮系統(tǒng)的維修率因素時(shí),在規(guī)定時(shí)間內(nèi)和規(guī)定條件下喪失規(guī)定功能的概率,記作U。
U + A = 1
U = 1-A = 1-[μ /(μ+λ)] = λ /(λ+μ)= MTTR /(MTBF+MTTR)
欲更多了解短波通信網(wǎng)絡(luò)可靠性相關(guān)概念的請進(jìn)入。
二、容錯(cuò)技術(shù)
為提高系統(tǒng)的可靠性,主要采用兩種技術(shù):避錯(cuò)技術(shù)和容錯(cuò)技術(shù)。
硬件避錯(cuò)技術(shù)是盡量減少硬件故障的發(fā)生概率,減小系統(tǒng)失效率。其主要方法是選用高可靠高集成度器件,提高可靠性設(shè)計(jì)水平,提高耐環(huán)境設(shè)計(jì)和嚴(yán)格質(zhì)量控制。軟件避錯(cuò)法主要包括尋求高可靠軟件的程序設(shè)計(jì)方法(如結(jié)構(gòu)化程序設(shè)計(jì))和提高軟件測試技巧以排除軟件內(nèi)隱藏的錯(cuò)誤。
硬件容錯(cuò)是利用額外的硬件和時(shí)間兩種冗余方式來掩蓋故障的影響。硬件的冗余有如備用方式;而時(shí)間冗余可以采用例如每一任務(wù)執(zhí)行兩次和檢錯(cuò)與校驗(yàn)技術(shù)等。冗余方法有多種,目前常見的有以下幾種:靜態(tài)冗余、動(dòng)態(tài)冗余、混合冗余和自清除冗余方式等。靜態(tài)冗余又叫屏蔽冗余,又主要分為三模冗余和采用糾錯(cuò)碼兩種方法。各種冗余方式的概念解釋在下表2中。還有其他方法,都比較復(fù)雜。有興趣的話可參看有關(guān)容錯(cuò)方面的文獻(xiàn)。
表2:常見的冗余方法簡介
三、軟件的可靠性
軟件故障主要是在設(shè)計(jì)階段及實(shí)現(xiàn)階段由于人為因素所產(chǎn)生的缺陷和錯(cuò)誤而造成的。它與硬件故障有本質(zhì)區(qū)別。
1、軟件可靠性定義
對軟件可靠性的定義存在有不同觀點(diǎn),歸納起來大致可分為下表3-1-1所示的三類。在GB/T 11457《信息技術(shù) 軟件工程術(shù)語》中,對軟件可靠性(software reliability)時(shí)按表3-1-1中第二類定義方法給出的,具體詳見下表3-1-2。
表3-1-1:軟件可靠性的定義方法
表3-1-2:軟件可靠性的定義(GB/T 11457-2006)
軟件可靠性和硬件可靠性是有差別的。例如,軟件可靠性主要由設(shè)計(jì)造成的,而生產(chǎn)(復(fù)制)、使用影響極小;又例如硬件可以通過冗余設(shè)計(jì)來提高系統(tǒng)可靠性,而相同軟件的冗余不會(huì)提高可靠性等等。但是它們也有共同之處,如軟、硬件的可靠性都是復(fù)雜性的函數(shù)。軟件可靠性也像硬件可靠性那樣“元件數(shù)越多,故障率越高”。問題是還不能導(dǎo)出與“元件數(shù)”相當(dāng)?shù)能浖俊?/span>
2、軟件錯(cuò)誤分類
軟件錯(cuò)誤可能分為語法錯(cuò)誤、語義錯(cuò)誤、運(yùn)行時(shí)錯(cuò)誤、規(guī)范錯(cuò)誤和性能錯(cuò)誤,其含義歸納于表3-2中。
表3-2:軟件錯(cuò)誤類型的含義
3、提高軟件可靠性的途徑
提高軟件可靠性的途徑主要由下表3-3所示的8種途徑。還可以采取一些提高軟件可靠性的其他措施。
表3-3:提高軟件可靠性的途徑
我國對于產(chǎn)品的可靠性及軟件的可靠性有大量的相關(guān)標(biāo)準(zhǔn)(含國家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)等),其內(nèi)容包括評估評定方法、試驗(yàn)方法、管理方法、設(shè)計(jì)要求和技術(shù)要求等類型。
欲進(jìn)一步了解通信設(shè)備可靠性要求的請進(jìn)入。