Wat is betrouwbaarheid in een elektronisch systeem?

Wat is betrouwbaarheid?

(Bronnen:1 2 3 4)
In deze beschrijving ligt de nadruk op elektronische apparaten/systemen en componenten. Voor een aantal termen zullen de Engelse uitdrukkingen worden gebruikt aangezien die termen in het Engels eenduidiger zijn gedefinieerd.
De term "betrouwbaarheid" is zeer dubbelzinnige. Als men de term betrouwbaarheid opzoekt komt men al snel op 6 of 8 verschillende betekenissen.
Om het te hebben over bedrijfszekere/betrouwbare systemen moeten we eerst definiëren wat we dan bedoelen.
We definiëren betrouwbaarheid als:

"Betrouwbaarheid (Reliability) is de continuïteit van het correct functioneren onder gespecificeerde omstandigheden."

We kunnen betrouwbaarheid meten, de gemeten betrouwbaarheid (measured reliability) Rm(t) geeft het percentage van het aantal producten die goed zullen zijn gedurende de tijd (t).
waarbij r het aantal falende producten is en n het totale aantal producten.
Onbetrouwbaarheid F (t) geeft het percentage van het aantal producten die zullen falen gedurende de tijd (t).

Failure Density f (t) geeft het percentage van het aantal producten dat per tijdseenheid zal hebben gefaald gedurende de tijd (t).

Failure Rate λ(t) geeft het percentage van het aantal producten die goed waren tot tijd t, en zullen falen gedurende de volgende tijdseenheid.


Helaas heeft bovenstaande een beperkte praktische bruikbaarheid voor elektronica componenten. Een fabrikant of leverancier heeft niet alle tijd om voor elk product of component een gemeten betrouwbaarheid vast te stellen.

Om dit dilemma op te lossen heeft de industrie zich gericht tot de kansberekening om een prognose van de betrouwbaarheid (forecased reliability) Rf(t) vast te stellen binnen de levensduur van een product of component.

Als we hiervan uitgaan zullen we ook de definitie van betrouwbaarheid moeten herzien.

"Betrouwbaarheid is de waarschijnlijkheid dat een apparaat of systeem zijn functie uitvoert binnen een gespecificeerde tijdsperiode onder gespecificeerde omstandigheden."


Drie woorden in deze definitie zijn van belang: "waarschijnlijkheid", "gespecificeerde" en "tijd".

1 Waarschijnlijkheid: We hebben het over de kans dat een product zal functioneren of falen in de tijd. Het is geen zekerheid.
2 Gespecificeerd: Er zijn beperkingen voor betreffende de waarschijnlijkheid. We moeten deze beperkingen meenemen in de overweging bij het gebruik van de betrouwbaarheidsgegevens.
3 Tijd: De kans is tijdsafhankelijk. Het kan toenemen of verminderen binnen een tijdsperiode.

Om met het laatste punt te beginnen:
Betrouwbaarheid veranderingen in de tijd
Zoals eerder vermeld "betrouwbaarheid" is niet constant in de tijd. Een product heeft drie fasen waarin de betrouwbaarheid van een product zeer verschillend is.
Deze fasen zijn:

  1. Infant mortality of vroege uitval
    Beschrijving
    Gedurende het productieproces bestaat de kans dat halfgeleiders (of andere componenten) beschadigingen hebben als gevolg van de aanwezigheid van kleine deeltjes, variaties in productie apparatuur, productie proces of variaties in afmetingen. Dit feit staat bekend als initiële fouten. Het is de verantwoordelijkheid van de fabrikanten om ervoor te zorgen dat deze producten niet bij de klant terecht komen.
  2. Steady-state of stabiele fase
    Beschrijving
    Zelfs als de producten met initiële fouten gefilterd worden, zullen er producten blijven bestaan met kleine gebreken. In de stabiele fase zullen er nog enkele initiële fouten overblijven, maar deze fase wordt vooral gekenmerkt door het optreden van willekeurige mankementen/fouten.
    In de stabiele fase zal de failure rate min of meer constant zijn en hoofdzakelijk veroorzaakt worden door elektrische ruis, elektrostatische ontlading, kosmische straling en andere problemen. Al deze problemen kunnen willekeurige optreden onder invloed van externe factoren.

    Bij het berekenen van de betrouwbaarheid wordt uitgegaan dat de componenten zich in deze fase bevinden.

  3. Wear-out of Slijtage
    Beschrijving
    Halfgeleiders of componenten gaan kapot als ze de grenzen van hun duurzaamheid bereiken. De fase waarin dat gebeurt heet wear-out of slijtage fase. Over het algemeen slijten halfgeleiders nauwelijks onder gespecificeerde omstandigheden. Onder deze omstandigheden kan een halfgeleider tientallen tot honderden jaren meegaan voor er slijtage optreedt. Echter bij het gebruik van deze onderdelen in omgevingen met bijvoorbeeld hoge vochtigheid of extreme temperaturen schommelingen kan een component slijten vertonen binnen de beoogde product-life-time van het product.

De figuur hieronder toont een typische uitvalpercentage (failure rate) curve (in het rood) van een product met de drie bovengenoemde fasen.
Dan het punt "Waarschijnlijkheid".
Betrouwbaarheid wordt op verschillende manieren weergegeven.
Een veel gebruikte manier om betrouwbaarheid uit te drukken is MTBF (Mean Time Between Failures) of MTTF (Mean Time To Failure) afhankelijk of het component vervangen kan worden of niet. Een andere manier is om betrouwbaarheid uit te drukken in FIT (Failures In Time). De relatie tussen MTBF en FIT is: MTBF(in uren) = 109 x FIT.

Kansberekening:
Als fouten willekeurig voorkomen dan kunnen ze worden beschreven door een exponentiële verdeling.
In kansberekening is een kansdichtheid, of kansverdeling een functie die de waarschijnlijkheid beschrijft, dat een willekeurige variabele een bepaalde waarde krijgt.
De voorspelde betrouwbaarheid (forecasted reliability) kan worden omschreven als:

Waar de failure rate (λ) het aantal falende eenheden per tijdseenheid is.
Tijdens de nuttige levensduur van een onderdeel (steady-state of stabiele fase) is de failure rate min of meer constant λ(t) = λ

Nu kunnen we de werkelijke betekenis van een MTBF / MTTF waarde herleiden.
Na een bepaalde tijd (t = MTBF) wordt de waarschijnlijke betrouwbaarheid, Rf(t):

Dit betekent dat voor een onderdeel of component, in het geval van een exponentiële verdeling met een constante uitvalpercentage (failure rate), de waarschijnlijkheid dat dit onderdeel of component zal blijven werken tot aan de MTBF/MTTF waarde, slechts 36,8% is.

Om de waarschijnlijkheid dat een onderdeel zal blijven werken te verhogen naar ongeveer 78%, moeten we ons realiseren dat dit zal gebeuren rond een kwart van opgegeven MTBF waarde. Een veel gemaakt vergissing is om de MTBF / MTTF waarde te interpreteren als een gegarandeerde, minimale tijd tussen storingen. Dat is het absoluut niet.

Hoe fabrikanten de betrouwbaarheidsgegevens vaststellen.

Aangezien de failure rate van actieve componenten meestal in de orde grote van honderden jaren ligt moesten de fabrikanten iets bedenken om snel realistische MTBF of MTTF waarde vast te stellen. De truc iedereen gebruikt is "accelerated life model”. Wat ze doen is het testen van hun onderdelen bij hoge temperatuur en die gegevens stoppen ze in een formule om een uitspraak te kunnen doen over de waarschijnlijke betrouwbaarheid onder realistische omstandigheden.
De formule die wordt gebruikt is bekend als Arrhenius vergelijking:

Afv = de reactiesnelheidsconstante voor een bepaald faalmechanisme bij een bepaalde temperatuur.
Ao = pre-exponentiële factor die kenmerkend is voor de gegeven faalmechanisme
Ea = Thermische activeringsenergie van het faalmechanisme in eV
k = Boltzmann constante, 8.617E-5 eV / K
T = de junction temperatuur (meestal de temperatuur van het silicium) in graden Kelvin

Met behulp van deze vergelijking kunnen we de Acceleration Factor (Af) bepalen en de failure rate in een conditie omzetten naar een failure rate in een andere conditie.

Met behulp van deze formule testen fabrikanten op een hoge temperatuur (accelerated test) en bereken terug naar een failure rate bij een lagere temperatuur. De meeste fabrikanten geven een failure rate bij een standaard (55 °C) temperatuur, met behulp van dezelfde formule kunnen we de failure rate voor componenten in het product berekenen voor elke temperatuur.
Wel moeten we oppassen dat de gebruikte activeringsenergie realistisch is en dat we dezelfde activeringsenergie gebruiken in alle berekeningen voor het component. Ook moeten we rekening houden met het feit dat de activeringsenergie voor elk faalmechanisme anders is.

Als we daarnaast kijken naar de betrouwbaarheidsgegevens van de fabrikanten komen we ook nog zoiets als een confidence level tegen. Hiermee geven fabrikanten aan hoe zeker ze zijn van de opgegeven failure rate. Meestal publiceren ze een failure rate met een confidence level van maar 60%. Met behulp van de Poissonverdeling kunnen we een failure rate bepalen met een hogere zekerheid. Dit betekent meestal een hogere failure rate en dus een lagere MTBF/MTTF.

Bronnen:

1 ON Semiconductor Reliability and Quality Handbook.
2 Analog Devices, Inc. Reliability Handbook
3 Renesas Technology Corp. Semiconductor Reliability Handbook
4 NXP Quality reference handbook