Chybová tolerance je schopnost systému zachovat řádný provoz v případě poruch nebo chyb v jedné nebo více jeho součástech. Pokud se jeho provozní kvalita vůbec sníží, je snížení úměrné závažnosti poruchy ve srovnání s naivně navrženým systémem, ve kterém i malá porucha může vést k úplnému zhroucení. Chybová tolerance je zvláště vyhledávaná u systémů s vysokou dostupností, kritických pro misi nebo dokonce kritických pro život. Schopnost udržet funkčnost, když se části systému porouchají, se označuje jako graciózní degradace. Chybově tolerantní návrh umožňuje systému pokračovat v zamýšleném provozu, případně na snížené úrovni, místo úplného selhání, když selže nějaká část systému. Tento termín se nejčastěji používá k popisu počítačových systémů navržených tak, aby pokračovaly ve víceméně plném provozu s případným snížením propustnosti nebo zvýšením doby odezvy v případě částečného selhání. To znamená, že systém jako celek není zastaven kvůli problémům v hardwaru nebo softwaru. Příkladem v jiné oblasti je motorové vozidlo navržené tak, aby bylo i nadále ovladatelné, pokud je jedna z pneumatik propíchnuta, nebo konstrukce, která je schopna zachovat svou integritu i přes poškození způsobené příčinami, jako je únava, koroze, výrobní vady nebo náraz. V rámci jednotlivých systémů lze chybové tolerance dosáhnout předvídáním výjimečných podmínek a budováním systému tak, aby se s nimi vypořádal, a obecně usilováním o samočinnou stabilizaci, aby systém konvergoval k bezchybnému stavu. Pokud jsou však důsledky selhání systému katastrofické nebo jsou náklady na zajištění dostatečné spolehlivosti velmi vysoké, může být lepším řešením použít nějakou formu duplikace. V každém případě, pokud jsou důsledky selhání systému tak katastrofické, musí být systém schopen použít reverzi k návratu do bezpečného režimu. To je podobné jako vrácení zpět obnovení, ale může to být lidská akce, pokud jsou v cyklu přítomni lidé.
Facebook Twitter