La tolerancia a fallos es importante en situaciones donde el fallo no es una opción.
No se limita a asegurarse de que las entradas sean correctas, sino que su estado actual no cambia de forma espontánea.
Por ejemplo, ¿qué tan seguro quiere estar de que su cuenta bancaria no cambia de valor de forma espontánea? ¿O el software que controla el avión en el que viajas siempre funciona?
Uno de los dispositivos de tolerancia a fallas más comunes es Memoria del código de corrección de errores . Esto protege contra los cambios de bits aleatorios que pueden ocurrir en la DRAM debido a efectos externos como la radiación. Como caso extremo, el artículo de Wiki afirma que el satélite de espacio profundo Cassini sufre un promedio de 280 errores por día. Sería una planificación extremadamente deficiente si perdiera un proyecto de miles de millones de dólares debido a cualquiera de estos.
Otro caso común de tolerancia a fallos es la protección contra (algunos) errores de software. Puede haber algunas situaciones raras en las que el software se atasca en un bucle infinito. En estos casos, se puede usar un temporizador de vigilancia para garantizar que, si esto sucede, se obligue a un reinicio por software para intentar recuperarse de este caso de falla.
La tolerancia a fallas también se está investigando para su aplicación en electrónica de potencia extremadamente baja. Cuando los transistores se ejecutan a muy bajos voltajes, tienen una mayor probabilidad de no funcionar según lo previsto. Una idea es que si su chip es capaz de lidiar con fallas cuando ocurren, usted puede aprovechar los ahorros de energía cuando las cosas van bien y pagar solo el mayor costo de energía cuando ocurre una falla.