Llegaré a una pregunta más abajo, pero primero un poco de fondo
Estamos luchando para reproducir un error desagradable para el que hemos estado obteniendo informes.
Los síntomas muestran claramente que el RTC (un DS1305) se salta del 30 de noviembre al 1 de abril, el mismo año (por ejemplo, al revés).
Hemos recibido suficientes informes como para no poder escribirlo como un fallo de hardware o un destello solar u otro improbable error de una sola vez. Sin embargo, todos los intentos de reproducir este comportamiento en la empresa han fracasado. Incluso con el mismo hardware y la misma configuración que usó nuestro cliente cuando ocurrió el error.
Como no siempre sucede, ni para todos los dispositivos, no se siente como un error de software. Al menos no actuar por su cuenta.
Pregunta
Cualquier idea sobre cómo reproducir este tipo de comportamiento, métodos de detección de fallas, qué buscar, etc.
¿Alguien más tiene alguna experiencia con este tipo de error?
Nos conocemos con un síntoma muy similar , sin embargo, no está claro si esto está relacionado en absoluto.
Sé que faltan muchos detalles. No puedo revelar ninguna fuente, y simplemente afirmar que todo lo que sé será demasiado para escribir; Puedo informarle si publica preguntas concretas.
Actualizar
¡Por fin! ¡Hemos podido reproducir este comportamiento errático en el laboratorio!
Presionados por el tiempo tal como estamos, todos nuestros intentos de reproducción se iniciaron uno o unos días antes del 30/11 para ver cómo fue, y todos pasaron a 1/12 muy bien. Fue después de eso que notamos que todos los dispositivos de los clientes se iniciaron durante octubre.
Realmente no podemos trabajar con esperar más de un mes para reproducirse, por lo que se nos ocurrió una solución que, para mi sorpresa, parece funcionar.
¡Acelerando el reloj!
Hemos reemplazado el estándar de 32.768kHz osc con una señal de 1Mhz, y ahora podemos reproducirlo en aproximadamente un día.
Lo mantendré informado sobre lo que descubriremos sobre esto.
Gracias a todos por una excelente lluvia de ideas. Lo aprecio mucho.
Ahora, estoy tratando de recortar aún más el tiempo de reproducción, y desenterrar más datos al respecto.
Resuelto
He publicado la causa raíz de esto como respuesta aceptada .
Resumen: el valor del mes utilizado no era un valor BCD válido.