El ciclo de von Neumann, la recuperación, la decodificación y la ejecución (a veces, una copia de escritura por separado) no se pueden realizar en un solo ciclo de reloj. Eso es probablemente a lo que te refieres.
Lo que está sucediendo es una técnica llamada ' pipelining '. Mientras se ejecuta una instrucción, la segunda se decodifica y la tercera se recupera de la memoria. Los tres en paralelo durante el mismo ciclo de reloj. Una sola instrucción todavía toma 3 ciclos de reloj, pero el mecanismo paralelo promedia a 1 ciclo por instrucción.
Algunas instrucciones como ramas / saltos toman muchos ciclos de reloj desproporcionados (3 o 3) porque rompen la tubería. Las instrucciones que se decodifican y se recuperan se deben vaciar y la tubería debe recargarse.
Algunos procesadores modernos están aún más optimizados que esto. Pueden predecir lo que ocurrirá y, por lo tanto, la técnica se llama ' predicción de rama '.