Tengo una aplicación donde sospecho que la sobrecarga principal es acceder al caché L3. Se ejecuta en un moderno microprocesador de nivel de servidor Intel con un enorme caché L3. Hay muchos microprocesadores disponibles con varios conteos y frecuencias de núcleo, y seleccionarlos es difícil.
Entonces, eso me llevó a preguntarme si el tiempo de acceso (éxito) al caché L3 se reduce con la frecuencia. Por lo tanto, si la CPU de 2 GHz accede al caché L3 en, por ejemplo, 12 ns, ¿significa eso que una CPU de 3GHz accede al caché L3 en 8 ns? Por supuesto, esto puede depender de los detalles de implementación interna de la CPU, así que limitemos las respuestas a los microprocesadores modernos i386 / AMD64.
Sé que al menos en el caso de DRAM, los retrasos son prácticamente constantes, por lo que si realiza un acceso DRAM aleatorio, una frecuencia más alta significa una mejor tasa de datos secuenciales después de que se haya pagado la penalización de acceso aleatorio. ¿Pero es SRAM fundamentalmente diferente? Se basa en transistores, por lo que supongo que se podría sincronizar en muy buenas frecuencias.
Lo siento si este es el lugar equivocado para preguntar, no hay mejor lugar para hacer preguntas detalladas sobre la arquitectura de la computadora. He considerado CS StackExchange y StackOverflow, pero creo que Electrical Engineering StackExchange era el mejor lugar. Realmente debería haber un StackExchange de arquitectura de computadora, pero no lo hay.