A menos que el código maneje valores mayores que 2 ^ 32, es poco probable que haya una diferencia mensurable para una Arquitectura de conjunto de instrucciones (ISA) similar, con una memoria caché y una interfaz de memoria similares.
Sin embargo, los procesadores de 32 bits generalmente tienen un caché más pequeño que un procesador de 64 bits, solo por la generación de tecnología o los objetivos de diseño de los productos. Por lo tanto, las diferencias son más acerca de la implementación que de las ventajas inherentes de 32 bits en lugar de 64 bits.
Donde se puede medir fácilmente una diferencia es una aritmética pesada de punto flotante de doble precisión, que son valores de 64 bits. La diferencia puede provenir de la CPU a los accesos a la memoria y la implementación de la unidad de procesamiento de punto flotante (FPU). Es plausible que la diferencia de velocidad de reloj entre 32 bits y 64 bits sea más cercana a 2 veces. Sin embargo, incluso aquí es probable que una diferencia mayor en el rendimiento sea el tamaño de la memoria caché, la velocidad del bus de memoria y la implementación de la FPU, en lugar de 32 bits frente a 64 bits.
La otra diferencia principal es la incapacidad de un procesador de 32 bits para ajustar la mayor cantidad de datos en la RAM (por lo general, el tamaño del código del programa es mucho menos que los 4GB).
Un procesador 'ordinario' de 32 bits solo puede acceder directamente a un espacio de direcciones de 32 bits, 4 GB. Un procesador de 64 bits tiene un espacio de direcciones teórico de \ $ 2 ^ {64}, o 18 \ cdot10 ^ {18} \ $, es decir, 18 exabytes. Esto no suele ser implementado. Sin embargo, es posible tener más de un orden de magnitud más memoria en un procesador de 64 bits.
Es muy difícil estimar el impacto de ajustar todos los datos en la memoria frente a la lectura desde el almacenamiento externo. Puede ser un factor de más de un millón, o muy pequeño. Necesitarías hacer algunos puntos de referencia para averiguarlo. Además, al comprender los patrones de acceso a los datos, podría ser factible reducir las diferencias, incluso para conjuntos de datos bastante grandes, a menos de 2x.