Creo que depende de la máquina, sus objetivos de diseño y las limitaciones de la tecnología.
La mayoría de las máquinas acumuladoras tradicionales tienen muy pocos registros, y muchas solo tienen un único registro de "propósito general" (para los estándares actuales). En el PDP-8, por ejemplo, hay algunos registros, pero el único al que se puede acceder directamente es el AC. La gran mayoría de las instrucciones (no que "vasto" se aplique a un diseño con ocho instrucciones) operan en el AC. El único otro objeto sobre el que operar es la memoria, por lo que la mayoría de las instrucciones tienen un solo campo (una dirección de 7 bits). La dirección de transferencia de datos está implícita en la instrucción (piense en cargar / almacenar).
Por otro lado, los lenguajes de máquina de muchas máquinas acumuladoras fueron un efecto secundario de la arquitectura del sistema más que a la inversa (que es como lo hacemos hoy, siendo el software el rey). El PDP-8 era una máquina acumuladora porque, bueno, los flip-flops de 12 bits eran un equipo bastante caro a finales de los años 60 y el PDP-8 era una computadora barata.
En cuanto al factor de velocidad: los registros en el procesador fueron casi siempre más rápidos que la memoria, igual que ahora. Pero su costo era mucho más alto de lo que es ahora, los anchos de instrucción eran más pequeños, los secuenciadores y las máquinas de estado eran mucho más simples, por lo que no había muchos registros. A menos que tenga al menos dos de ellos, puede mantener su conjunto de instrucciones muy simple. Y viceversa.
También, con respecto a las primeras computadoras que usan 'acumuladores' en lugar de 'registros': el 'acumulador' proviene de su uso en máquinas de tabulación para denotar registros de totales acumulados. Presumiblemente los operadores habrían estado más cómodos con el término. Los esquemas PDP-8 se refieren a cada flip-flop individual en el sistema como un "registro", pero solo hay un "acumulador" y está marcado como un registro "importante".