Dices "4 módulos de RAM más pequeños". Solo veo dos en el esquema y la lista de materiales (U6 y U7).
Ahora, vea cómo están conectados: su línea CS (selección de chip) se comparte (ambas conectadas a CS0 de la CPU), y su línea de datos está en paralelo (D0-D15 de la CPU va al primer chip, y D16- D31 va al segundo chip).
El beneficio obvio de hacer esto es que luego tiene un carril de datos que tiene 32 bits de ancho, lo que proporciona el doble de ancho de banda que tener un solo chip de 16 bits con el doble de capacidad. La latencia no es tan importante como el ancho de banda, generalmente, porque hay un mecanismo de captación previa, algo de caché en la CPU, y porque se accede a los datos en ráfagas.
Ahora, ¿por qué no usan un solo chip DDR3 de 32 bits de ancho? Porque no es fácil de encontrar. Mire digikey, proporcionan 42 referencias de DDR3 de 32 bits (ninguna de ellas está almacenada, y la mayoría está obsoleta), frente a 359 referencias de chips DDR3 de 16 bits. El estándar es solo usar chips de 16 bits.
Sin embargo, para su aplicación, no puedo decirle lo que necesita. El procesamiento de audio, incluso en tiempo real, no suele requerir actuaciones asombrosas, y ya tienes algo muy poderoso para eso. Probablemente, podrías ir con un solo chip de 16 bits y el ancho de banda sería suficiente. Pero si realmente está mezclando / remuestreando / etc ... muchos canales, mientras se muestra información en una pantalla de alta resolución (con el buffer de cuadros en la misma SDRAM), es posible que necesite más. Use su lógica para estimar aproximadamente sus requisitos de ancho de banda (dada la frecuencia de muestreo de audio, la cantidad de canales, ... y, para la pantalla: resolución de pantalla, profundidad de color, frecuencia de actualización, ...).