Estoy bastante seguro de que Olin lo tiene clavado en su comentario allí: la idea es que puede aumentar la velocidad accediendo a más bits en paralelo o disminuir el número de pines y los bits de acceso en serie, pero estas cosas ocurren internamente. La forma en que obtiene un dispositivo de clase 10 es que el controlador interno toma el comando de escritura y accede a suficientes celdas flash en paralelo para que el borrado y la reescritura puedan realizarse a 10 MB / s. El problema aquí es que, en general, esto hace que las celdas flash sean más caras porque necesita más líneas entre cada capa, por lo que las tarjetas micro-SD son mucho más caras en las clases más altas.
La otra forma en que puede aumentar las velocidades es mediante el borrado previo de celdas. El problema es que solo puede cambiar los bits individuales en una dirección (no recuerdo si esto es alto a bajo o bajo a alto), y la otra dirección requiere que borre toda la celda. Entonces, en general, cuando intenta escribir 512 bytes, la tarjeta SD borrará el bloque en el que intenta escribir y luego escribirá los nuevos datos. Esto ralentiza la transacción, pero si en cambio marcó esa celda para borrar más tarde y luego escribió en una celda diferente que había sido borrada previamente, sucedería mucho más rápido. Luego, el IC de control puede pasar y borrar previamente las celdas marcadas cuando está inactivo.
Aaaa y escribí todo este blob como si estuvieras hablando con tarjetas SD, pero dijiste que estás escribiendo en flash chips. Whoops! El consejo para el borrado previo de celdas debería seguir siendo válido si tiene ese nivel de control sobre los chips flash. Cualquiera puede sentirse libre de corregirme si me equivoco, ¡y espero que eso ayude!
Editar:
Mirando las etiquetas parece que en realidad podría estar preguntando acerca de las tarjetas SD, en cuyo caso lo único que podría hacer sería una paralelización externa. Esencialmente, estaría implementando un RAID 0 donde el primer byte va a la primera tarjeta SD, el segundo byte a la segunda tarjeta SD, etc. Teóricamente podría aumentar su rendimiento N veces donde N es el número de tarjetas, siempre que los datos llegaron a una velocidad en la que podía esperar que la primera tarjeta terminara de escribirse en el momento en que terminara de enviar el comando de escritura a la tarjeta N.
La desventaja de esto es que necesitarías N interfaces de tarjeta SD que funcionen, y sería un poco molesto tener datos dentro y fuera de él.