El ARM de 32 bits es bastante eficiente en el punto flotante del software. El conjunto de instrucciones permite que cualquier instrucción incluya un desplazamiento de barril derecho o izquierdo de longitud arbitraria en 1 ciclo. La ganancia de velocidad del hardware FP es más o menos de 5 a 50, dependiendo de la operación y cómo se manejan las funciones trigonométricas. El hardware de punto fijo DSP en el F4 puede mejorar la velocidad de DSP entre 2 y 4 veces. Eso no parece mucho, pero es la diferencia entre actualizar la velocidad del motor 16 veces por segundo en comparación con 4. Tiene, entre otras cosas, un MAC (multiplicador-acumulador) que funciona con 32x32 + 64 - > Acumulador de 64 bits y algunos procesos que harán un par de MAC de 16 a 32 bits. El MAC es el pilar de DSP.
También hay un generador de números aleatorios analógicos y 3 ADC de 12 bits que pueden manejar 7.2MHz (supongo que es una placa Discovery). Supongo que veremos muchas de estas variaciones en "-uino".
Re: ventaja de la velocidad, hice un gran análisis cuando. Era 1 MHz 65C02 en comparación con el mismo, con una FPU ADM9511 agregada. Algunas cosas en los trascendentales fueron 1000 veces más rápidas, pero muchas estaban solo en el rango de 10 a 50. Como la inspiración para ARM no es sorprendente que 6502 fuera bastante eficiente. Wozniak escribió el sistema completo de Apple II FP en 256 bytes. Números como 100 a 1000X fueron buenos para algunos otros 8 bits 8080 / Z80. AVR en Arduino tiene algunos buenos trucos para el conjunto de instrucciones que lo ubican muy por delante de la multitud de 8080 de los viejos tiempos.