Estoy interesado, por qué para el microcontrolador Cortex M3 (stm32f103) el compilador a veces genera una instrucción NOP después de la bifurcación. Y por qué a veces no es así.
Por ejemplo:
0x08000496 2400 MOVS r4,#0x00
0x08000498 4625 MOV r5,r4
0x0800049A E006 B 0x080004AA
64: res=res+a[i];
65: }
0x0800049C F85A0034 LDR r0,[r10,r4,LSL #3] // No NOP after B
0x080004A0 EB100808 ADDS r8,r0,r8
0x080004A4 1C64 ADDS r4,r4,#1
0x080004A6 F1450500 ADC r5,r5,#0x00
0x080004AA 1BA0 SUBS r0,r4,r6
0x080004AC EB750007 SBCS r0,r5,r7
0x080004B0 DBF4 BLT 0x0800049C
66: int64_t avg=res/x;
0x080004B2 BF00 NOP // <------------------- NOP after BLT
69: int v=countbits1(5);
0x080004B4 2005 MOVS r0,#0x05
0x080004B6 F7FFFFA2 BL.W countbits1 (0x080003FE)
0x080004BA 9001 STR r0,[sp,#0x04] // No NOP after BL.W
72: unsigned int b=countLeadingZeros(5);
73:
0x080004BC 2005 MOVS r0,#0x05
Mi suposición inicial fue que la instrucción larga necesita alineación de palabras, pero BL.W después de NOP en realidad no la tiene. Si este NOP está relacionado con la tubería de alguna manera, ¿por qué hay sucursales sin nop después de ellas?
Estoy confundido.
ACTUALIZACIÓN:
Resulta que la rama puede no ser relevante en absoluto. Intenté mover la declaración de la variable local no utilizada int64_t avg, y NOP se movió junto con ella. Entonces, creo que el comentario de pjc50 es correcto y este NOP está ahí solo para permitir que el depurador ponga un punto de interrupción en esta línea.