Como dice @tyblu, todo está en el manual para el USI. En particular, lo que desea es utilizarlo en "Funcionamiento en modo maestro de tres cables". Eche un vistazo a la Figura 61 en la página 143 de la hoja de datos. La hoja de datos es lo suficientemente amable como para proporcionar una rutina de ensamblador optimizada (8 instrucciones) (SPITransfer) para este propósito exacto:
SPITransfer:
out USIDR,r16
ldi r16,(1<<USIOIF)
out USISR,r16
ldi r16,(1<<USIWM0)|(1<<USICS1)|(1<<USICLK)|(1<<USITC)
SPITransfer_loop:
out USICR,r16
sbis USISR,USIOIF
rjmp SPITransfer_loop
in r16,USIDR
ret
Si lo cablea para que tenga un pin 2313 conectado al cable de "enganche" del controlador (naranja), el pin USCK se conecta al cable de "pulso" del controlador (rojo), y el pin DI se conecta al Cable de "datos" del controlador (amarillo): debería estar listo. Según la hoja de datos, el ejemplo del código supone que los pines DO y USCK están habilitados como salidas en el registro DDRB.
Una vez que se configura el hardware, todo lo que debe hacer es generar un impulso de 12us en el pin "latch", soltar el pin en 6us, luego llamar a la rutina de ensamblaje anterior dos veces (guardando el valor de retorno) después de cada llamada.
Encontré esta referencia muy informativa con respecto a la interfaz (S) NES.