La imagen se transmitirá en serie a su MCU como una imagen JPEG. Y un ATmega32 (como el ATmega328p en el Arduino) solo tiene 2K de SRAM, ni siquiera lo suficiente como para contener una imagen QQVGA (160x120).
Con algunos códigos inteligentes, puedes decodificar la imagen sobre la marcha si solo buscas píxeles específicos, pero como los archivos JPEG se almacenan en el orden "Zigzag", será complicado.
La mayoría de las personas simplemente transmiten la imagen directamente a SD y no la analizan. Cámaras como la OV7670 son más adecuadas para el acceso directo del microcontrolador, pero la imagen seguirá siendo demasiado grande para almacenar en la memoria.
Incluso un ATmega1284p que tiene 16K de SRAM solo podría contener una imagen QQQVGA (80x60 565RGB).
Si está buscando procesar imágenes en la memoria, recomendaría mirar microcontroladores más robustos, como el xmega384 (32K), el pic32 (hasta 128K) o los microcontroladores ARM (hasta 262K IIRC). Una opción a considerar es el Arduino Due, que tiene una MCU ARM Cortex-M3 y 96K de RAM, que es suficiente para una imagen en escala de grises (o color indexado) de 320x240.