para mi próximo proyecto necesito implementar un núcleo CRC IP en Verilog HDL. Debe utilizar un registro de resultados polinomial de 16 bits y de 16 bits CRC. Los datos se están introduciendo en él en 8bit chuncks / bytes. Ya he implementado la versión en serie de CRC Core, usando un registro de desplazamiento y xor gates, pero estoy completamente perdido en cómo hacerlo en paralelo, de modo que el resultado esté disponible en el próximo ciclo de reloj.
Saludos cordiales