Con el debido respeto, necesita transferir su problema de diseño a alguien que sabe lo que está haciendo. Construir un S / H que responda a un pulso de nanosegundos es una tarea importante, y si no tiene experiencia en este sentido (como claramente no lo hace), francamente no veo ninguna esperanza de que tenga éxito.
Si aún desea tener acidez estomacal, le aconsejo que use un convertidor A / D de alta velocidad como este seguido por un detector de picos digital de muy alta velocidad instanciado en un FPGA de alta velocidad.
Notará, espero que solo el ADC le cueste alrededor de 4,000 dólares y que el FPGA no sea barato tampoco. Además, tendrás que diseñar una placa de circuito impreso para funcionar a 4 GHz, la cual apostaré no está actualmente en tu conjunto de habilidades. Breadboards simplemente no funcionará. Ni siquiera lo pienses. Ah, sí, y la parte de FPGA es bastante clara, ya que los FPGA manejarán fácilmente 4 GHz. Puede mirar en la línea Xilinx Virtex.
EDITAR - No ha especificado su frecuencia de pulso. Si es lo suficientemente bajo, probablemente podría usar un osciloscopio digital (muy bueno) de GHz configurado como un instrumento de recolección de datos. Se configuraría como una única traza, con acceso remoto. Cuando detecta un pulso, se notifica al host y se transfieren los datos de rastreo. El host luego restablecería el alcance y analizaría los datos de rastreo para extraer la amplitud máxima. Esto sería algo menos preciso que la ruta ADC / FPGA, simplemente porque los ámbitos no se molestan con los ADC de alta resolución. Este enfoque evitaría completamente la curva de aprendizaje asociada con el hardware de rollo propio, pero no tengo idea de si el rendimiento del sistema sería adecuado. Si el alcance tiene una memoria profunda, la transferencia de datos tomaría un tiempo ferozmente largo (un búfer de 1 Ms a 8 bits / muestra tomará unos 20 ms a través de USB 2).
EDICIÓN ADICIONAL - Su amplificador operacional es demasiado lento. Si bien el 6172 tiene la capacidad de salida para cargar el límite de salida en el tiempo requerido, no tiene el ancho de banda. Además, su diodo tiene un valor nominal de 4 nseg, lo que está garantizado para hacer imposible el cierre del bucle en 10 nseg.
Sus problemas de simulación son causados por un simple hecho: su base de tiempo es demasiado larga. Intente volver a ejecutarlo a 100 nseg, y verá todo tipo de problemas.