Circuito de audio para eliminar el vibrato mientras se preservan los detalles de la palabra

0

En música, el vibrato describe el efecto warble que los cantantes agregan a menudo mientras cantan. Estaba tratando de crear un circuito para eliminarlo de una señal de audio, casi como un "estabilizador vocal", dejando solo las voces puras y estoy un poco atascado. Mi primer pensamiento fue que hay algunas características del vibrato que lo diferencian del resto de la señal. La mayor parte de mi conocimiento de los circuitos de audio es autodidacta, así que disculpe mi falta de terminología adecuada. El vibrato tiende a ser:

  • Una baja frecuencia relativamente regular (~ 2-20Hz) superpuesta a la "frecuencia de nota" existente (el rango normal de 80Hz-15kHz de la voz que determina la voz humana en la música)

  • Oscilación de la amplitud y la frecuencia, compartiendo el mismo intervalo. Es decir. en vibrato, tanto el volumen como la nota suben y bajan simultáneamente, a los mismos 2-20Hz

  • Infrecuente, solo aparece en ciertas partes de la señal (por hora)

Parecería que, según estas tres características, el vibrato es definitivamente diferenciable, es difícil de extraer sin eliminar otros detalles. ¿Alguna idea?

    

1 respuesta

1
  

Una baja frecuencia relativamente regular (~ 2-20Hz) superpuesta a la "frecuencia de nota" existente (el rango normal de 80Hz-15kHz de la voz que determina la voz humana en la música)

Esto no es del todo correcto. El vibrato no es un componente de 20Hz sumado a las voces, en realidad es una modulación de frecuencia: el componente LF está modulando el rango vocal.

Para eliminar el vibrato, puede intentar usar el autoajuste con un tiempo de respuesta corto (para estabilizar la frecuencia) y la compresión (para estabilizar la amplitud). El ajuste cuidadoso de estos dos efectos probablemente haría un trabajo decente para eliminar el vibrato. Sin embargo, tenga en cuenta que esto no es algo que se pueda hacer con un simple circuito analógico. El cambio de tono de las señales complejas, como las voces (y mucho menos la sintonización automática) es decididamente no trivial de implementar en el dominio analógico.

    
respondido por el uint128_t

Lea otras preguntas en las etiquetas