Si desea usar un micrófono para captar la señal, puede ser una tarea muy difícil. Dependiendo de cuánto pueda cambiar el usuario los parámetros, puedo dar algunas ideas.
Posiblemente puede usar un micrófono unidireccional y encontrar una manera de señalar la dirección del micrófono hacia la persona que está tratando de escuchar, luego usar un filtro de paso de banda con un ancho de banda de aproximadamente 300Hz a 3kHz (rango de frecuencia típico de la voz humana). Eso filtrará cualquier otro ruido que sea de mayor o menor frecuencia que no sea útil para lo que está tratando de capturar. Por supuesto, si hay otras personas en la ruta o si hay otras fuentes de sonido dentro de esa frecuencia de 300Hz a 3kHz, puede ser muy chiflado.
300Hz a 3kHz es un rango muy amplio, y abarca el rango de frecuencia vocal de casi todos. Si el usuario tiene acceso a los parámetros del filtro, otra solución sería aumentar el factor Q para reducir el ancho de banda y también poder cambiar la frecuencia central del filtro de paso de banda para ajustarse más cerca del rango de frecuencia de la persona.
Entonces hay un problema de distancia. Si desea utilizar un micrófono de auriculares estándar o el micrófono en un teléfono inteligente, estará muy limitado en lo que puede hacer.
Otra forma de hacer esto sería similar a cómo una persona puede crear pistas de música para aislar la pista vocal de una canción (a.k.a. una acapella). Básicamente, si la compañía discográfica lanza una versión "solo instrumental" de una canción específica, una persona puede tomar la versión, invertir la polaridad de la misma y combinarla con la canción original que tiene la voz. Esto hará que los instrumentos se cancelen con interferencia destructiva, mientras que la voz permanece.
La misma idea puede aplicarse aquí SI de alguna manera tienes el ruido de fondo SIN las voces que estás buscando. Considero que esto es poco probable, a menos que planee usar la configuración para una escena organizada que tenga un ruido de fondo constante y esperado cada vez que quiera grabar la voz de la persona deseada.
Estas son solo algunas sugerencias e ideas que están fuera de mi cabeza. Como dije, esta puede ser una tarea muy difícil, y puede ser más o menos difícil dependiendo de su conocimiento y experiencia en el procesamiento de señales de audio y digitales y en el análisis del espectro de frecuencias.