¿Por qué necesita más funciones en la matriz de micrófonos?

4

Estoy tratando de lograr la formación de haz de suma de retardo con el conjunto de micrófonos, para eso compré la cámara ocular de Playstation que tiene 4 micrófonos.

Para ubicar el ángulo del sonido, necesito encontrar el retardo de tiempo exacto que proporciona la salida máxima.

Ahora tomo la FFT de los datos de los canales y aplico la correlación cruzada en ellos. Encontré el retraso de tiempo entre dos canales. Pero me doy cuenta de que puedo hacer esto con solo dos canales, no veo el punto de calcular el mismo valor con otros canales.

Mi pregunta es que puedo calcular el retardo de tiempo con los datos de los canales 1 y 2, ¿cuál es la ventaja de tener más de dos canales en la formación de haz de suma de retardo?

    

2 respuestas

4

Cuantos más micrófonos tenga en la matriz, mejor será el rechazo del ruido. Gran parte de este rechazo de ruido mejorado proviene de un "ajuste" del haz que está formando, por lo que también obtiene una mejor direccionalidad.

Piénsalo de esta manera: Digamos que tienes dos micrófonos, separados aproximadamente 1 pie, y una persona directamente enfrente de los micrófonos. Debido a la dirección, los dos micrófonos tienen el mismo retardo. Ahora, coloca una fuente de ruido a 90 grados hacia un lado.

Los micrófonos están separados por 1 pie, que es aproximadamente 1 longitud de onda a 1 KHz. Entonces, si nuestra fuente de ruido está escupiendo 1 KHz, entonces eso se detectará en los micrófonos con la misma claridad que la persona que está frente a ellos. Un micrófono captará el cambio de fase de 1 KHz exactamente 360 grados respecto al otro, pero necesitamos un cambio de fase de 180 grados para una cancelación perfecta del ruido.

Esta separación de micrófono de 1 pie también capta armónicos de 1 KHz, también. Entonces, 2KHz, 3KHz, 4KHz, etc. serán tan claros como la persona que habla.

Si pasó de 2 micrófonos a 4 micrófonos, cada uno a 0.5 pies de distancia, nuestro ruido de 1 KHz se cancelará perfectamente, pero todavía tenemos un problema con 2KHz y sus armónicos (4KHz, 6KHz, etc.).

Si creara un gráfico polar de la sensibilidad del micrófono (y la matriz del micrófono) (grados fuera del centro frente a la sensibilidad frente a la frecuencia) vería lo que llamamos lóbulos laterales. En mi ejemplo, hay un lóbulo lateral a 90 grados, pero la ubicación real de los lóbulos depende del espaciado del micrófono y la frecuencia de interés.

En una matriz de micrófonos ideal, hay muchos micrófonos colocados en una matriz 2-D. El tamaño total de la matriz determinará la direccional de la matriz a bajas frecuencias, mientras que el número y la ubicación de los micrófonos dentro de la matriz determinan la ubicación y la magnitud de los lóbulos laterales. El espacio entre los micrófonos no debe ser regular (por ejemplo, cada 12 pulgadas) porque tiende a crear grandes lóbulos laterales. En su lugar, desea un espacio irregular (3 pulgadas entre estos micrófonos, 4 pulgadas entre estos micrófonos, 6 pulgadas, etc.).

Por supuesto, ninguna matriz de micrófono puede ser perfecta. Una ideal (pero no perfecta) para el rango de frecuencia de voz humana puede tener entre 10 y 20 pies y contener de 100 a 200 micrófonos. Cualquier cosa menos requiere un compromiso en el rendimiento. Depende de usted averiguar con qué compromisos puede vivir y diseñar su matriz en consecuencia.

    
respondido por el user3624
0

Tenga en cuenta que existe una explosión geométrica en el número de micrófonos necesarios. Esto significa que pasar de 1 a 2 micrófonos le brinda tanto beneficio como de 2 a 4. Luego de 4 a 8 para obtener el mismo grado de mejora (en rechazo de dB y / o caída lateral). Luego de 8 a 16. ..

Por lo tanto, una matriz con 128 micrófonos probablemente no sea 32 veces mejor que una con 4 micrófonos; probablemente solo 5 veces mejor :-)

    
respondido por el Jon Watte

Lea otras preguntas en las etiquetas