Así es como la Inteligencia Artificial mejora la cancelación de ruido

2021-12-14 21:52:23 By : Mr. fred zheng

Hoy en día, la Inteligencia Artificial está siendo uno de los nichos en los que más se investiga, ya que el hecho de que podamos enseñar a "pensar" a una máquina nos está permitiendo alcanzar niveles de desarrollo que, de lo contrario, tardaríamos siglos en alcanzar. Pero la IA no solo se usa "a lo grande", sino también en aspectos más cotidianos como, por ejemplo, la cancelación de ruido en los micrófonos que usamos habitualmente en nuestros hogares. Te contamos cómo es posible y cómo funciona.

La cancelación activa de ruido en un micrófono funciona, en términos generales, mediante la introducción de uno o más micrófonos adicionales que, al detectar ruido de fondo o sonidos lejanos, producen un sonido igual e inverso para cancelar el primero. Esta técnica es cara en cuanto a los materiales utilizados y la electrónica para llevarla a cabo, por lo que introducir un algoritmo de Inteligencia Artificial simple que haga todo el trabajo es, sin duda, algo muy rentable ya que estamos hablando de software y no de hardware. En el final.

Dejando de lado la cancelación activa de ruido por hardware, que a día de hoy sigue siendo la más efectiva, también podemos encontrarnos con varios sistemas que utilizan algoritmos de software para producir el mismo efecto (aunque como ya hemos dicho, no son tan efectivos).

La mayoría de los algoritmos de eliminación de ruido son sustractivos, es decir, identifican ciertas frecuencias que tienen los niveles más altos de ruido de fondo y eliminan esas frecuencias de la señal original. El problema con este método es que se utilizan filtros estáticos (conocidos como paso bajo, paso alto y paso banda), diseñados con parámetros específicos que pueden eliminar los sonidos que no deben eliminar, o que no pueden eliminar. todo el ruido de fondo.

Para que os hagáis una idea, en la siguiente imagen podéis ver cómo funciona un algoritmo de reducción de ruido de Wiener; en la primera gráfica solo tenemos la voz del interlocutor, completamente limpia, mientras que en la segunda tenemos la misma pero con ruido de fondo, donde se ve claramente que la onda está "sucia". En el tercer gráfico, tenemos el resultado después de aplicar el filtro, que ha eliminado las frecuencias para las que está programado.

Sin embargo, podemos ver en los gráficos de la derecha que se han perdido muchos matices con respecto a la frase limpia original. Por lo tanto, este tipo de filtros solo son efectivos cuando el ruido de fondo está determinado y siempre es el mismo, pero son tremendamente ineficaces en situaciones donde el ruido de fondo varía y pueden crear efectos no deseados como los que hemos revisado. Hace un tiempo.

Como ya sabes, la Inteligencia Artificial también necesita tener una especie de base de datos en la que basarse para, en este caso, saber identificar qué es el ruido que debe suprimir y qué es el sonido "bueno" que debe dejar. aprobar. Esto, como en todos los algoritmos de IA, se realiza a través del aprendizaje automático, o en otras palabras, la IA debe tener una base en la que basar sus decisiones.

Pero antes de establecer el conjunto de datos en el que basarlo, es importante considerar el caso de uso del modelo, en este caso la supresión de ruido. Por ejemplo, al entrenar un algoritmo de reducción de ruido que se aplicaría a las señales de micrófono de un piloto de helicóptero, tiene más sentido entrenar la red neuronal con muestras de audio distorsionadas por variaciones en los sonidos producidos por el motor del helicóptero. helicóptero. Sin embargo, para un modelo de supresión de ruido más genérico, tiene más sentido entrenar la red con muestras de sonidos de fondo más cotidianos, como conversaciones de fondo, ruido de ventiladores, ladridos de perros, ruido del tráfico, música, etc.

La principal diferencia entre la reducción de ruido mediante Inteligencia Artificial y la reducción de ruido simplemente por software es que en este último el "modelo" utilizado son filtros fijos completamente estáticos, mientras que al utilizar AI estos filtros son completamente modificables ya que para eso es la AI, para interpretar qué tiene que reprimir y qué no en base a ese entrenamiento previo.

Por ello, la reducción de ruido mediante Inteligencia Artificial como RTX Voice o la tecnología que Microsoft está implementando en Teams es mucho más eficiente y efectiva para el uso diario, ya que no hace uso de filtros fijos y que, en realidad, solo sirven. para mitigar un tipo de ruido de fondo.