Como o AEC funciona?

Transcrições de Vídeo

0:08

Bem-vindo de volta. Para entender como o componente AEC funciona, vamos dar uma olhada no que

0:13

acontece com um sinal de áudio que começa no Far-End e é enviado para o Near-End, e o que o AEC

0:18

faz para evitar que seus ecos retornem ao o Far-End.

0:22

Aqui está um diagrama da jornada de ida e volta deste sinal de áudio. Você nunca saberia de fora,

0:27

mas o Acoustic Echo Canceler coloca o sinal de áudio em vários subsistemas, incluindo o Filtro

0:32

Adaptativo e o Algoritmo Adaptativo, Detecção de Conversação Dupla, Processamento Não-Linear,

0:38

Redução de Ruído e Comfort Noise. Vamos começar com o Adaptive Filter.

0:43

O objetivo da AEC é eliminar qualquer traço da voz do falante do Far-End do microfone do Near End -

0:49

que inclui todos os caminhos diretos e indiretos do alto-falante Near End para o microfone. Para

0:54

eliminar esse ruído, o componente AEC precisa ser capaz de prever como será esse ruído. Se

1:00

transmitirmos um som agudo e impulsivo através do alto-falante, como um clique alto ou um tiro,

1:06

poderemos gravar o sinal que chega ao microfone e obter uma gravação semelhante a essa. Esse

1:12

primeiro pico é o caminho direto do ruído do alto-falante para o microfone, e todos os picos

1:18

subsequentes representam as várias reflexões ao redor da sala - e quanto mais tempo demora para

1:22

chegar ao microfone, mais ele se atenua durante a viagem. Essa imagem é conhecida como a da

1:28

room impulse response e é um mapa preditivo do que acontece com qualquer ruído emitido pelo alto-falante.

1:34

Este room impulse response é usado para criar um Finite Impulse Response - ou FIR - Filter, aqui na

1:41

parte Adaptive Filter do sistema AEC.

1:44

Quando um sinal vem do Far-End, ele é alimentado tanto pelo alto-falante Near End quanto pelo

1:49

Adaptive Filter. O filtro FIR é aplicado ao sinal de entrada para criar sua previsão de como esse sinal

1:55

deve soar quando é recebido pelo microfone.

1:57

Então este ruído é digitalmente subtraído do sinal de microfone do Near End - o resultado deve ser o

2:03

silêncio. A parte mágica é que a operação de subtração não afetará nenhum ruído adicional no sinal

2:08

do microfone, como a voz do locutor do Near End, permitindo que o locutor do Far End tenha uma

2:13

conversa cristalina sem ouvir seus próprios ecos.

2:16

Não, eu posso ouvi-lo alto e claro, então, como vocês estão?

2:19

No entanto, há um problema fundamental com este modelo, que é o fato de que o room impulse

2:23

response muda constantemente. Sempre que uma porta se abre, ou alguém se senta, ou se uma

2:30

borboleta bate as asas, ela muda as superfícies na sala Near End, o que altera os reflexos de áudio do

2:37

alto-falante, que mudam o room impulse response. Agora não é uma boa ideia transmitir

2:43

constantemente grandes sons altos para acompanhar essas mudanças.

2:49

Em vez disso, o Algoritmo Adaptativo é usado para atualizar constantemente o Filtro, monitorando o

2:54

resultado da operação de subtração e depois ajustando o Filtro até que o resultado seja o mais

2:59

próximo de zero, ou silêncio, quanto possível. Este Algoritmo Adaptativo está sempre no trabalho;

3:05

tentando manter o filtro convergido com a resposta dinâmica do impulso da sala.

3:10

No entanto, ele só pode fazer o seu trabalho quando o Far End está falando e o Near End está em

3:15

silêncio. Este é o único momento em que o sinal do microfone, após a operação de subtração, será

3:19

igual a zero. Se o Far End estiver em silêncio, não há nada a medir e, se o Near End estiver falando,

3:25

haverá um áudio extra no microfone para que o resultado não seja zero.

3:28

Este é um trabalho para o Detector de Fala Dupla, ou DTD. O DTD ouve os microfones do Far End e do

3:35

Near End e determina se alguém está falando.

3:38

Se o Far End estiver falando e o Near End não estiver, então ele permite que o Algoritmo Adaptativo

3:43

faça seu trabalho de convergir o Filtro Adaptativo para a resposta ao impulso da sala. Em qualquer

3:48

outra situação, o DTD impedirá o Algoritmo Adaptativo de funcionar.

3:53

Uma vez que todos esses filtros e algoritmos tenham sido aplicados ao sinal, ele ainda tem vários

3:58

processos para passar antes de retornar ao locutor de Extremo Remoto. Primeiro, passa por um

4:03

Processador Não-Linear, ou PNL. Devido à dificuldade em convergir completamente o filtro FIR com o

4:10

room impulse response, há um limite residual remanescente no sinal do microfone neste ponto.

4:16

As constantes do Processador Não-Linear analisam o áudio a cada instante, para determinar se ele é

4:22

composto principalmente da fala do near-end, ou do residual ecos remotos. Ele aponta as áreas que

4:29

são feitas apenas de ecos e atenua essas seções. Os ecos remanescentes serão efetivamente

4:35

inaudíveis sobre o discurso final desejado.

4:39

Próximo no caminho de processamento é Redução de Ruído, ou NR. A Redução de Ruído tenta

4:44

remover a sala de ruído ambiente ouvindo o ruído constante sustentado no sinal e subtraindo-o.

4:50

Isto é para ajudar o falante do Far End a ouvir a sua voz, e não o zumbido do seu ar-condicionado, o

4:57

vento ou os cortadores de grama do lado de fora da janela, ou o exército alienígena invasor.

5:07

Você pode ajustar a quantidade de redução de ruído no painel de controle do seu AEC, e você

5:11

também pode ativá-lo ou desativá-lo com este botão.

5:15

Finalmente, o bloco Comfort Noise é uma característica especial do sistema Q-Sys AEC. Depois de

5:19

passar por Processamento Não-Linear e Redução de Ruído, o Far End deve ouvir o locutor do Near

5:23

End alto e claro, com tudo o mais silencioso.

5:27

Muito quieto. Se o locutor do Near End parar de falar, a linha pode ficar em silêncio e dar a impressão

5:34

de que a linha telefônica foi desconectada.

5:36

Basicamente é um subproduto da AEC fazendo seu trabalho muito bem. Na verdade, parece muito

5:41

estranho… Quando há completo silêncio ... Entre vozes, certo? Assim, o ruído do conforto pode ser

5:48

adicionado, que é um sinal artificial de ruído de baixa passagem que faz parecer que ainda há uma

5:52

conexão quando ninguém está falando.

5:54

Você também pode ajustar o nível do Comfort Noise adicionado no painel de controle. Os únicos

5:59

outros recursos no painel de controle são um bypass mestre para desligar o seu AEC e o medidor do

6:05

Echo Return Loss Enhancement, que mostra quanto, em decibéis, os ecos do Far-End foram

6:09

atenuados no sinal de retorno.

6:12

O nível nominal para este medidor irá variar dependendo das distâncias entre seus alto-falantes e

6:17

seus microfones, mas ainda deve dar uma boa idéia de quão eficientemente seu AEC está operando.

6:23

Então é isso que acontece dentro da caixa mágica - que felizmente você nunca precisará se preocupar.

6:28

Tudo o que você precisa fazer é certificar-se de que está conectado corretamente e depois esquecê-lo.

6:32

Ao contrário de muitos produtos existentes, o cancelamento de eco Q-Sys é

6:37

incluído automaticamente como parte do software Designer - não há hardware adicional para

6:40

configurar e nenhuma taxa adicional. É simplesmente parte do pacote Q-Sys. Agora, na próxima

6:45

seção, veremos como configurá-lo em conjunto com o componente Softphone para criar um sistema

6:50

de teleconferência. Assim, sinta-se à vontade para seguir em frente sempre que estiver pronto.