Como o AEC funciona?

Transcrições de Vídeo

0:08
Bem-vindo de volta. Para entender como o componente AEC funciona, vamos dar uma olhada no que
0:13
acontece com um sinal de áudio que começa no Far-End e é enviado para o Near-End, e o que o AEC
0:18
faz para evitar que seus ecos retornem ao o Far-End.
0:22
Aqui está um diagrama da jornada de ida e volta deste sinal de áudio. Você nunca saberia de fora,
0:27
mas o Acoustic Echo Canceler coloca o sinal de áudio em vários subsistemas, incluindo o Filtro
0:32
Adaptativo e o Algoritmo Adaptativo, Detecção de Conversação Dupla, Processamento Não-Linear,
0:38
Redução de Ruído e Comfort Noise. Vamos começar com o Adaptive Filter.
0:43
O objetivo da AEC é eliminar qualquer traço da voz do falante do Far-End do microfone do Near End -
0:49
que inclui todos os caminhos diretos e indiretos do alto-falante Near End para o microfone. Para
0:54
eliminar esse ruído, o componente AEC precisa ser capaz de prever como será esse ruído. Se
1:00
transmitirmos um som agudo e impulsivo através do alto-falante, como um clique alto ou um tiro,
1:06
poderemos gravar o sinal que chega ao microfone e obter uma gravação semelhante a essa. Esse
1:12
primeiro pico é o caminho direto do ruído do alto-falante para o microfone, e todos os picos
1:18
subsequentes representam as várias reflexões ao redor da sala - e quanto mais tempo demora para
1:22
chegar ao microfone, mais ele se atenua durante a viagem. Essa imagem é conhecida como a da
1:28
room impulse response e é um mapa preditivo do que acontece com qualquer ruído emitido pelo alto-falante.
1:34
Este room impulse response é usado para criar um Finite Impulse Response - ou FIR - Filter, aqui na
1:41
parte Adaptive Filter do sistema AEC.
1:44
Quando um sinal vem do Far-End, ele é alimentado tanto pelo alto-falante Near End quanto pelo
1:49
Adaptive Filter. O filtro FIR é aplicado ao sinal de entrada para criar sua previsão de como esse sinal
1:55
deve soar quando é recebido pelo microfone.
1:57
Então este ruído é digitalmente subtraído do sinal de microfone do Near End - o resultado deve ser o
2:03
silêncio. A parte mágica é que a operação de subtração não afetará nenhum ruído adicional no sinal
2:08
do microfone, como a voz do locutor do Near End, permitindo que o locutor do Far End tenha uma
2:13
conversa cristalina sem ouvir seus próprios ecos.
2:16
Não, eu posso ouvi-lo alto e claro, então, como vocês estão?
2:19
No entanto, há um problema fundamental com este modelo, que é o fato de que o room impulse
2:23
response muda constantemente. Sempre que uma porta se abre, ou alguém se senta, ou se uma
2:30
borboleta bate as asas, ela muda as superfícies na sala Near End, o que altera os reflexos de áudio do
2:37
alto-falante, que mudam o room impulse response. Agora não é uma boa ideia transmitir
2:43
constantemente grandes sons altos para acompanhar essas mudanças.
2:49
Em vez disso, o Algoritmo Adaptativo é usado para atualizar constantemente o Filtro, monitorando o
2:54
resultado da operação de subtração e depois ajustando o Filtro até que o resultado seja o mais
2:59
próximo de zero, ou silêncio, quanto possível. Este Algoritmo Adaptativo está sempre no trabalho;
3:05
tentando manter o filtro convergido com a resposta dinâmica do impulso da sala.
3:10
No entanto, ele só pode fazer o seu trabalho quando o Far End está falando e o Near End está em
3:15
silêncio. Este é o único momento em que o sinal do microfone, após a operação de subtração, será
3:19
igual a zero. Se o Far End estiver em silêncio, não há nada a medir e, se o Near End estiver falando,
3:25
haverá um áudio extra no microfone para que o resultado não seja zero.
3:28
Este é um trabalho para o Detector de Fala Dupla, ou DTD. O DTD ouve os microfones do Far End e do
3:35
Near End e determina se alguém está falando.
3:38
Se o Far End estiver falando e o Near End não estiver, então ele permite que o Algoritmo Adaptativo
3:43
faça seu trabalho de convergir o Filtro Adaptativo para a resposta ao impulso da sala. Em qualquer
3:48
outra situação, o DTD impedirá o Algoritmo Adaptativo de funcionar.
3:53
Uma vez que todos esses filtros e algoritmos tenham sido aplicados ao sinal, ele ainda tem vários
3:58
processos para passar antes de retornar ao locutor de Extremo Remoto. Primeiro, passa por um
4:03
Processador Não-Linear, ou PNL. Devido à dificuldade em convergir completamente o filtro FIR com o
4:10
room impulse response, há um limite residual remanescente no sinal do microfone neste ponto.
4:16
As constantes do Processador Não-Linear analisam o áudio a cada instante, para determinar se ele é
4:22
composto principalmente da fala do near-end, ou do residual ecos remotos. Ele aponta as áreas que
4:29
são feitas apenas de ecos e atenua essas seções. Os ecos remanescentes serão efetivamente
4:35
inaudíveis sobre o discurso final desejado.
4:39
Próximo no caminho de processamento é Redução de Ruído, ou NR. A Redução de Ruído tenta
4:44
remover a sala de ruído ambiente ouvindo o ruído constante sustentado no sinal e subtraindo-o.
4:50
Isto é para ajudar o falante do Far End a ouvir a sua voz, e não o zumbido do seu ar-condicionado, o
4:57
vento ou os cortadores de grama do lado de fora da janela, ou o exército alienígena invasor.
5:07
Você pode ajustar a quantidade de redução de ruído no painel de controle do seu AEC, e você
5:11
também pode ativá-lo ou desativá-lo com este botão.
5:15
Finalmente, o bloco Comfort Noise é uma característica especial do sistema Q-Sys AEC. Depois de
5:19
passar por Processamento Não-Linear e Redução de Ruído, o Far End deve ouvir o locutor do Near
5:23
End alto e claro, com tudo o mais silencioso.
5:27
Muito quieto. Se o locutor do Near End parar de falar, a linha pode ficar em silêncio e dar a impressão
5:34
de que a linha telefônica foi desconectada.
5:36
Basicamente é um subproduto da AEC fazendo seu trabalho muito bem. Na verdade, parece muito
5:41
estranho… Quando há completo silêncio ... Entre vozes, certo? Assim, o ruído do conforto pode ser
5:48
adicionado, que é um sinal artificial de ruído de baixa passagem que faz parecer que ainda há uma
5:52
conexão quando ninguém está falando.
5:54
Você também pode ajustar o nível do Comfort Noise adicionado no painel de controle. Os únicos
5:59
outros recursos no painel de controle são um bypass mestre para desligar o seu AEC e o medidor do
6:05
Echo Return Loss Enhancement, que mostra quanto, em decibéis, os ecos do Far-End foram
6:09
atenuados no sinal de retorno.
6:12
O nível nominal para este medidor irá variar dependendo das distâncias entre seus alto-falantes e
6:17
seus microfones, mas ainda deve dar uma boa idéia de quão eficientemente seu AEC está operando.
6:23
Então é isso que acontece dentro da caixa mágica - que felizmente você nunca precisará se preocupar.
6:28
Tudo o que você precisa fazer é certificar-se de que está conectado corretamente e depois esquecê-lo.
6:32
Ao contrário de muitos produtos existentes, o cancelamento de eco Q-Sys é
6:37
incluído automaticamente como parte do software Designer - não há hardware adicional para
6:40
configurar e nenhuma taxa adicional. É simplesmente parte do pacote Q-Sys. Agora, na próxima
6:45
seção, veremos como configurá-lo em conjunto com o componente Softphone para criar um sistema
6:50
de teleconferência. Assim, sinta-se à vontade para seguir em frente sempre que estiver pronto.