Ouvindo com clareza
Qualquer um sabe que há casas de espetáculos com boa acústica, mas há outras onde nem vale a pena tentar assistir a um show. Na esmagadora maioria das vezes, não há sistema de sonorização capaz de resolver estes casos. Se você não entende o que o artista diz, se as notas se misturam numa cacofonia intolerável, se a música provoca o stress ao invés de aliviá-lo, pode ter certeza: o local tem problemas de inteligibilidade.
Neste artigo, vamos explicar como surgem os problemas de inteligibilidade e como são eles avaliados e medidos.
Fundamentos da acústica
Sabemos que, em ambientes fechados e mesmo em muitos locais abertos, além das ondas que trafegam diretamente da fonte sonora até nossos ouvidos, chega uma quantidade de outras ondas que pode variar desde umas poucas reflexões até uma quase infinidade delas.
Sabemos também que essas reflexões do som nas diversas superfícies que circundam o ambiente podem acrescentar imensa beleza ao som, ou torná-lo simplesmente insuportável. Os fatores que regem essa brutal diferença podem ser estudados de forma científica, e tratados desta mesma maneira, possibilitando a obtenção de resultados muito melhores que aqueles conseguidos por empirismo, resultando muitas vezes em economia de recursos (grana) e, sempre, em público e clientes satisfeitos.
Não acho bom nos determos muito nos detalhes da origem das reflexões. Isto já tem sido abordado em vários artigos em M&T. Iremos objetivamente ao estudo das conseqüências.
O que o ouvinte recebe
O que chega aos ouvidos do público é formado pelo som direto (que viaja em linha reta entre fonte e destino) e sons refletidos. Os sons refletidos podem ser separados em três grupos principais:
Early Reflections (reflexões primárias): primeiras reflexões sofridas pelo som antes de se estabelecer a reverberação. São ecos bem definidos, pois não sofreram ainda difusão, mas sua percepção isolada é difícil por ocorrerem logo após o som direto.
Reverberação: uma quase infinidade de reflexões difusas, sem direção definida (as reflexões vêm de todo o ambiente), e muito próximas entre si, dando o efeito de "prolongamento" do som. A reverberação começa sempre alguns milissegundos depois do som direto; este tempo é chamado Pre-delay.
Late Reflections (reflexões tardias): Ecos definidos, que sobressaem já durante a reverberação. Em acústica arquitetônica, são considerados erro de projeto.
Veja na figura 1 um diagrama de nível x tempo, mostrando os vários eventos sonoros.
Os primeiros momentos
A energia sonora que chega ao ouvinte antes de ter-se passado o primeiro décimo de segundo tem papel decisivo na qualidade do som percebido. Esta energia é composta pelas primeiras reflexões (de grande intensidade) sofridas pelo som logo após deixar a fonte, portanto se soma ao som direto com muita importância.
Três intervalos de tempo são comumente considerados:
Até 7ms de retardo: som direto, "presença"
Até 50ms de retardo: definição
Até 80ms de retardo: clareza
C7: o som direto
Os primeiros 7ms são percebidos pelo ouvido como um som único. O ouvido só começa a perceber a existência de dois sons distintos a partir deste ponto, primeiro em forma de Efeito Haas , depois em forma de sons separados mesmo. Portanto, a massa de som ouvida até os primeiros 7ms é entendida como som original, embora evidentemente possa conter reflexões. A razão entre esta energia inicial e o restante da energia acústica indica o quanto o som direto se destaca da massa de som decorrente da acústica do ambiente.
A proporção expressa em dB entre a energia nos primeiros 7 milissegundos e o restante da energia gerada pelo impulso fornece o índice denominado C7, calculado por:
onde p, é a pressão sonora média .
Valores de mais de -15dB para C7 garantem um bom destaque para o som direto.
C50: definição
O índice chamado
Definição ou C50 é calculado da mesma forma que C7, porém usando-se um período inicial de 50 milissegundos:
Este índice é utilizado para definir a inteligibilidade da voz falada. Para uma sala de acústica normal, um valor acima de 0dB assegura boa inteligibilidade da fala. Para salas reverberantes, valores superiores a -5dB são aceitáveis.
C80: clareza
O último índice desta coleção, C80, se refere evidentemente à energia relativa aos primeiros 80ms de som:
O C80 é utilizado para avaliar a qualidade sonora com música.
Para instrumentos de sopro em notas lentas e para música de órgão, C80 de -2dB a +2dB é ideal.
Valores entre 0dB e +4dB são ideais para instrumentos de cordas (violino, viola, etc.). São o valor recomendado para a música sinfônica, corais e também para igrejas tradicionais.
Para música pop, jazz e música gospel moderna, valores entre +2dB e +6dB são recomenda-dos. Este é o melhor índice para instrumentos de cordas puxadas, como o violão.
Para rock e músicas com percussão forte e notas rápidas, os valores ideais ficam entre +4dB e +8dB.
Por exemplo, para uma igreja onde se toca e canta música gospel e também rock de conteúdo religioso, de +4dB a +6dB seriam a melhor escolha.
Medindo e calculando C7, C50 e C80
Para analisar estas características, é preciso um instrumento de medida capaz de gravar o som de um impulso dentro do ambiente em estudo, e permitir sua visualização posterior em um gráfico amplitude × tempo, além de calcular as integrais. O conhecido software SMAART Pro Analysis permite o cálculo quase direto deste índice.
Para a avaliação, gera-se um impulso sonoro dentro do ambiente. Este impulso é um som de curta duração e grande intensidade, semelhante a um tiro de pólvora seca (o que aliás, ainda é usado como alternativa a amplificadores e caixas acústicas). "Estalinhos" juninos também podem ser usados, tomando-se cuidado para não saturar o microfone com estas explosões.
Este impulso é gravado no formato wav, e pode então ser analisado no SMAART ou outro software similar. Para estes testes, o sinal deve ser filtrado com largura de banda de uma oitava em 2kHz, freqüência mais importante para a inteligibilidade da voz humana.
Perda de Articulação
O primeiro método de avaliação da inteligibilidade não usava nenhum equipamento eletrônico, mas ainda assim dava resultados absolutamente reais. Um grupo de ouvintes se sentava na platéia, e um locutor profissional pronunciava palavras monossilábicas sem sentido, como "tzi", "ptô", "maf", etc.. Os observadores tinham, então, que anotar em papel o que tinham entendido. Como as "palavras" não faziam sentido algum, era impossível adivinhar alguma sílaba perdida - tinham que entender mesmo.
Para salas de acústica muito boa, as sílabas com consoantes (b, c, d, etc.) erradamente ano-tadas (chamadas a perda de articulação) não chegavam a 5% do total. Para salas toleráveis, a perda de articulação era entre 5% e 10%. Acima de 10%, a acústica era muito ruim.
Um tipo de previsão da inteligibilidade baseado apenas no tempo de reverberação e nas di-mensões da sala foi desenvolvido por Peutz e Klein, a partir do antigo método de avaliação. Sabendo-se o tempo de reverberação (a 2kHz), as dimensões do ambiente, a diretividade da fonte sonora e a distância entre esta e o ouvinte, calculava-se a perda de articulação:
%, onde ALcons é a perda de articulação, D é a distância entre fonte sonora e ouvinte, RT60 é o tempo de reverberação a 2kHz, Q é a diretividade da fonte e V é o volume da sala em m³.
Exemplo n° 1: uma sala tem 5000m³ de volume e seu tempo de reverberação a 2kHz é de 2,5 segundos. A fonte sonora tem um Q de 8, e fica a 16 metros do ouvinte. Qual será a perda de articulação nesta situação?
Ou seja, a inteligibilidade é regular.
Exemplo n° 2: para a sala do exemplo anterior, qual deveria ser o Q da fonte sonora para uma ótima inteligibilidade?
Invertendo a fórmula, vem:
Ou seja, um valor de Q igual ou superior a 12,8 dará bom resultado.
Exemplo n° 3: ainda para a mesma sala, se quisermos manter a diretividade da fonte sonora em Q=8, para quanto será necessário reduzir o tempo de reverberação?
Invertendo a fórmula, vem:
Ou seja, com um tempo de reverberação igual ou menor que 1,98 segundo, a inteligibilidade será ótima usando-se a fonte sonora com Q igual a 8.
O som da inteligibilidade - uma discussão
À primeira vista, tem-se a impressão de que aumentando-se a diretividade (exemplo n° 2) ou baixando-se o tempo de reverberação (exemplo n° 3), a sonoridade da fonte sonora na sala será a mesma, já que a perda de articulação será de 5% ou menor.
Isto não é verdade: no primeiro caso, teremos uma reverberação longa com volume baixo de som; no segundo caso, teremos uma reverberação com volume alto, mas com menor duração.
Evidentemente, a sonoridade da sala é bem diferente em cada caso. Isto faz com que o índice C7 mude bastante, ficando maior (melhor) com o aumento da diretividade. Por outro lado, o índice C80, que é aumentado pela amplitude inicial da reverberação, ficará mais alto no exemplo n° 3.
Portanto, usar apenas a fórmula de ALcons não é o bastante para garantir uma excelente inteli-gibilidade. É preciso, ao optar por modificar a diretividade e/ou o tempo de reverberação, optar por uma ou outra solução em função do tipo de uso da sala e do C80 recomendado.
Uma experiência
Usando o software simulador de ambientes Voxengo Impulse Modeler, desenhamos uma sala fictícia, de formato bastante irregular a fim de produzir boa difusão do som. Nesta sala, aplica-remos os métodos estudados nos exemplos anteriores. Veja a figura 2.
A fonte sonora tem um ângulo de cobertura de aproximadamente 90°. A parte da sala mais próxima da fonte é revestida em material difusor (verde), e a parte mais perto do ouvinte rece-be material absorvedor (vermelho).
Vemos na figura 3 o diagrama amplitude × tempo desta sala, com C7 de 0,12dB e ALcons de . 3,76%. Obtivemos para C80 o valor de +3,3dB (não mostrado).
O som correspondente a esta simulação está disponível em nosso site www.musitec.com.br, na página de downloads, com o nome Intelig01.mp3.
Agora, vamos aumentar a diretividade da fonte sonora, reduzindo seu ângulo de cobertura para cerca de 30°. Observe que o nível da reverberação baixou em relação ao som direto, embora o tempo tenha se mantido o mesmo. Com esta modificação, C7 subiu para 4,6dB, C80 foi para 5,2dB e a perda de articulação caiu para 2,5%.
Note que C7 subiu bastante, indicando maior "presença"; C80 subiu pouco, e a perda de articulação se reduziu. Vide figura 4.
O som correspondente a esta simulação também está disponível em nosso site, com o nome Intelig02.mp3.
Mantendo a diretividade original da fonte sonora em 90°, mas aumentando-se a área de ab-sorção na sala (figura 5), obtemos um resultado diferente, como mostra a figura 6.
O tempo de reverberação baixou de 1,28s para 0,71s, e o C7 caiu para -5,26dB. O C80 foi para 5,32dB e a perda de articulação para 2,85 (bastante semelhantes aos obtidos com o aumento da diretividade). Ou seja, a inteligibilidade e a clareza se aproximaram das obtidas com a fonte mais diretiva, mas a "presença" se tornou muito pior.
O som correspondente a esta simulação também está disponível em nosso site, com o nome Intelig03.mp3.
Inteligibilidade × pressão sonora
Da fórmula da ALcons, fica-se com a impressão de que quanto mais se aumenta a diretividade e/ou se reduz a reverberação, melhor. E, de fato, a inteligibilidade calculada fica cada vez melhor.
No entanto, outra questão deve ser considerada: a pressão sonora para o público distante da fonte sonora será suficiente?
Em uma sala reverberante, até uma certa distância predomina em intensidade o som direto da fonte; dessa distância em diante, predomina a pressão sonora da reverberação. Quando pre-domina o som direto, a pressão sonora cai com a distância com sistemas line array, e com o quadrado da distância em sistemas convencionais. Esta recião é denominada campo livre.
A pressão sonora da reverberação não varia com a distância - é teoricamente a mesma em toda a sala. Esta região e chamada campo reverberante.
A distância onde se passa do campo livre para o campo reverberante é denominada distância crítica, e é calculada pela fórmula:
Exemplo: uma sala de 6400m³ tem tempo de reverberação igual a 3 segundos, e é sonorizada com uma fonte convencional de Q igual a 12. Qual a distância crítica?
Em outras palavras, a partir de 9,12 metros de distância da fonte sonora, o nível de pressão sonora se mantém teoricamente constante.
Para uma audição satisfatória, é preciso que duas condições sejam satisfeitas:
A perda de articulação não deve exceder 5% para uma ótima qualidade;
Entre o ouvinte mais próximo e o mais afastado da fonte sonora, o nível de pressão sonora (SPL) não deve cair mais de 10dB.
Ora, se aumentarmos excessivamente a diretividade ou reduzirmos demais a reverberação, a distância crítica aumentará muito também. Neste caso, o som irá muito longe dentro da sala antes de atingir o campo reverberante e se tornar constante. Neste caminho, pode ser que a queda seja de mais de 10dB entre o ouvinte mais próximo e o mais longe da fonte sonora.
Em conseqüência, embora a perda de articulação longe da fonte se mantenha pequena (o que é bom), o volume de som terá caído demais e o ouvinte não terá pressão sonora suficiente!
Onde começa um projeto acústico
Para que um projeto de acústica e sonorização seja bem sucedido, vamos estabelecer um método.
Para começar, escolha o Q da fonte sonora capaz de garantir que, para o ouvinte mais distante, a perda de articulação ALcons não ultrapasse o limite desejado (5% para excelente inteligibilidade, etc.).
Em seguida, calcule a diferença de SPL entre o espectador mais próximo e o mais afastado - essa diferença deve ser menos de 10dB. Use, para isto, a fórmula da distância crítica (o SPL cai até a DC com a distância e a partir dali se mantém constante) ou outra fórmula mais elaborada, como a de Hopkins-Stryker. Ou use, se po$$ível, um software de simulação eletroacústica como o EASE, por exemplo.
E... se não der?
Em alguns ambientes, não se consegue satisfazer às duas condições. Este é o caso comum quando o ouvinte mais próximo está "colado" na fonte sonora e a sala é enorme. Nesta situação, é necessário usar um sistema auxiliar de caixas - as famosas "caixas de delay".
Atualmente quase todos os sistemas de sonorização são do tipo suspenso (flying), o que ga-rante que ninguém fica excessivamente próximo da fonte sonora.
Outro recurso muito usado é usar caixas de diferentes Q's: as caixas inferiores, próximas do público, têm baixo Q e operam a baixo volume, atingindo o público próximo; as caixas superiores do conjunto são de Q mais alto e operam a níveis altos. Estas não atingem o público próximo, que fica fora de seu eixo, mas seu "tiro" atinge com facilidade os espectadores mais distantes.
Quando você for ao próximo show, procure ouvir o som perto e longe do palco. Observe se a variação de volume de som é exagerada; verifique também se, no fundo da platéia, ainda é possível entender as letras das canções e a fala do artista. Espero que você tenha sorte!
Sólon do Valle, editor técnico de M&T e professor do IATEC, é projetista e consultor em áudio e acústica.