Lugar da Verdade
Às vezes o problema pode estar justo onde a gente não ouve
Pois é... É claro que de nada adianta saber toda a teoria do mundo e não ter bom gosto musical. Também é fato que existem várias situações em que "a medicina não explica a cura", ou seja, tinha tudo pra dar errado e saiu uma grande mix (ou gravação, ou masterização). Mas, prefiro não contar com a sorte, apenas, se ela vier, ótimo.
Sim, muita gente sem nenhuma base técnica ou teórica chega a brilhantes resultados. Porém, algumas coisas a gente tem que saber, não tem saída. Já estamos cansados de saber que o famoso CD Audio (Red Book) comporta áudio no formato 44.1Khz e 16 bits. Mas parece que ainda não entendemos perfeitamente por que gravamos e mixamos com mais bits do que isso... Parece automático... mas não perfeitamente entendido.
Ainda é comum eu receber projetos para mixagem ou masterização que foram começados em 16 bits! Mês passado, algo pior do que isso aconteceu: gravei, mixei e masterizei um projeto, que seria enviado a uma produtora, pra que a trilha fosse lá encaixada nos diálogos do programa. E eles me solicitaram que a master da trilha fosse em 16 bits! Não faz o menor sentido. Vejamos por quê.
Pra começar, mesmo que o formato do arquivo de áudio ou da sessão seja em 16 bits, o processamento não é. Ou seja, quando inserimos um plug-in, mexemos no fader, no pan, qualquer tipo de processamento normalmente ocorre com uma resolução mais densa do que 16 bits. E então, o áudio deixa de ser de 16 bits e, para voltar a ser ouvido em 16 bits, esses bits excedentes têm que ser truncados (cortados), ou ditherizados (recalculados para caberem em 16bits).
O que eu quero dizer com recalculados? Lembremos que, enquanto no universo analógico o sinal é contínuo, em domínio digital o áudio é codificado em steps ou degraus. Este processo é chamado de quantização. Existem 65.536 degraus de volume em uma palavra digital de 16 bits (8 elevado a 16). Em uma palavra de 24 bits, já existem 16.777.216 possíveis valores ou degraus (8 elevado a 24).
Partindo do princípio de que essa diferença está presente justamente nos volumes mais baixos, áudio no formato de 24 bits tem consideravelmente mais resolução nos detalhes em baixos volumes. Curioso, não? Quando pensamos na diferença de 16 pra 24, não soa tão radical... Mas de 65 mil e pouco para 16 milhões, é bastante diferença! Então meu Deus... por que gravar em 16bits? "Ah, mas o CD não é em 16 bits mesmo?" É. Mas é MUITO mais inteligente carregar o máximo de qualidade, dinâmica (bits) e resposta de frequência (sample rate) até o último estágio da master, quando então, ditherizamos para 16 bits. E então, o que é dither ?
Quando um sinal é convertido para digital, seja de analógico pra digital ou de digital em alta bitagem pra digital com menos bits, ocorre um fenômeno chamado "distorção de quantização". Isso pode acarretar em hamônicos, sub-harmônicos, aliás, intermodulação e vários tipos de danos ao sinal original. Para solucionar esse efeito colateral, ou melhor, defeito, o processo de dither adiciona um ruído randômico em baixíssimo volume, em troca dos problemas mencionados acima. Não, o ruído não serve para mascarar a distorção em baixos volumes, ele realmente a elimina.
Criemos uma situação experimental pra entender o dither: imaginemos um conversor de analógico pra digital bem simples, cujo LSB (least significant bit), ou seja, sua menor resolução seja de 1 volt. Nesse conversor, uma fonte analógica alimentada entre -0.5 e +0.5 volts gera na saída uma palavra digital 0. E uma fonte entre +0.5 e 1.5 volts geram uma palalvra digital 1. Se, sem o uso de dither, aplicamos uma fonte analógica contínua de 0.25 volts, teremos na saída digital do conversor uma seqüência de zeros. Basta lembrar que QUALQUER sinal entre -0.5 e +0.5 volts produzirá um 0 digital (neste exemplo). Ou seja, qualquer informação menor do que o LSB de 1 volt é totalmente perdida, vira 0.
Agora, paramos com o sinal de 0.25 volts e aplicamos dither na forma de um sinal randômico (ruído) centrado em 0 volts. Os picos desse sinal tocam eventualmente e aleatoriamente o LSB de 1 volt do conversor. A saída digital terá então uma série de pequenos valores variados, porem a MÉDIA desses valores será ZERO. Apliquemos então, novamente, nosso sinal baixinho de 0.25 volts, com o dither ligado. Esses dois sinais (ruído do dither + sinal baixo de 0.25 volts) se somam. Então, para cada amostra, o valor randômico do dither se soma aos 0.25 volts de sinal de entrada.
O resultado é que a saída continuará de vários sinais aleatórios bem baixos, novamente, mas, dessa vez, a MÉDIA será de... 0.25 volts! Então, com o dither, conseguimos manter a informação do sinal de 0.25 volts, ainda que afundada em ruído, que antes, sem ele, era completamente perdida. Podemos dizer que nossa resolução aumentou, uma vez que o sinal "modula o ruído". Então, não só passa a ser possível gravar áudio de volume menor do que o mínimo teoricamente aceitável pela resolução de uma dada bitagem como o dither minimiza os degraus antes percebidos.
Sim, sensibilidade é praticamente tudo na música. Este não foi dos artigos mais românticos, mas algum conhecimento técnico pode e vai ajudar a tirar o máximo do equipamento. Bons sons!
______________
Enrico De Paoli é engenheiro da música. Grava e, em seu Incrivel Mundo, mixa e masteriza discos e dvds. Para este artigo, usou como fonte de consulta o livro Mastering Audio, de Bob Katz. Carta para: cartas@enricodepaoli.com