Pode-se notar hoje em dia dois movimentos muito fortes no áudio. Por um lado, o conceito muito difundido de que "quanto mais alta a sample rate, melhor", e, de outro, a ideia de que as gravações em vinil e em fita são mais "fiéis". Independentemente da veracidade destas afirmações, sobre as quais falaremos mais adiante, existe, antes de tudo, uma questão que precisa muito ser abordada. Maior do que qualquer mito técnico, existe não só uma lenda urbana, mas uma verdadeira crença quase religiosa na dissociação entre o caráter "matemático e físico" e o "emocional e espiritual" da música e do áudio. Toda vez que qualquer assunto técnico vem à tona, lá vêm os "românticos" a criticar a frieza dos números e defender o lado poético da coisa.
É óbvio que o áudio atua profunda e decisivamente no cérebro humano. Desde nosso lado mais primitivo, pré-histórico mesmo, que se beneficiou de nossa habilidade de distinguir sons repentinos em meio a ruídos de fundo de nível mais ou menos constante (costumo sempre citar a situação hipotética em que nosso ancestral hominídeo é salvo de um ataque de urso por conseguir distinguir o som de um graveto quebrando e determinar sua direção, mesmo estando à margem de um rio barulhento), até os setores mais evoluídos, que conseguem captar a beleza de estruturas melódicas e harmônicas de uma sinfonia. Agora, pressupor que isso conflita com qualquer análise científica é, no mínimo, ofender séculos de ciência muito bem feita.
Aproveitando o gancho da música clássica, já ouvi gente dizendo coisas do tipo "como será possível descrever matematicamente uma obra de Bach?". Esta pessoa esquece que a afinação temperada - usada por Bach em O Cravo Bem Temperado - nada mais é do que a matemática e a física a serviço do pragmatismo musical. E se levarmos nosso raciocínio bem mais para trás, teremos as primeiras investigações de Pitágoras (há meros 2.500 anos) quanto à questão das consonâncias e dissonâncias. Tudo ciência.
Talvez o problema central esteja nesta falsa ideia de que a ciência é algo que não contempla o lado mais espiritual das coisas. Como cita um enfático leitor em comentário no meu blog: "Fico me perguntando por que ninguém tenta explicar nossas emoções de forma matemática". A ele, o que respondi é que isto não é verdade de modo algum. Além do fato de existirem já esforços no sentido de se descrever matemática e fisicamente o processo emocional humano (já se consegue mapear as emoções através de tomógrafos, por exemplo), já até começamos a esboçar alguns pequenos resultados nesta direção, como nas já existentes cadeiras de roda movidas por comandos mentais.
É fundamental que a gente não confunda a complexidade de algo com a nossa incapacidade absoluta de entendermos ou descrevermos e estudarmos cientificamente. Como diria Arthur Clarke, "qualquer tecnologia suficientemente avançada é indistinguível de magia". Vai tentar explicar um iPhone para um pigmeu que nunca teve contato com nossa civilização... Então, só porque algo é ainda complicado demais para a gente entender ou descrever não quer dizer que seja impossível para sempre.
Alguns podem argumentar que, por exemplo, nossos modelos científicos são pobres. E, de fato, preciso concordar. Você pode passar horas alinhando a sala de um estúdio apenas pelo gráfico de um analisador de espectro, mas enquanto não ouvir efetivamente a sala, não há como saber se o resultado está agradável. Este não é um problema de impossibilidade, mas de grau de complexidade, tal como vimos acima. Para lidar com coisas muito complexas, o que a gente tem feito desde que inventamos a roda até colocar 32 satélites a 2 mil km de distância da Terra, que nos permitem achar nossa posição com um GPS comprado por menos de R$ 300, o processo sempre foi mais ou menos o mesmo: a gente quebra algo bem complicado em pedaços menores, para que possamos descrevê-los com precisão, e a partir daí montamos nossa tecnologia. Afinal, se ideologicamente a ciência busca o entendimento e a descrição da realidade, em termos de engenharia só é importante que as descrições científicas "funcionem" (a descrição do "real" reside em outro campo). Pergunte a um doutor em física quântica se ela é a "verdade" e provavelmente ele vai responder que isso ele não sabe, mas sabe que as equações que a constituem funcionam.
Sendo assim, por mais que um sinal de 1 kHz ou um ruído rosa sejam uma pálida amostra do que a maravilha da informação musical pode atingir, isto não quer dizer que a estejamos resumindo através deste tipo de simplificação. Este é apenas um jeito simples de lidar com coisas complexas para que seja possível trabalharmos com elas. Imaginem se para alinhar um PA precisássemos ficar esperando a chegada de um superaudiófilo para julgar se o "calor", a "envolvência" e a "expressividade" do ambiente da micareta estão ok. Por outro lado, ainda é, sem dúvida, necessária uma boa dose de avaliação intelectual do técnico de PA, que vai além dos meros testes que os aparelhos fornecem. Escolher as tintas e os pincéis é apenas uma etapa para se conseguir uma bela pintura.
A ATMOSFERA DO VINIL
Tomemos um caso bem simples. Em um dos posts mais polêmicos de meu blog, eu fazia uma comparação técnica entre LPs e CDs, e este foi um caso emblemático nesta questão de que tratamos. No texto, eu, antes de mais nada, deixo claro que discuto apenas aspectos técnicos, pois não acho que contribua em nada, pelo menos neste tipo de discussão, dar uma mera opinião. Dizer ao leitor o que eu gosto ou prefiro não o ajudará em nada, mas fornecer-lhe dados palpáveis e verídicos pode ser uma ferramenta bem útil.
Um dos problemas que levantei no tal post foi o da velocidade angular constante do LP versus velocidade linear constante do CD. Esta é uma questão importantíssima na comparação destas mídias, mas confesso que nunca vi ninguém levantá-la.
Explicando, um LP gira a uma velocidade constante de 33,333333 rotações por minuto, e esta é sua chamada "velocidade angular". A agulha lê suas informações de forma linear, em círculos concêntricos, a partir da borda da "bolacha", caminhando em direção ao centro. Fazendo um paralelo, alguém já reparou que, numa corrida de 400 metros rasos, quanto mais interna a raia, mais para trás o corredor larga? Isto lhe dá uma desvantagem? É claro que esta diferença entre os corredores visa compensar o fato de que quem faz a curva por fora corre uma distância maior do que o que está por dentro. No caso do LP acontece algo semelhante. Como a velocidade de rotação é constante, a velocidade linear da borda da bolacha é maior do que perto do centro. E como o disco leva sempre os mesmos 1,8 segundos para dar uma volta, o início da primeira faixa percorre uma distância bem maior que o final da última faixa.
Vejamos um exemplo. Tomemos o LP Time Further Out, do The Dave Brubeck Quartet, lançado em agosto de 1961 (curiosamente, o mês e ano em que nasci), que ainda tenho em minha coleção de vinis "sagrados". O início da primeira música do lado 1, It's a Raggy Waltz, está a 14,5 cm de distância do centro do disco, e o final da última faixa deste lado, Far More Blue, está a 6,5 cm. Poupando os leitores do detalhe do cálculo (inserir qualquer conta com o número Pi aqui não seria muito amigável), para tocar o primeiro 1,8 segundo de música a agulha teve a felicidade de percorrer uns 91 cm de vinil. Quase um metro para uns dois compassos.
Pois bem. Para executar a última volta do LP no final de Far More Blue, a agulha teve apenas 41 cm. Ou seja, para o mesmo 1,8 segundo de música, menos da metade do vinil. O resultado disso é que a qualidade do áudio é substancialmente menor perto do centro do que perto da borda. Mal comparando, seria diminuir a sample rate de uma gravação digital pela metade (para os mais céticos, uma senóide de 1 kHz na borda tem um comprimento físico de 0,5 mm, e, no centro, 0,2 mm).
Isto é algo frio e técnico que transcende qualquer necessidade de recorrermos a aspectos mais nobres da sensibilidade humana. Antigamente, quando a gente definia a ordem das músicas de um LP, obviamente havia a preocupação estética, mas o segundo fator mais importante era justamente quais músicas mereciam mais qualidade e quais as que podiam se contentar com menos. E então havia o dilema de que a segunda melhor música em termos de qualidade técnica seria a primeira do lado B, mas, em compensação, o ouvinte seria obrigado a virar o disco após ouvir a primeira do lado A.
No caso do CD, há duas diferenças importantes. A primeira não é tão relevante, que é o fato dele ser lido do centro para a borda, ao contrário do LP. Mas a segunda é fundamental. No CD, a velocidade angular varia no sentido de que a velocidade linear de leitura seja constante. O CD roda mais rápido nas primeiras músicas do que nas últimas. Isso garante que, pelo menos neste aspecto, a qualidade da decodificação será a mesma ao longo de toda a audição. Somando a isso o fato de que não é preciso "virar" o CD, nossa única preocupação na hora de definir a ordem das músicas é a artística.
Voltando ao nosso ponto de discussão, depois que eu apresentei essa e outras importantes desvantagens do LP, choveram comentários falando da impossibilidade do CD captar a "atmosfera" que o LP capta, e coisas do gênero. Percebem a "mudança de foco"? Enquanto um medidor de distorção nos daria uma ideia bem precisa do prejuízo sofrido na última música, um "atmosferômetro" é algo que ainda não existe. O problema é focar no que se mede. E pra quem deseja argumentar que o cérebro é o nosso atmosferômetro, o mínimo que posso dizer é que todos precisaríamos receber uma calibragem cerebral do Inmetro para que pudéssemos comparar nossas opiniões.
Pedindo licença aos leitores para emitir, agora sim, minha opinião, acho um absurdo eu ter que ouvir Far More Blue com a metade da qualidade de It's a Raggy Waltz. Fim da opinião.
O MITO DA ESCADINHA
Fourier
Vejamos um caso muito interessante e que parece ser o assunto do momento no meio do áudio profissional. Mas, antes disso, permita-me apresentar-lhes uma entidade que será a base de toda a nossa discussão: a senóide.
Esta é a onda mais simples da natureza, e pode ser conseguida no Pro Tools através do plug-in Signal Generator. Em outros softwares sempre há um jeito de gerá-la. É importantíssima, como veremos, mas sozinha dá um som nada interessante. Experimente e depois volte aqui.
Prosseguindo, para fornecer base à nossa conversa, precisamos, antes de qualquer coisa, dar um pulinho rápido ao início do século 19, quando Fourier fazia suas pesquisas (curiosamente, ele estava preocupado com propagação de calor, e não com música, embora provavelmente gostasse de Beethoven, que "bombava" nesta época). Pois bem, Fourier demonstrou que uma onda periódica (aquela cuja "forma" fica se repetindo, como é o caso idealizado de uma nota emitida por um instrumento, se desconsiderarmos seu attack e release) qualquer podia ser entendida e definida como a soma de uma série (provavelmente infinita) de senóides básicas, como a que vemos na figura. Isto representou uma senhora simplificação para um problemaço.
Se a gente olha no Pro Tools um trecho de um áudio, vai ver uma onda bem complicada. A partir de agora a gente pode analisar esta onda não a partir deste desenho complicado, mas a partir das diversas senóides simples que na verdade a compõem. A coisa vai mais longe. Se a onda é periódica e tem uma fundamental de, digamos, 100 Hz, estas senóides que a compõem são de frequências múltiplas inteiras deste valor. Ou seja, uma onda complicada cuja frequência fundamental é 100 Hz é a soma de uma senóide de 100 Hz mais uma de 200 Hz mais uma de 300 Hz mais uma de 400 Hz, e assim por diante. Sinistro! Chamamos, em música, a primeira frequência de "fundamental" e as demais são os seus "harmônicos".
Mas se é assim, o que faz as ondas de 100 Hz do baixo e da tuba soarem diferentes? Bem, o que ainda não dissemos é que a intensidade de cada uma destas senóides - chamadas de "harmônicos" - é que determina o formato da onda. Para cada harmônico temos um valor diferente, que pode, inclusive, ser zero.
Resumindo, graças à mania dos cientistas de pegar um problema bem difícil e simplificar, conseguimos descobrir que ondas bem complexas podem ser entendidas como soma das ondas mais simples que existem.
Nyquist
A esta altura, todo mundo com pelo menos um pouco de interesse na área técnica (e o que alguém que não tem estaria fazendo lendo este texto até aqui?) já tem uma ideia do que é sample rate e o tal de Teorema de Nyquist. Bom, há várias décadas, muito antes de existir o áudio digital, o pessoal da Bell Laboratories trabalhava com comunicações, e Nyquist, ainda nos anos 1930, foi um pioneiro na área de amostragem de sinais. Seu trabalho foi complementado por outros, mais notadamente Shannon, que diz, explicitamente: "Se uma função x(t) não contém frequências acima de B Hz, ela é completamente determinada se dermos as suas coordenadas em uma série de pontos espaçados de 1/2B segundos."
Versão em "português": imaginemos a simplificação em que temos uma bela senóide de 1000 Hz. Se anotarmos o valor de sua amplitude 2000 vezes a cada segundo, estaremos determinando exatamente esta onda, pois nesta função simples não temos nenhuma frequência acima de 1000 Hz.
Vejam que interessante: ele afirma (e prova - esse pessoal da comunidade científica faz uma certa questão disso) que se eu anotar uma série de números como acima, serei capaz, em outra oportunidade, de recriar esta onda exatamente como ela era apenas através destes números. Ninguém na comunidade científica reclamou que ele estava transformando a senóide em escadinha (voltaremos a isto mais adiante) e que por isso ela estaria muito longe da realidade.
Mas reparem que o texto diz que deve haver uma frequência máxima (B) na tal função para que se possa estabelecer a frequência de amostragem correta. Assim, se temos uma onda mais complexa e admitimos que ela tem uma frequência máxima, amostrá-la no dobro desta frequência capta todas as informações a respeito de seu conteúdo harmônico.
Pois bem, a gente não precisa se preocupar em "acreditar" em Nyquist e Shannon, já que desde 1949 ninguém os desmentiu, então vamos admitir que o teorema é verdadeiro (aliás, qualquer coisa em matemática que tenha o nome de "teorema" já implica em ser uma verdade comprovada e comprovável; para um exemplo interessante, vale pesquisar a questão da Conjectura de Fermat, que só virou teorema após 358 anos, quando finalmente foi provado).
Assim sendo, se a gente conseguir garantir (na medida do possível) que haja uma frequência máxima em um sinal de áudio a ser digitalizado, amostrá-lo no dobro desta frequência nos dará fidelidade absoluta com relação aos harmônicos que o constituem. E o tal sinal nem precisa ser periódico, na verdade. Mais adiante veremos como conseguimos esta garantia.
Por enquanto, vejamos a questão da "escadinha". Outro dia vi um importante cantor dando uma entrevista. Nela, ele disse que preferia o vinil, pois o digital transformava o áudio numa escadinha, e que isso era antinatural. Perdeu uma excelente oportunidade de ficar em silêncio.
Vejamos por que.
CONSTRUINDO E DESCONSTRUINDO A ESCADINHA
Se a gente tem um sinal original senoidal, por exemplo, entrando em um equipamento ou processo, se a onda sai com a sua forma (mesmo que muito levemente) alterada, significa que ela sofreu uma distorção, e essa mudança na forma da onda na verdade foi o resultado de termos acrescentado harmônicos a ela (ou de termos alterado a intensidade dos seus harmônicos originais).
O processo de amostragem, em um dado momento, realmente transforma o sinal numa "escadinha", que tem uma certa semelhança com a onda original porque tem a mesma frequência fundamental. Só que isto se dá internamente. Antes do sinal ser mandado para a saída, ele passa por um filtro que elimina todos os harmônicos acima daquela tal frequência máxima B que vimos anteriormente. Assim, como a diferença entre a escadinha e a onda original eram os harmônicos extras que entraram para montar os "degraus" da escada, se a gente manda estes harmônicos embora, o que temos é justamente a onda original. Apesar de ter havido a tal escada, não era, de modo nenhum, antinatural.
Como exemplo, temos as figuras presentes nesta página. Na do alto na tela temos uma onda quadrada com frequência de 100 Hz. Este é o pior caso de escadinha possível, em que a senóide original foi toda transformada numa grande escada. Na segunda, aplicamos um filtro passa-baixas (filtro de agudos) em 200 Hz, eliminando os harmônicos acima deste valor. O resultado é justamente a senóide original de 100 Hz. Para os que quiserem verificar, estou disponibilizando uma sessão de Pro Tools que demonstra isso em http://tinyurl.com/sessao-protools.
Repare que o som da onda quadrada tem um "zumbido" e que a senóide fundamental tem um som puro. O conjunto dos harmônicos acima dos 100 Hz é o responsável pelo zumbido (outra coisa que se pode notar ao lado do "length" lá em cima no contador de samples é que uma oscilação completa tem exatamente os 441 samples que uma onda de 100 Hz tem por segundo, pois cada oscilação desta frequência tem 1 centésimo de segundo). A conclusão a que chegamos é que alegar que o problema do digital é a escadinha não procede.
Mês que vem prosseguiremos falando sobre mitos, focando justamente no que está mais na moda hoje em dia: o áudio de "alta definição".
Fábio Henriques é engenheiro eletrônico e de gravação e autor dos Guias de Mixagem 1,2 e 3, lançados pela editora Música & Tecnologia. É responsável pelos produtos da gravadora canção Nova, onde atua como engenheiro de gravação e mixagem e produtor musical. www.facebook.com/GuiaDeMixagem.