A última Macworld… no TriploExpresso

[ad#ad-2] Como é habitual, regular, e normalmente imprevisível o Triplo Expresso #9 dedicado aos utilizadores Mac que ouviram, reviram e choraram na última MacWorld da história com Apple (pelo menos história próxima). Hoje juntou-se a nós o José Canelas da EmptyFactory para nos dar uma visão da Macworld pelo lado dos developers e de alguém que acompanha o mundo Apple há mais de 14 anos.

O qualidade áudio do Triplo Expresso

Uma das maiores dificuldades de gravar um podcast à distância via skype é conseguir consistência entre os níveis de input de áudio dos diversos intervenientes. Se quando estamos a gravar apenas uma pessoa o problema não é muito grave porque facilmente se separam os canais de saída e entrada e se podem processar os dois em separado, quando, como no Triplo Expresso, somos 3, eventualmente 4 ou 5 quando temos convidados especiais, o problema é sobremaneira grave. Infelizmente o Skype não permite “ainda” separar os diversos streams de aúdio duma conversa fazendo automaticamente o mix de todos os canais de entrada. [ad#ad-1] Embora possamos continuar a gravar as nossa versão local, o que recebemos do skype é já um mix dos outros intervenientes o que complica imenso a edição posterior. Isto claro piora a situação se algum dos intervenientes estiver a produzir algum ruído de fundo que depois tenha que ser retirado na pós-produção.

Veja-se o caso do último Triplo Expresso:

[audio:http://pod-serve.com/audiofile/filename/9208/triplo_6_raw.mp3]

Este foi o ficheiro a partir do qual foi produzido o programa. Como se pode ouvir, havia ali um problema grave de massas e provavelmente alguma ventoinha de computador estava também a mostrar a sua eficiência de arrefecimento. O que acontece é que são poucos os fabricantes que tem cuidado em isolar normalmente a parte do sistema de som do resto do computador. O meu EeePC por exemplo é impossível de utilizar para gravação quando está ligado à corrente eléctrica, porque o volume das massas é insuportável.

Normalmente em questões de áudio se aquilo que entra é mau normalmente o que sai também é mau. A melhor (alguns diriam a única) solução para melhorar a qualidade de som é começar no primeiro instrumento da cadeia de gravação que é o ambiente de gravação, e seguir a voz, o micro, a interface áudio, o computador, o skype, a ligação à web do convidado, a minha ligação à web, o meu skype, o Audio HiJack até ao disco rápido. Cada um destes passos tem que ser o melhor possível e em cada um podem surgir problemas diferentes. A falha de um deles normalmente implica mais trabalho de pós-produção e normalmente mais dores de cabeça e cabelos brancos para se chegar a isto que é resultado final do mesmo ficheiro do Triplo Expresso após tratamento.

[audio:http://pod-serve.com/audiofile/filename/9209/triplo_expresso_06_novembro_dadrmcc.mp3]

A questão é como passar do primeiro ficheiro para o segundo?

Cada caso é completamente diferente. Primeiro uma noção sobre áudio: 6dB são um factor de 2 em termos de potência ou volume. Ou seja, se 0dB é 100% volume, -6dB é 50% de volume, -12dB é 25% e assim sucessivamente.

As tarefas de limpeza e pós-edição passam então pelo seguinte: – A primeira coisa que há a fazer é dividir o ficheiro gravado em duas faixas. A local e a remota. Normalmente ambas são muito diferentes em termos de volumes. O Skype comprime imenso as vozes (eu diria a taxas de 10:1 ou mais) e normaliza o que faz com que o que vem do skype pareça tudo muito alto. Claro que se houver ruído este também vem muito exagerado.

  • A seguir normalmente é preciso remover algum ruído de fundo. Isto pode ser feito por exemplo no Audacity que apresenta um excelente plugin para o efeito através de remoção multi-banda. É preciso encontrar uma zona de silêncio onde o método possa ser treinado, o que numa conversa não é complicado de encontrar, e depois aplica-se. O método é eficaz embora seja preciso estar atento ao aparecimento de artefactos. Pessoalmente penso que não se deve ultrapassar os 12dB de redução a menos que a qualidade do input o exija. O aparecimento de artefactos deve ser evitada a todo o custo e a ideia não é eliminar o ruído de fundo, mas sim disfarçá-lo. Há software comercial mais avançado que permite eliminar o ruído de forma mais selectiva, dividindo o ruído em ruído geral e ruído tonal e com muitos mais parâmetros para ajustar permitindo melhores resultados. Mas também à custa de muito mais tempo de pós-processamento (no último triplo expresso o algoritmo de remoção demorou 9h a limpar o rúido). Normalmente estes algoritmos recorrem à decomposição do sinal num mapa tempo-frequência onde é atenuada a parte correspondente ao ruído que se treinou e onde depois é reconstruído o novo sinal.

  • Outra das opções que se deve ter em conta é a utilização de um Gate. Principalmente para aquelas partes em que uma das faixas não tem voz porque o “outro” está a falar. Esse ruído de fundo pode ser eliminado com um gate que deve ser o suficiente para remover o ruído de fundo mas não tão agressivo que se note a sua entrada em funcionamento.

  • Remoção de harmónicas. Se utilizar algum software que permita fazer isto automaticamente tanto melhor, senão terá que ir uma a uma. No entanto precisa de ter um software que lhe mostre onde elas estão. Na Europa a electricidade é distribuída a 50Hz o que quer normalmente dizer que podemos ter harmónicas em múltiplos de 50. No entanto antes de as remover convém verificar se é preciso, é que para todos os efeitos ao eliminar harmónicas também estamos a perder alguma da informação da gravação.

  • A observação do espectro do sinal é muito importante porque pode permitir por exemplo identificar ventoinhas em funcionamento e permite remover esses ruídos (como nas Harmónicas).

  • Por fim a utilização de filtros High-Pass, Low-Pass e Notch. Se os dois primeiros são fundamentais, normalmente aplicados em torno dos 120Hz e dos 10000Hz respectivamente o Notch pode também servir para eliminar ruídos muito precisos e pontuais.

Cada caso é um caso e não há uma receita para seguir e produzir da mesma forma. A única coisa que se mantém constante é o instrumento de trabalho que são os ouvidos, daí que quando se está a fazer a pós-produção também não sirvam uns quaisquer phones para fazer a audição. Pessoalmente considero que bons headphones, fechados para isolar o ruído ambiente, são o ideal para ouvir o que está a passar com o áudio para lá da conversa.

Depois de ter o sinal processado e limpo nos dois canais (o local e o remoto) então sim é altura de os voltar a juntar no editor (Audacity por exemplo) e começar a fazer a parte de corte e costura. A primeira coisa passa por ajustar os níveis (normalmente a versão local está 6 a 12 dB mais baixa que a remota), depois por cortar as pontas antes da intro de depois da outro do programa e de seguida as passagens de conversa. Ou seja aqui sim finalmente começa-se a fazer edição olhando ao conteúdo semântico. Por fim antes de fazer o mix final aplica-se a compressão (normalmente por fases, primeiro 2:1, depois 4:1, 8:1, etc.. a gosto) até que o som dos dois canais pareça homogéneo.

No final mistura-se tudo para uma pista de mono em formato aiff e exporta-se. Converte-se para MP3 com 64Kbps (Constant Bit Rate), amostragem a 44100Hz (embora pela lei de Nyquist isto pudesse ser menos) e acrescentam-se as informações das Tags. Upload e pronto a servir.

O processo de pós-produção é chato. É chatérrimo! E portanto todo o cuidado que se colocar na pré-produção e no processo de gravação vai valer a pena nesta altura. No último Triplo Expresso por exemplo, tivemos um grave problema de ruído. Isso obrigou a ser muito agressivo na pós-produção (a fase de remoção de ruído utilizou valores da ordem dos 18dB-24dB) e isso acabou por em alguns instantes introduzir pequenos artefactos. No entanto tratou-se de uma situação extrema em que tiveram que ser aplicadas medidas extremas.

Se está a pensar fazer um podcast, videocast ou qualquer coisa que cast o meu conselho é que tenha o maior cuidado possível com o input do seu áudio, isto claro está se não quiser sofrer na pós-produção e ter que reler este post novamente.

Sai uma italiana?

[ad#ad-2]

– Bom dia Sr. Eng., quer uma italiana? – Não, obrigado, preciso de algo mais forte! – Mais forte? Um duplo? – Não, não! Isso não me faz nada. Tire um Triplo Expresso e junte-lhe dois cubos de açúcar!