Surrounded by sound: how 3D audio hacks your brain – Binaural audio explained

The Verge has a great story on how binaural audio is recorded and how it is perceived by our brains:

Surrounded by sound: how 3D audio hacks your brain.

It is a great story on how our brains respond to the 3D sound around, and it is just an eight-minute read.

What are Binaural Recordings?

Binaural audio recordings reproduce the way we listen. For this audio engineers use microphones placed 18cm apart. This distance mimics your ears and the way we listen to sounds. But it is not enough to place the microphones 18cm apart. Binaural audio also takes into account the mass of the brain, which acts as a barrier to sound propagation, and mannequin heads are used, among other techniques. In result, recordings that explore this create soundscapes that promise be more immersive and feeling 3Dish. They aim to put you in location by hearing the binaural audio.

Here’s an example of a binaural audio recording from SoundCloud. Try to use headphones and listen to the 3D aspect of this recording.

Listening to Binaural Audio

Naturally the best way to listen is to have a good pair of cans (headphones), or even better, to use in-ear headphones. They provide you the richest experience. Also, close your eyes and imagine the scene of the binaural recording. A binaural recording is not the same thing as a stereo recording because in stereo capture doesn’t necessarily try to imitate the human ear placement. Also, this kind of recording has been used to entrain the brain to allow for higher concentration. Those are called Binaural Beats and according to the different bands and frequency used, can lead you to relax or to focus better.

Binaural audio is not everyone’s cup of tea but it produces unique experiences that you might enjoy. Maybe they are also a good sleeping aid?

Podcasts: Audições para a primavera de 2014

Os podcasts vieram para transformar a rádio. Democratizaram o meio e permitiram que os produtores independentes tenham uma voz para voltar a fazer programas de autor. Mas se em Portugal o panorama é dominado por podcasts que não passam das gravações das emissões de rádio (tirando algumas honrosas excepções), lá por fora encontram-se verdadeiras pérolas. Pena que por cá o “de autor” seja entendido normalmente como “de baixa qualidade”, mas isso levar-me-ia para outra discussão.

A minha lista de audições para esta Primavera mantém apenas uma entrada relação à lista que me acompanhou em 2013. Outra vantagem dos podcasts é que não temos que ouvir o mesmo RAP a encher chouriços o ano todo. Curiosamente não tem nenhum podcast (em) português e é dominada por podcasts da radiotopia! Cá vão eles: 99% Invisible, The Truth, Strangers e Theory of Everything. Para além destes quatro ainda ouço um produzido pela BBC 4, o In Our Time com o Melvyn Bragg. Não será para todos os gostos e nem sempre a qualidade é top (e muito menos se compararmos com alguns dos independentes que em nada lhe ficam atrás), mas tem o peso da BBC, o que permite a regularidade semanal com convidados de peso.

A lista é curta, não inclui nenhum podcast de tecnologia ou de ciência ou… geek, mas se calhar são gostos que vão mudando consoante a idade ou o momento. Se tiverem alguma sugestão de podcasts que realmente sejam uma lufada de ar fresco por favor indiquem. Publiquem a lista de podcasts que ouvem. Quem sabe se não há espaço na minha lista para mais um?

Quantos podcasts faço download?

Aqueles que me conhecem há mais tempo (mais do que dois dias) sabem que sou um aficionado de Podcasts (Google Podcast e TriploExpresso). Já não tenho tempo para ouvir alguns tipos de podcast (humor, tecnologia, games), mas a minha lista de downloads vai mudando com as estações dos meus ouvidos. Mas deixemo-nos de conversa fiada. Eis a lista que agora ocupa os megabytes dos meus players:

99% Invisible – Um podcast fabuloso, produzido por Roman Mars. Simplesmente dos podcasts com melhor sonoplastia da actualidade. O Roman Mars consegue criar atmosferas sonoras para as histórias que quer contar que nos transportam para dentro da história. Se ainda não ouviram um podcast, este é obrigatório.

The Sword and Laser Podcast – Apesar de ter um formato que já não me atrai muito (o podcast de 1h em jeito de conversa entre amigos no skype), permanece nos players por causa do assunto. Livros Ficção Científica, que é um dos meus vícios.

Experimental – Um podcast de múltiplos autores sobre tópicos de ciência. Alguns dos produtores são realmente muito bons com sonoplastia bem feita (mas não tão boa como a do 99%)

A minha dose de Tech é dada pelo 60-second Tech (não tenho paciência para mais). Consumo a tech que preciso a partir de alguns blogs de referência e do techmeme. Os podcasts de Tech ultimamente limitam-se a ser antros de fanboys a papaguear o que algum CEO anunciou. Não tenho paciência para a falta de crítica.

Ainda no que diz respeito a podcasts curtos, ouço também o 60-second Science Ambos os 60-sec são bem produzidos pela Scientific American.

Voltando aos livros, The Penguin Podcast e o Book Review do New York Times injectam-me a minha dose de novidades literárias que preciso.

Por fim, falando eu tanto de fotografia seria natural que tivesse algum na minha playlist. A verdade é que só tenho um. O LensWork Podcast. Aborda principalmente o processo criativo assim com reflexões curtas sobre estética, filosofia e importância da fotografia. Não vão encontrar conversa fiada sobre máquinas, modelos ou megapixeis. Muito Bom.

Esta é a minha curta e singela lista de audições de podcasts. Se forem aficionados do formato e tiverem sugestões de audição deixem-nas nos comentários juntamente com a razão pela qual gostam do podcast.

O qualidade áudio do Triplo Expresso

Uma das maiores dificuldades de gravar um podcast à distância via skype é conseguir consistência entre os níveis de input de áudio dos diversos intervenientes. Se quando estamos a gravar apenas uma pessoa o problema não é muito grave porque facilmente se separam os canais de saída e entrada e se podem processar os dois em separado, quando, como no Triplo Expresso, somos 3, eventualmente 4 ou 5 quando temos convidados especiais, o problema é sobremaneira grave. Infelizmente o Skype não permite “ainda” separar os diversos streams de aúdio duma conversa fazendo automaticamente o mix de todos os canais de entrada. [ad#ad-1] Embora possamos continuar a gravar as nossa versão local, o que recebemos do skype é já um mix dos outros intervenientes o que complica imenso a edição posterior. Isto claro piora a situação se algum dos intervenientes estiver a produzir algum ruído de fundo que depois tenha que ser retirado na pós-produção.

Veja-se o caso do último Triplo Expresso:

[audio:http://pod-serve.com/audiofile/filename/9208/triplo_6_raw.mp3]

Este foi o ficheiro a partir do qual foi produzido o programa. Como se pode ouvir, havia ali um problema grave de massas e provavelmente alguma ventoinha de computador estava também a mostrar a sua eficiência de arrefecimento. O que acontece é que são poucos os fabricantes que tem cuidado em isolar normalmente a parte do sistema de som do resto do computador. O meu EeePC por exemplo é impossível de utilizar para gravação quando está ligado à corrente eléctrica, porque o volume das massas é insuportável.

Normalmente em questões de áudio se aquilo que entra é mau normalmente o que sai também é mau. A melhor (alguns diriam a única) solução para melhorar a qualidade de som é começar no primeiro instrumento da cadeia de gravação que é o ambiente de gravação, e seguir a voz, o micro, a interface áudio, o computador, o skype, a ligação à web do convidado, a minha ligação à web, o meu skype, o Audio HiJack até ao disco rápido. Cada um destes passos tem que ser o melhor possível e em cada um podem surgir problemas diferentes. A falha de um deles normalmente implica mais trabalho de pós-produção e normalmente mais dores de cabeça e cabelos brancos para se chegar a isto que é resultado final do mesmo ficheiro do Triplo Expresso após tratamento.

[audio:http://pod-serve.com/audiofile/filename/9209/triplo_expresso_06_novembro_dadrmcc.mp3]

A questão é como passar do primeiro ficheiro para o segundo?

Cada caso é completamente diferente. Primeiro uma noção sobre áudio: 6dB são um factor de 2 em termos de potência ou volume. Ou seja, se 0dB é 100% volume, -6dB é 50% de volume, -12dB é 25% e assim sucessivamente.

As tarefas de limpeza e pós-edição passam então pelo seguinte: – A primeira coisa que há a fazer é dividir o ficheiro gravado em duas faixas. A local e a remota. Normalmente ambas são muito diferentes em termos de volumes. O Skype comprime imenso as vozes (eu diria a taxas de 10:1 ou mais) e normaliza o que faz com que o que vem do skype pareça tudo muito alto. Claro que se houver ruído este também vem muito exagerado.

  • A seguir normalmente é preciso remover algum ruído de fundo. Isto pode ser feito por exemplo no Audacity que apresenta um excelente plugin para o efeito através de remoção multi-banda. É preciso encontrar uma zona de silêncio onde o método possa ser treinado, o que numa conversa não é complicado de encontrar, e depois aplica-se. O método é eficaz embora seja preciso estar atento ao aparecimento de artefactos. Pessoalmente penso que não se deve ultrapassar os 12dB de redução a menos que a qualidade do input o exija. O aparecimento de artefactos deve ser evitada a todo o custo e a ideia não é eliminar o ruído de fundo, mas sim disfarçá-lo. Há software comercial mais avançado que permite eliminar o ruído de forma mais selectiva, dividindo o ruído em ruído geral e ruído tonal e com muitos mais parâmetros para ajustar permitindo melhores resultados. Mas também à custa de muito mais tempo de pós-processamento (no último triplo expresso o algoritmo de remoção demorou 9h a limpar o rúido). Normalmente estes algoritmos recorrem à decomposição do sinal num mapa tempo-frequência onde é atenuada a parte correspondente ao ruído que se treinou e onde depois é reconstruído o novo sinal.

  • Outra das opções que se deve ter em conta é a utilização de um Gate. Principalmente para aquelas partes em que uma das faixas não tem voz porque o “outro” está a falar. Esse ruído de fundo pode ser eliminado com um gate que deve ser o suficiente para remover o ruído de fundo mas não tão agressivo que se note a sua entrada em funcionamento.

  • Remoção de harmónicas. Se utilizar algum software que permita fazer isto automaticamente tanto melhor, senão terá que ir uma a uma. No entanto precisa de ter um software que lhe mostre onde elas estão. Na Europa a electricidade é distribuída a 50Hz o que quer normalmente dizer que podemos ter harmónicas em múltiplos de 50. No entanto antes de as remover convém verificar se é preciso, é que para todos os efeitos ao eliminar harmónicas também estamos a perder alguma da informação da gravação.

  • A observação do espectro do sinal é muito importante porque pode permitir por exemplo identificar ventoinhas em funcionamento e permite remover esses ruídos (como nas Harmónicas).

  • Por fim a utilização de filtros High-Pass, Low-Pass e Notch. Se os dois primeiros são fundamentais, normalmente aplicados em torno dos 120Hz e dos 10000Hz respectivamente o Notch pode também servir para eliminar ruídos muito precisos e pontuais.

Cada caso é um caso e não há uma receita para seguir e produzir da mesma forma. A única coisa que se mantém constante é o instrumento de trabalho que são os ouvidos, daí que quando se está a fazer a pós-produção também não sirvam uns quaisquer phones para fazer a audição. Pessoalmente considero que bons headphones, fechados para isolar o ruído ambiente, são o ideal para ouvir o que está a passar com o áudio para lá da conversa.

Depois de ter o sinal processado e limpo nos dois canais (o local e o remoto) então sim é altura de os voltar a juntar no editor (Audacity por exemplo) e começar a fazer a parte de corte e costura. A primeira coisa passa por ajustar os níveis (normalmente a versão local está 6 a 12 dB mais baixa que a remota), depois por cortar as pontas antes da intro de depois da outro do programa e de seguida as passagens de conversa. Ou seja aqui sim finalmente começa-se a fazer edição olhando ao conteúdo semântico. Por fim antes de fazer o mix final aplica-se a compressão (normalmente por fases, primeiro 2:1, depois 4:1, 8:1, etc.. a gosto) até que o som dos dois canais pareça homogéneo.

No final mistura-se tudo para uma pista de mono em formato aiff e exporta-se. Converte-se para MP3 com 64Kbps (Constant Bit Rate), amostragem a 44100Hz (embora pela lei de Nyquist isto pudesse ser menos) e acrescentam-se as informações das Tags. Upload e pronto a servir.

O processo de pós-produção é chato. É chatérrimo! E portanto todo o cuidado que se colocar na pré-produção e no processo de gravação vai valer a pena nesta altura. No último Triplo Expresso por exemplo, tivemos um grave problema de ruído. Isso obrigou a ser muito agressivo na pós-produção (a fase de remoção de ruído utilizou valores da ordem dos 18dB-24dB) e isso acabou por em alguns instantes introduzir pequenos artefactos. No entanto tratou-se de uma situação extrema em que tiveram que ser aplicadas medidas extremas.

Se está a pensar fazer um podcast, videocast ou qualquer coisa que cast o meu conselho é que tenha o maior cuidado possível com o input do seu áudio, isto claro está se não quiser sofrer na pós-produção e ter que reler este post novamente.

Adium X com Vídeo…

EDC45A3B-B0AD-4BF5-928E-34144A247635.jpgParece que finalmente vai ser possível ter conferências de vídeo e áudio no MAC. A equipa por detrás do Adium X (o excelente programa de IM para o OS X) anunciou que brevemente irá lançar o versão 2.0 do cliente com suporte para vídeo.

Como a Microsoft se prepara também para introduzir vídeo no seu cliente de MSN… vamos ver quem é o primeiro a tirar partido do facto de quase todos os Macs novos terem uma iSight integrada…

Novo pé para o Microfone

podcast station new mic stand Já andava há algum tempo à procura de um tripé para o meu microfone de trabalho. Até agora improvisava ou com um tripé de uma máquina fotográfica atando tudo com elásticos ou … como foi prática ultimamente com uma caneca de beber leite. Hoje finalmente consegui encontrar um tripé que me agradasse. Pequenino, mas todo em ferro, logo suficientemente pesado para dar conta do microfone, e também muito compacto, podendo ir comigo para qualquer parte para gravações móveis.