Em qualquer momento ou outro, todos deveriam aprender uma vez que os arquivos de áudio funcionam. Esse conhecimento pode parecer trivial ou sem valia, mas pode ser útil ao gravar músicas, gerar um podcast ou otimizar sua livraria de músicas.
Levante post explorará os vários fatores que afetam a qualidade do áudio e o tamanho do registo de áudio. Encontrar o estabilidade perfeito entre os dois não é fácil, mas você deve saber o suficiente para se sentir confortável e testar por si mesmo até o final.
Nota: Para colocar esse conhecimento em prática, você deve pegar um editor de áudio gratuito uma vez que o Audacity ou qualquer outra selecção. Aprender essas ferramentas está além do escopo desta peça.
1. Taxa de Modelo
Na vida real, o som é uma vaga. Quando alguém fala ou bate palmas, o que você está realmente ouvindo é uma mudança na pressão que viaja pelo ar e eventualmente atinge seus tímpanos.
Mas uma vez que capturamos esse som e o convertemos em dados digitais? Não podemos simplesmente gravar a vaga sonora completa uma vez que ela é; em vez disso, temos que tirar “instantâneos” periódicos do som ao longo do tempo. Quando você reproduz tudo em sequência, obtém uma recriação aproximada do som original.
Cada momentâneo é chamado de modelo, e o pausa usado entre cada snapshot é chamado de taxa de amostragem. Para defini-los, é o número de instantâneos digitais tirados por segundo em um registo de áudio por um conversor analógico para do dedo. A taxa de amostragem é medida em Hertz, portanto, pode ser expressa uma vez que uma frequência.
Quanto menor o pausa, mais rápida a frequência. Frequências mais rápidas produzem gravações mais precisas, mas também exigem mais dados para armazenar cada segundo de som gravado.
Por exemplo, o áudio com qualidade de CD usa uma frequência de modelo de 44,1 kHz (ou 44.100 amostras por segundo), enquanto o áudio com qualidade de TV e DVD usa uma frequência de modelo de 48 kHz. Dada uma gravação de áudio mono não compactada de 10 minutos, a primeira pode ter 51,7 MB, enquanto a última seria 56,3 MB.
Você pode tombar para 32 kHz para gravações somente de fala e não suportar muita perda de qualidade, mas mantenha-se em 44,1 kHz se houver música envolvida ou se você precisar de qualidade máxima. Tombar para 22,05 kHz soará mais próximo do rádio AM.
2. Taxa de bits
Taxa de bits não é a mesma coisa que taxa de amostragem. Muitas pessoas tendem a confundir os dois, mas é importante que você não o faça. Em primeiro lugar, se a taxa de amostragem é a frequência com que os instantâneos de som são tirados, a profundidade de bits é a quantidade de dados gravados durante cada momentâneo.
Para ilustrar, imagine uma vaga sonora uma vez que um fluxo de chuva e você está tentando conquistar (ou seja, registrar) essa chuva com um balde. A taxa de amostragem seria a frequência com que você mergulha seu balde no fluxo, enquanto a profundidade de bits seria o tamanho do seu balde. A medida para a profundidade de bits é bits. Para cada aumento de um bit, a precisão da gravação vinco.
Quanto maior a profundidade de bits, mais dados são capturados por modelo. Isso leva a uma gravação mais precisa às custas de mais espaço necessário para armazenar esses dados.
Mas se você reduzir muito a profundidade de bits, os dados de som serão perdidos. Os CDs de áudio usam 16 bits por modelo, enquanto os discos DVD e Blu-ray usam 24 bits para cada modelo.
Taxa de bits é quantos dados de som reais são processados (expressos em kilobits por segundo). Para obter a taxa de bits, você multiplica a taxa de amostragem pela profundidade de bits. Um registo de áudio de CD com taxa de amostragem de 44,1 kHz e profundidade de 16 bits teria uma taxa de bits não compactada de 44100*16, ou seja, 705,6 kbps.
Para dar uma teoria da diferença no tamanho do registo, vamos considerar uma música de cinco minutos não compactada gravada em um áudio estéreo de dois canais
- 44,1 kHz/16 bits: 44100*16*2 = 1411200 bits por segundo (1,4 Mbps)
- 192kHz/24 bits: 192000*24*2 = 9216000 bits por segundo (9,2Mbps)
Usando a taxa de bits calculada, multiplique-a pela duração da gravação
- 1,4*300 = 420 MB ou 52,5 MB
- 9,2*300 = 2760 MB ou 345 MB
Portanto, o áudio gravado em 192kHz/24 bits ocupará seis vezes mais espaço, mas tudo se resume ao que você deseja fazer com a gravação de áudio. Às vezes, a taxa de bits completa não é necessária em um determinado momentâneo, uma vez que quando há silêncio.
Nesse caso, você pode usar taxa de bits variável (VBR) suportado por MP3, OGG, AAC e WMA. No pretérito, o VBR não era amplamente suportado, mas hoje em dia não é um grande problema.
3. Estéreo vs. Mono
Levante ponto é bastante simples, logo vou mantê-lo breve. Mono significa um via, enquanto Estéreo significa dois canais. Os dois canais em um registo de áudio estéreo podem ser chamados de canais “esquerdo” e “recta”.
Com um par de fones de ouvido, você poderá ouvir um dos canais estéreo em um ouvido e o outro via estéreo no outro ouvido. Ao ouvir um registo de áudio mono, você ouvirá exatamente o mesmo via em ambos os ouvidos.
De certa forma, os arquivos de áudio estéreo são essencialmente dois arquivos de áudio mono em um, o que significa que um registo de áudio estéreo é sempre duas vezes maior que um registo de áudio mono, assumindo que a taxa de amostragem, profundidade de bits, som de origem etc. entre os dois. Portanto, a maneira mais fácil de trinchar instantaneamente um tamanho de registo de áudio pela metade é convertê-lo de estéreo para mono.
Para gravações somente de voz, o mono é quase sempre preposto, pois torna o som poderoso, simples e direto. Mas se você quiser gravar dois ou mais vocalistas em uma sala com acústica única, os vocais devem ser estéreo.
Da mesma forma, a gravação de podcast também pode ser mono. No entanto, em gravações de música, um estéreo é o que faz um monte de música toar mais tridimensional, uma vez que se a música estivesse tocando ao seu volta e não em você (ou seja, mono soa mais projecto).
4. Compressão
Se você estiver trabalhando com arquivos WAV, a única maneira de reduzir o tamanho do registo é mexer em uma das configurações supra (taxa de amostragem, profundidade de bits ou número de canais). Para todo o resto, a compactação é o maior fator no tamanho do registo de áudio. Existem dois tipos de compressão:
- Compressão com perda remove dados “desnecessários” do áudio, uma vez que sons que estão além do alcance auditivo da maioria das pessoas. Uma vez compactados, esses dados descartados não podem ser recuperados.
- Compressão sem perdas pega um registo de áudio e o compacta o supremo verosímil usando algoritmos matemáticos. No entanto, deve ser descompactado no momento da reprodução, o que exige mais poder de processamento. Nenhum oferecido real é perdido.
O modo de compactação que você deseja usar depende do uso solicitado do registo de áudio. Geralmente, você deve optar pela compactação sem perdas quando quiser armazenar uma reprodução quase perfeita do material de origem e pela compactação com perdas quando a reprodução imperfeita for boa o suficiente para o uso quotidiano.
Por exemplo, você pode querer preservar sua coleção de CDs copiados em FLAC (se o espaço de armazenamento não for um problema) e usar MP3 para armazená-los no telefone. Se você não sabe muito sobre compactação, cá está nosso guia completo sobre uma vez que a compactação de arquivos funciona e uma lista de ferramentas para compactar arquivos de áudio grandes de forma eficiente.
5. Formato de registo
Depois de resolver usar a compactação com perdas, você precisa resolver qual formato de registo é melhor para você. No momento da redação deste item, as três opções mais populares são MP3, OGG, e AAC. Para saber mais, leia nosso guia sobre a confrontação de vários formatos de registo de áudio.
O MP3 é de longe o mais popular, principalmente porque foi o primeiro dos três a chegar em cena. AAC é tecnicamente melhor que MP3, mas não tem a mesma taxa de uso. OGG também é bom, mas poucos dispositivos o suportam, logo fique com MP3 ou AAC.
Independentemente de qual você usar, você acabará compactando para uma taxa de bits de orientação. Se presumirmos que você usará o formato MP3, essas são as cinco taxas de bits mais comuns usadas atualmente:
- 64 kbps é a qualidade de rádio AM. Perfeito para podcasts somente de conversação porque as vozes não são tão complexas quanto a música.
- 96 kbps é a qualidade do rádio FM. A música soará muito, mas você poderá manifestar que não é encorpada, principalmente porque certas frequências audíveis foram removidas.
- 128 kbps é a qualidade de áudio do CD. Isso é o mais padrão verosímil. A música soa “boa o suficiente” para a maioria das pessoas nessa taxa de bits.
- 256 kbps é de subida qualidade de áudio. Você pode notar certos sons e instrumentos que não eram detectáveis em taxas de bits mais baixas.
- 320 kbps é a melhor qualidade de áudio. Você pode ir mais tá, mas provavelmente não será capaz de perceber a diferença, mesmo que se considere um audiófilo.
Em termos de redução do tamanho do registo, um MP3 compactado a 128 kbps perde aproximadamente 90% dos dados de som originais, enquanto um MP3 compactado a 320 kbps perde exclusivamente tapume de 60%.
Ou por outra, se você tiver um MP3 e um AAC compactados na mesma taxa de bits, o AAC geralmente soará melhor porque usa um algoritmo de compactação mais avançado. Isso significa que você pode obter mais “qualidade por megabyte” com AAC do que com MP3.
Otimize os tamanhos dos seus arquivos de áudio
Compreender esses cinco fatores o ajudará a resolver a melhor maneira de gravar e compactar músicas e/ou podcasts que você criou e a resolver que tipo de formatos de música comprar ou quais serviços de streaming usar.
Leia a seguir
Sobre o responsável