14.4k 1

Conceptos básicos del sonido digital II

Este artículo es continuación del anterior Conceptos básicos del sonido digital y se recomienda haberlo leído antes de continuar.

En el artículo anterior veíamos cómo se almacenada una onda de sonido como números binarios o sonido digital. ¿Pero cuánto espacio necesito para almacenar una canción?

Espacio de almacenamiento

Como hemos visto, lo más importante es el tamaño de cada muestra (cuantos bits se usan en cada muestra) y el número de muestras que se toman. Cuanto más altas sean estas dos cantidades más espacio se necesita.

Si tomamos como referencia la calidad de CD, tenemos que cada muestra necesita 16 bits (16b) o, lo que es lo mismo, 2 bytes (2B). 

En un segundo de sonido se toman 44.100 muestras, por lo tanto necesitaremos 88.200 bytes para almacenar un segundo de audio con esta calidad. 

La mayoría de CD eran de 74 minutos, lo que supone 88.200 bytes × 60 segundos/minuto × 74 minutos = 391,608 millones de bytes, o 391,6 MB (373,5 MiB). 

Pero no nos olvidemos de un pequeño detalle… la música de un CD es estéreo. Eso quiere decir que tenemos dos ondas de sonido, una para la izquierda y otra para la derecha, que no son iguales (si fuesen iguales sería mono). Por lo tanto necesitamos el doble, 783,2 MB (746,9 MiB). Y este era el tamaño habitual de un CD.

Pero pensemos, que esto era una barbaridad para la época (finales de los 70 y principios de los 80). Para que no hagamos una idea, el Macintosh original tenía una capacidad en sus discos de 400 kB, es decir, lo suficiente para almacenar algo más de 2 segundos de audio en calidad CD. 

Los disquetes de 3,5” llegaron a poder almacenar 1,4 MB (unos 8 segundos) y se siguieron utilizando hasta entrados los primeros años 2000. Los discos duros de los años 90 no llegaban para almacenar el contenido de un CD o quizá empezaba a haber algún modelo que lo superaba, pero a un precio que era prohibitivo para almacenar música. 

Sonido comprimido

La solución pasaba por recudir el espacio de almacenamiento necesario, que con menos bytes pudiésemos almacenar la misma cantidad de música.

Así nació el popular formato de audio MP3, que se popularizó mucho a finales de los 90 y principios de los 2000. El sonido habitualmente se almacenaba utilizando 64 kb/s (en un CD de audio era 705,6 kb/s) para un canal de sonido, 128 kb/s para el estéreo (en un CD de audio 1.411 kb/s). Estanos hablando de una reducción de 9 veces el espacio necesario. 

Esto es lo que se conoce como compresión con pérdida (lossy en inglés). Se basa en que se permite que se pierda parte de la información de la onda original porque dicha pérdida a penas va a tener impacto en el oyente, es decir, casi no lo va a notar. Así que se reducía el espacio necesario (y el ancho de banda para trasmitir) con el coste de perder un poco de calidad. 

A principios de los 2000 nace el formato AAC (Advanced Audio Coding), que es un formato estándar internacional ISO/IEC 13818-7. Su eficiencia es muy superior al MP3, además de usar una tasa de bits variables (VBR) que le permite adaptarse en cada momento de la canción y usar más o menos bits para codificarla. Esto se traduce en que para la misma calidad necesita usar la mitad de información. 

Este es el formato que escogió Apple para sus iPod, aunque al ser un estándar puedes encontrarlo como formato por defecto para muchos dispositivos, como Nintendo, PlayStation, XBox, etc… Además, soporta hasta 48 canales de audio, por lo que también es un estándar para archivos de vídeo MP4 (películas, documentales…) donde soporta el típico 5.1 o 7.1 de audio Dolby para películas sin problema. 

Al comienzo de la tienda de música iTunes, los ficheros comenzaron a venderse codificados en AAC a 64 kb/s por canal, es decir, a 128 kb/s. Posteriormente, a principios de la década de 2010, pasó a utilizar 128 kb/s por canal (256 kb/s en estéreo). 

Así, el sonido comprimido con pérdida, se permite perder parte de la información a cambio de una importante ganancia de espacio (tanto para almacenar como para trasmitir). ¿Tiene peor calidad la música comprimida con pérdida que el archivo original? Evidentemente, la cuestión es, a partir de qué punto ya no somos capaces de notar la diferencia.

Sonido sin pérdidas

El sonido no comprimido traslada tal cual las muestras que se han tomado de la onda, como el caso de CD de audio, sin pérdidas desde el momento que se digitalizó. 

También han salido formatos de audio comprimido sin pérdida (lossless), es decir, permiten comprimir para que el archivo ocupe menos pero lo información contenida no se altera en absoluto (como si fuese un archivo .zip) aunque la compresión que consiguen es mucho menor que la compresión con pérdida, hablamos de comprimir el original a la mitad. En este caso tenemos formatos como ALAC (Apple Lossless Audio Codec) de la propia Apple o FLAC (Free Lossless Audio Codec) de Xiph.org, aunque hay más. 

Hoy en día tenemos discos capaces de almacenar mucha más información que hace 20 años, conexiones muchísimo más rápidas, por lo que usar formatos de audio sin pérdidas ya no tiene un coste tan alto para el usuario. 

El archivo de audio no es lo único importante

Nos hemos centrado cómo almacenamos los datos y cómo llegan a nuestro reproductor. Pero nuestros oídos no entienden de 1 y 0 digitales. Para poder escuchar el audio tenemos que volver a convertirlo a analógico (DAC) y llevarlo hasta nuestros oídos.

Así, el dispositivo conversor digital analógico juega un papel importante. Si suaviza la onda, elimina distorsiones, etc… hará que se genere una onda analógica mucho mejor, de mucha más calidad. Además, el cable por el que viaja hasta nuestros auriculares o nuestros altavoces, si está apantallado para reducir las interferencias (recordemos que una vez en el mundo analógico, estamos totalmente expuestos) y, sobre todo, la calidad de los altavoces en sí. 

Podemos tener un archivo de audio original, ya sea analógico o digital, de muy buena calidad, pero que esta no sea capaz de viajar y reproducirse fielmente por los altavoces, por lo que la calidad con la que llegará a nuestros oídos será mucho peor. 

Por lo tanto es clave el dispositivo reproductor y, sobre todo, los altavoces, más que si la música viene en analógico o en digital, comprimida sin pérdidas o con pérdidas. De nada vale que metamos más datos en un archivo si el sistema reproductor de audio no es capaz de reproducirlo fielmente. 

¿Cuál es la calidad de audio adecuada?

Al igual que vimos con las pantallas, ir aumentando la resolución hacía que la imagen se viese mejor, más fiel a la realidad. Pero llega un punto donde más resolución no se nota, podemos ir aumentándola y aumentará la calidad de la imagen, pero no servirá de nada. 

Al principio, pequeños incrementos en la calidad (resolución o frecuencia de muestreo) suponen una gran diferencia en la percepción del oyente, pero a medida que se va incrementando, cada vez, la diferencia de percepción es menor. Y además, tengamos en cuenta que muchos equipos de sonido no tienen la calidad suficiente para trasladar ese archivo tal cual al ser humano. 

En archivos de audio AAC, pasar de 128 kb/s a 256 kb/s ya es difícil de distinguir para muchas personas, ya sea por su sensibilidad y/o costumbre, como por el equipo que usan para reproducir. Y seguir subiendo de aquí y pasar a sonido sin comprimir, o mayor tasa de muestreo o más resolución es algo que va a aumentar mucho el tamaño de los archivos pero que poca gente, y sólo con buen equipamiento, notará. 

En incremento en la tasa de bits cada vez se traslada en un menor incremento en la calidad percibida

Aunque ya sabemos que el poder del marketing. Recuerdo, cuando era pequeño, lo maravillados que estaban los compradores de flamantes televisores estéreo con esta característica, cuando la emisión de TV era en mono.

Te animo a que pruebes, hagas el experimento, a partir de un archivo de la más alta calidad posible, o de un CD. Prueba a comprimirlo con distintas calidades y luego, sin saber cuál es cuál, escuchar a ver si consigues notar las diferencias. Esa calidad a partir de la cual ya no notas nada, es la adecuada para ti. 

One Comment

Deja una respuesta