Cómo Funciona un MP3.

¿Cómo funciona un MP3? Esa es una pregunta común que merece una respuesta rápida. En el siguiente post intentaremos explicarlo de manera rápida y normal. Así que, aquí vamos.

La tecnología MP3 hizo su entrada y cambió por completo el mundo de la música. Ya era mucho más fácil manipular archivos de audio y se podían usar en casi cualquier dispositivo. Su auge impulsó muchísimo el consumo de música digital, tanto, que a hoy día, sigue siendo la base de tráfico musical.

Cómo funciona un MP3
Cómo funciona un MP3
Índice De Contenidos

    Cómo Funciona un MP3.

    “Cualquier tecnología suficientemente avanzada es indistinguible de la magia”. - Arthur C. Clarke.

    Para la mayoría de nosotros, la cita anterior resume perfectamente el misterio de la compresión de MP3. Lamentablemente, también resume la mayoría de las explicaciones que existen.

    La codificación de MP3 representa ahorros masivos, incluso más a una velocidad de bits de 128 kbps. Un archivo Wave sin comprimir típico puede ser tan grande como 30 MB para una canción normal de 3 minutos. Pero después de ejecutarse a través de los algoritmos de compresión de MP3, pueden caer a 3 MB sin ninguna pérdida de calidad grave.

    Esto era un gran avance cuando nuestras velocidades de ancho de banda eran extremadamente bajas en módems de acceso telefónico e incluso podríamos tener límites de ancho de banda para el mes. En lugar de esperar días para descargar una canción, podríamos hacerlo en un par de horas, y en el presente, en un par de segundos.

    Los MP3 mantienen su presencia debido a los reproductores de MP3 como el iPod. Tienen un espacio limitado en el disco duro o en la unidad flash, por lo que con la compresión podemos transportar mucha más música. Además, no hay necesidad de archivos de resolución completa cuando trabajamos en el jardín o en el gimnasio con audífonos deportivos pequeños. También es un gran ahorro de espacio y ancho de banda para los servicios de transmisión en línea.

    MP3 significa MPEG Layer 3.

    MPEG es un tipo de archivo de video que hizo lo mismo para los videos que los MP3 para el audio. De hecho, los MP3 son solo la tercera capa separada para audio en los archivos de video. Es toda la misma tecnología.

    ¿Cómo ahorra tanto espacio la compresión MP3?

    Aquí es donde se vuelve un poco más complicado. Las personas que diseñaron estos algoritmos de compresión utilizaron nuestro conocimiento de psico-acústica para administrar el ancho de banda de datos. La psico-acústica se refiere a cómo nuestro cerebro interpreta los sonidos.

    El cerebro utiliza ciertos trucos, como el enmascaramiento auditivo, para asignar recursos y atención al sonido más importante que ocurre en un momento dado. Con esta información, sabemos de qué podemos deshacernos, en cuanto a datos.

    El primer y más fácil ahorro es seguir adelante y cortar un cierto rango de frecuencia si la música lo permite. Los adultos comienzan a perder su capacidad de escuchar por encima de 16-18 kHz, mientras que el límite superior para los humanos es de alrededor de 24 kHz. En ese nivel, no hay mucho que hacer en términos de inteligibilidad. Es solo brillo.

    En la mayoría de los casos, no necesitamos tenerlo, o al menos podemos codificarlo en el archivo MP3 con una resolución más baja.

    Enmascaramiento simultáneo.

    Esto se refiere a algo que nuestros oídos y cerebros hacen, llamado enmascaramiento simultáneo. Básicamente, si un sonido fuerte suena por encima de muchos sonidos de bajo volumen, naturalmente se enfocará en el sonido fuerte. Lo que esto significa es que podemos gastar muchos menos datos en los sonidos silenciosos. No necesitan tantos detalles codificados en ellos durante esos momentos.

    De la misma manera anterior, si dos eventos de sonido ocurren dentro de milisegundos entre sí, solo podremos enfocarnos en el más fuerte. Así es como hemos sido preparados evolutivamente para reaccionar. Nuestros oídos y mentes no pueden separar eventos que se cierran en el tiempo.

    Entonces, lo que hace el algoritmo del codificador es ignorar o al menos asignar mucha menos información al sonido más silencioso, ya que de todos modos no lo percibiremos.

    Umbral mínimo de audición.

    El umbral mínimo de audición se refiere al volumen. A medida que la voz o el sonido se vuelven más y más silenciosos, podemos distinguir cada vez menos detalles. El codificador lo sabe y elige no guardar cada detalle de los sonidos silenciosos ya que no podemos usarlo de todos modos.

    Y si un sonido cae por debajo de un cierto umbral de volumen donde el oído humano no puede escucharlo, entonces se omite por completo.

    Gestión de velocidad de Bits, Profundidad de Bits y frecuencia de muestreo.

    Y finalmente, aquí es donde se realiza el verdadero trabajo. Una vez que hayas procesado todos los ahorros mencionados anteriormente, aún le quedará un archivo considerable de gran tamaño. Esto se debe a que todos los datos restantes todavía se almacenan con la resolución más alta posible. Así es como los genios detrás de MP3 lo resolvieron.

    En primer lugar, el MP3 es una técnica de compresión de datos con pérdida, por definición, porque bajamos inmediatamente la profundidad de bits del audio de 24 bits o superior a 16 bits. Pérdida se refiere a esta caída en la resolución, pero no tiene que significar una pérdida en la calidad de audio.

    16 bits es una profundidad que tiene mucho margen para proporcionar una alta relación señal / ruido. Significa que cada muestra tiene 16 bits para codificar (usando un 0 o un 1 en binario). Al pasar de 24 bits a 16 bits, ya hemos ahorrado un 25% en tamaño sin una diferencia de calidad apreciable.

    Hablando de cada muestra que tiene 16 bits cada una, ese es otro lugar donde se hacen grandes ahorros. Las velocidades de muestreo pueden llegar hasta 96.000 muestras por segundo. 44.1 kHz es su frecuencia de muestreo típica para MP3 y todavía es una tonelada de muestras por segundo, pero representa una caída del 50% en la cantidad de datos que se almacenan en comparación con las frecuencias de muestreo de 96 kHz.

    Lo básico es que una frecuencia de muestreo más baja captura menos "instantáneas" de cada momento de la música. Puedes pensarlo como una película o un videojuego a 60 cuadros por segundo frente a los típicos 24 fps. 24 es más que suficiente, pero 60 se ve muy bien durante las escenas de acción rápida. Funciona igual para música y frecuencias de muestreo.

    Y finalmente establecemos un límite al rendimiento de datos. Esto tiene en cuenta todo lo mencionado anteriormente y luego establece un límite en la cantidad de datos que puede enviar a la vez. La mayoría de los servicios de transmisión y venta de MP3 utilizan un CBR, que es una velocidad de bits constante, generalmente de 128 kilobytes por segundo.

    Otras opciones comunes son 192 kbps y 320 kbps, que es la más alta disponible en MP3 y tan buena como la calidad de audio sin comprimir. Algunos servicios de transmisión solo enviarán 64 kbps y definitivamente se puede saber. La calidad cae seriamente por debajo de 128 kbps.

    Las velocidades de bits constantes son preferibles para estos servicios y consumidores porque les ayuda a predecir sus necesidades de ancho de banda y almacenamiento. Pero se han realizado avances para uso personal como VBR, que es una velocidad de bits variable.

    Lo que esto hace es permitir una tasa de bits más baja durante las partes silenciosas de las canciones y una tasa de bits más alta en las partes más altas o más complejas de una canción. Esto es preferible para aquellos que prefieren el audio de la más alta calidad, pero aún desean el ahorro de datos de los MP3.

    Paras Cerrar.

    También te puede interesar sobre Cómo Funciona Una Bobina Tesla.

    ¡Y eso es todo! Esa es la explicación más breve y simple de la compresión de MP3 que jamás encontrarás. La próxima vez que uno de tus amigos pregunte "¿Cómo funciona un MP3?" puedes enviarlos aquí o, si puedes recordar estos detalles, explícales tú mismo. Para eso están los amigos.

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    Subir