martes, 22 de septiembre de 2009

¿Por qué 44.1kHz?

A principios de los años 80 surge el audio digital como búsqueda de una mayor calidad (y durabilidad de la misma) frente a los vinilos y cassettes, lo que llevaría al aparecimiento del disco compacto de audio, CD-DA (Compact Disc- Digital Audio). En ese tiempo no había la posibilidad de crear los CD’s como en la actualidad, no había grabadoras domésticas, el CD sólo se fabricaba en empresas dedicadas a ello, donde se masterizaba (no confundir con el pre-master de una pista de audio) el disco.
En ese instante las mayorías de las grabaciones eran totalmente analógicas, se grababan en magnetófonos multipistas, a los cuales debemos mucho en el desarrollo de las grabaciones musicales.

Multipistas Analógico, Tascam.

Cuando un ingeniero terminaba de mezclar los temas que iban a componer el CD, se digitalizaban las pistas, a una determinada frecuencia (sí, son 44.1kHz) y a 16 bits, que supone 2^16= 65536 posibles valores de amplitud para cada muestra). Pero en el momento de digitalizar surgió el problema de cómo transportar el material digitalizado a la fábrica de CD’s, ya que hasta la fecha no había formato digital posible. La solución se encontró en el único soporte capaz de albergar la gran cantidad de datos que tiene un CD de audio. Ya que una señal estéreo de audio muestreado a unos 48kHz, 16 bits más todos los datos de redundancia (Tramas de datos, de Subcódicos, Protección frente a errores, Paridades, etc.) su ancho de banda podía llegar a 1Mhz. El único formato existente analógico que podía almacenar esa ingente cantidad de datos era un grabador de video, cuyo ancho de banda era mayor de 5MHz. El soporte que hacia esta función se denominó R-DAT (Recorder Digital Audio Tape).


Cinta R-DAT.

Un formato de grabación de vídeo, sigue un sistema helicoidal (como el VHS o BetaCam), en donde un tambor va pintando la información en pistas. En PAL un cuadro de vídeo son dos pistas, y dos campos de video es un cuadro (Cada 50Hz la pantallas pinta dos imágenes de líneas entrelazadas que el ojo asimila como una imagen conjunta).

Sistema Helicoidal de grabación de video.

El sistema se adapta a un grabador de video, al formato de video, en Europa, PAL. Que es un sistema que se caracteriza por tener 625 líneas y una velocidad de refresco de 50Hz. Por lo que si la frecuencia de audio debe ser mayor de 40kHz (el criterio de Nyquist establece que debe ser el doble del ancho de banda de la señal base, si es audio ese valor es 20-22kHz):
Líneas útiles por cuadro:625-37(se desechan)=588 líneas útiles por cuadro
Líneas útiles por campo:588/2=294 líneas útiles por campo
fm=294 líneas⁄campo ×50 campos⁄seg×nº muestras audio≥40kHz (mín)
Si nº muestras son 3⇒ fm=44.1kHz
De las 625 líneas disponibles se desechan 37 líneas en donde no es posible almacenar datos, ya que son ocupadas por datos internos del sistema, y como hay dos campos por cuadro de imagen nos quedan un total de 294 líneas disponibles para meter información de audio. Como el ancho de banda o frecuencia máxima debe ser mayor que dos veces el ancho de banda de la señal base (señal audible sólo hasta 20-22kHz), se elige un número de muestras por pista que cumpla este criterio. Así que si se ponen 3 muestras de audio en cada pista, da una frecuencia de muestreo de 44.100Hz.
Por lo que de ahí sale ese valor raro, pero aceptado de frecuencia de muestreo, heredado de la industria del video. Y además se ha comprobado que (con el tiempo) hay problemas para poder pasar a otra frecuencia, como 48kHz o 96kHz, que son más normales en el mundo del audio profesional.
Una vez hecha la R-DAT se llevaba a la fabrica en donde se realizaba el proceso de masterización del CD de Audio, y una vez hechas las copias el usuario final podía comprar su CD.

No hay comentarios:

Publicar un comentario